→ Mchord: onehot只有一個是1, 照你敘述維度就是800多吧, 怕黏在一起 09/02 22:01
→ Mchord: 可以試t-SNE 09/02 22:01
推 germun: Hamming distance 09/03 00:02
→ germun: 不過binary data用Bernoulli Mixture model可能比較好 09/03 00:07
→ germun: k-means需要算center, 對binary data的確怪怪的 09/03 00:07
→ bestchiao: 幾萬個用戶 用tsne會運算頗久 09/03 04:17
推 whsunset: 也許可以試試把顏色當成詞袋,用類似 topic modeling 的 09/03 11:06
→ whsunset: 方法來做 clustering? 09/03 11:06
推 littleyuan: 用support vector clustering呢? 09/03 13:38
→ simplee: 謝謝關鍵字提供! 我來研究看看 09/03 14:48
推 a78998042a: Shannon's diversity index 09/04 01:38
推 Etern: t-SNE 09/04 01:56