不過講k-means....還要先講knn
knn就是....k-nearest-neighborhood
簡單講就是找離你最近的一點....
而k-means就可以知道是找平均點的意思....通常這點會被稱做prototype
那跟分類的關係呢....舉例解釋會比較好懂....
例如今天在xy平面有一百個點....我要分三個群組
所以我先對100點做k-means....找到一個平均點....叫做A
接下來我再拿這一百個點跟A做knn 找出最接近A的三個點 例如是B C D
然後....在把剩下的97個點一個個對B C D做knn
這樣就可以看出....97個點分別是最接近B or C or D 那一個點
就可以把他們分成B C D 三組了....
不過....做到現在一定可以猜到....他們不會分的很開對不對?
所以....要再對B C D 三群組分別做k-means 找出B C D 的prototype
這樣三個prototype 理論上....大概會分的比較開了吧?
然後將這一百個點再對三個prototype做knn.....然後重新分成三組....
這樣就ok啦....
--
再待續....
--
※ 發信站: 批踢踢實業坊(ptt.csie.ntu.edu.tw)
◆ From: u872517.LI.ab.nthu.edu.tw