作者iSad56 (窩南果)
看板Python
標題[問題] cluster analysis畫圖
時間Wed Apr 18 17:49:35 2018
各位大大安安
小弟在摸索用kmeans聚類 在網路上參考一些範例
import numpy as np
from sklearn.cluster import KMeans
list1 = [88.0,74.0,96.0,85.0]
list2 = [92.0,99.0,95.0,94.0]
list3 = [91.0,87.0,99.0,95.0]
list4 = [78.0,99.0,97.0,81.0]
list5 = [88.0,78.0,98.0,84.0]
list6 = [100.0,95.0,100.0,92.0]
X = np.array([list1,list2,list3,list4,list5,list6])
kmeans = KMeans(n_clusters = 2).fit(X)
pred = kmeans.predict(X)
print(pred)
Output:
[0 1 1 1 0 1]
是成功分出兩群了
但是爬文的過程 看到一些很漂亮的圖 像這樣
https://upload.cc/i1/2018/04/18/pFLHgX.png
完全看不懂這個X軸跟Y軸是怎麼放的
如果以上面的範例來說 應該要怎麼畫出圖呢?
感謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 115.82.201.90
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1524044978.A.5AB.html
推 gloneer: 看著很像用pyplot的scatter畫出來的,不知道感覺有沒有錯 04/18 18:38
→ gloneer: ( ^ω^) 04/18 18:38
→ Mchord: 你的資料是6維的,不好呈現,如果利用PCA之類的先降到2維 04/18 19:05
→ Mchord: 就可以畫 04/18 19:05
→ Mchord: 眼花了…你是6筆4維的 04/18 19:05
請問
參考的"多維度資料視覺化呈現的好夥伴-主成份分析法(PCA)"
下面有個 y_data = np.array(y) # y 為此資料的類別
請問這個"類別"是什麼意思?
推 bestchiao: 用scatter plot然後顏色用你預測出來的label 04/19 09:40
感謝各位
※ 編輯: iSad56 (115.82.201.90), 04/19/2018 14:46:14
→ bestchiao: 文章中的類別 指的就是資料實際的label 共有9個 所以 04/19 15:22
→ bestchiao: 輸出的顏色有9種 04/19 15:22
→ bestchiao: 但注意文章中只有用pca 沒有用到kmeans 04/19 15:24
了解
→ Mchord: kmeans分群完後,再把每筆資料歸屬group的index視做該資 04/19 20:36
→ Mchord: 料的類別 04/19 20:36
我來努力試試 感謝各位
※ 編輯: iSad56 (101.14.165.181), 04/20/2018 10:26:43