看板 Statistics 關於我們 聯絡資訊
PCA 用 correlation or covariance比較 基本上我有爬文,也知道他是如何運算的 可以知道當尺度相同的時候用covariance所丟失的訊息量會最少 我的尺度相同故我先用covariance 計算得到的結果可以發現的確3個軸加起來約90% 這時候發現這些資料依照’’地區’’來區分可以明顯的分群 但如果依照種類卻結果並不是很好 接著我也做了correlation 發現資料丟失量的確滿多的 前三個加起來能解釋約66% 也很神奇地發現 使用correlation的方式可以依照’’種類’’來區隔開 想問一下各位 這樣可以兩種資料都用來討論嗎?? 因為covariance可以漂亮的分出’’地區’’無法分出’’種類’’ 但是相反correlation可以漂亮的分出’’種類’’,卻無法分出’’地區’’ https://i.imgur.com/r7H2zFX.jpg 左上-correlation-地區 右上-covariance-地區(good) 左下-correlation-種類(good) 右下-covariance-種類 還有如果兩個都可以解釋的話,會造成這麼剛好也是有可能的嗎?? 會造成這樣的原因是因為?? 有點想不透 要怎麼跟人解釋資料量變少反而有一個可以變很漂亮… -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.1.213 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1520259993.A.E85.html
andrew43: 圖的角度都不一樣,也看不出實際投影在三軸上的位置。 03/06 01:44
andrew43: 我會先猜測所謂漂亮也只是你看起來覺得漂亮。 03/06 01:45
andrew43: 也可以關心二者主要差別在哪些變數的loading 03/06 01:57
FrederickLiu: Andrew大大您說的沒錯,是看起來漂亮,至於角度我 03/06 10:56
FrederickLiu: 把他轉到我覺得看起來比較漂亮的哈哈 03/06 10:56
FrederickLiu: 關心兩者變數的loading我會去看的,感謝! 03/06 10:57
andrew43: 把三維圖轉轉多看幾眼,或是直接拿PCA分數做clustering 03/06 11:27
andrew43: 應該就可以辨別是不是真的按某個類別分開 03/06 11:28
LiamIssac: 分群有很多方法 SVM也是可以 而且更清楚 03/06 13:22