看板 Statistics 關於我們 聯絡資訊
有一群資料,每個資料點都有(a, b, c, d)等不同的特徵值,都是連續性數值 我想將此群資料做分群,不過a,b,c,d的scale都不同,有的range在1~100,有的1~5 如果在分群時要將a,b,c,d的重要性一致 直接除上range的最大值對嗎?還是有依資料型態做標準化的方法呢 還請板大指教. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.197.14
mrk:Z轉換? 03/18 00:21
hotno:log 03/18 00:59
adu:印象中有一套流程是先用某種方法,之後做常態檢定... 03/18 01:30
adu:跟這個有關係嗎? 03/18 01:30
adu:我了解了:p 謝謝回應~ 03/18 12:04
yhliu:沒有關係吧? 03/18 13:20
yhliu:為做分群時避免因 scale 不同導致重要性失衡, 化成 z-score 03/18 13:21
yhliu:(與常態其實毫不相干!) 可能是一個常用的方法; 或在計算距離 03/18 13:23
yhliu:時採 Mahalanobis distance, 不僅相當於單變數做 z-score 變 03/18 13:25
yhliu:換, 並且考慮了變數間的相關. 03/18 13:25
adu:謝謝老師! 老師提供的訊息對我很重要,現在正好遇到. 03/25 15:16
sneak: 跟這個有關係嗎? http://yofuk.com 01/02 15:04