作者murmurer (呢喃)
看板Programming
標題[問題] Clustering前的Normalize
時間Sat Jan 10 20:17:19 2015
這算是 machine learning 的問題
不知道該到哪發問故來此~
我對資料做clustering
事前要做normlize
我有疑問的是normalize的部分
舉例
現在我有六組data
分別是
第一次實驗 感冒後 黃人(10人) 白人(10人) 黑人(10人) 的體溫(度C)
第二次實驗 感冒後 黃人(10人) 白人(10人) 黑人(10人) 的體溫(度C)
我現在想要用兩次實驗得到的體溫
將這三個人種分群(clustering)
在做分群前必須先將資料normalize
但我就不太懂這邊normalize的意義在哪裡...
而且又要如何normalize呢?
(我們當然可算出這三組data的各別平均和標準差)
可能我這例子不是很好
但我是卡在為什麼要做normalize這邊
還請高手講解觀念
謝謝各位 :)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.94.64
※ 文章網址: http://www.ptt.cc/bbs/Programming/M.1420892241.A.0D9.html
※ 編輯: murmurer (140.112.94.64), 01/10/2015 20:21:18
→ fireslayer: 兩次實驗的差異? 可能早上測量或晚上140.113.178.253 01/10 23:13
→ fireslayer: 測量的差異 normalize可以把每次實驗140.113.178.253 01/10 23:13
→ fireslayer: 的誤差去掉 把人種的相對位置萃取出來140.113.178.253 01/10 23:14
→ n3oanderson: Feature_scaling 111.243.108.15 01/11 00:03