→ yoyololicon: 有點看不懂你的問題...轉成0/1就是要讓程式對所有的05/18 09:05
→ yoyololicon: 變數一視同仁05/18 09:05
因為我看naive bayes對於類別型跟數值型變數計算機率的方式不一樣,然而數值型計算
需要用到平均數跟標準差,這樣如果把類別轉成0/1不就會以數值型方式計算機率,而非
類別嗎?
不好意思!這問題好像好難解釋QQ
※ 編輯: chienjens (42.72.235.158), 05/18/2018 09:10:42
→ yoyololicon: 我是看不出有甚麼問題 冏05/18 09:35
→ yoyololicon: 我不知道sklearn是怎麼做的 不過通常類別轉成0/1後還05/18 09:35
→ yoyololicon: 還要做smoothing 不然直接算機率好像會有問題05/18 09:35
先感謝y大回答!
因為轉成dummy後,從dataframe看是數值,如果y大說還要做smoothing,那我的問題應該
就是sklearn怎麼判斷這個column是dummy轉的0/1,進而做smoothing呢?
對於程式來說,0/1與其他數值變數不都是數值型嗎@@
※ 編輯: chienjens (42.72.235.158), 05/18/2018 10:28:17
→ yoyololicon: 類別的型別通常是int吧 覺得判斷這個沒什麼難05/18 10:44
→ yoyololicon: 你不用先轉成dummy sklearn都會自動幫你處理惹05/18 10:53
因為類別型的資料(string) fit model就會出現錯誤,所以我是透過pd.get_dummies的方
式轉,轉過後是int沒錯,所以sklearn「有可能」是用int跟float判斷的囉?
※ 編輯: chienjens (42.72.235.158), 05/18/2018 11:16:35
→ yoyololicon: 其實你可以用labelencoder就不用轉one hot了 05/18 13:36