推 andrew43: 非常不恰當,建議還是轉factor。 08/27 18:20
→ yun611: 請問一下轉factor之後,有哪些方法可以用來 08/27 18:46
→ yun611: variable selection的嗎?大多數找到都是continuous情況的 08/27 18:47
→ yun611: 有查過group lasso但是一直做不出來..... 08/27 18:47
→ yun611: 或是說在有dummy的情況下,有沒有什麼選擇變量的原則? 08/27 19:15
→ andrew43: 我不熟lasso,但建議你先給一段具體的程式碼請再大家修 08/27 20:34
→ andrew43: 至少要知道你用什麼function之類的,不然難回應。 08/27 20:34
→ Wush978: continuous的變數在處理時常常假設 1與2的差距和2與3相同 08/30 00:45
→ Wush978: 所以以race為例,如果你設定為continuous很容易處理時出 08/30 00:45
→ Wush978: 問題 08/30 00:45
→ Wush978: factor的缺點在資料量不夠時,會有模型不穩定的問題 08/30 00:46
→ Wush978: 但是通常作法是小類合併成大類,而非轉成continuous 08/30 00:46
→ Wush978: 你必須要確保我剛剛講的假設是正確的,才用continuous處 08/30 00:46
推 Wush978: 理會比較好 08/30 00:46