推 st1009: DataScience板會是你的好朋友^^ 02/19 18:56
推 jiyu520: 可以看看kaggle的幾個學習案例噢~ 02/19 19:22
推 jasonfghx: test 沒Y 那是要你自己預測出答案? 02/19 19:43
是 我知道是自己預測出答案上傳
不過我好奇的是
test的特徵跟train的特徵要不要一起處理
如果一起處理跟分開處理的話
我填空缺值的結果會不一樣
推 Raymond0710: train & test data 做同樣的預處理呀 02/19 21:45
→ Raymond0710: 你指的一起和分開是什麼意思 02/19 21:46
如果下面os大大說的 算平均值會有差
推 OnePiecePR: 0~1 問題就變成regression要換 麻豆,但是找找,應該 02/19 22:39
→ OnePiecePR: 有 predition的possibility輸出。 02/19 22:39
→ OnePiecePR: 不過你會這樣問應該是回歸跟分類的意義還要多看紮實一 02/19 22:40
→ OnePiecePR: 點比較好 02/19 22:40
→ OnePiecePR: test 跟 train 的特徵要一起處理,用 pd.concat 串 02/19 22:41
推 OnePiecePR: 啊,你有找到predict_proba,我多嘴了 02/19 22:47
是的 我目前是用concat
不過我其實不太確定要不要concat會比較好
然後我用了predict_proba
但我其實也不知道這是不是正規的做法
→ Luluemiko: 為何填空缺值的結果會不同? 02/20 00:01
推 os653: 例如你拿該特徵的平均值填缺值,有沒有test算出來當然有差 02/20 04:01
推 karco: 標準化時 02/20 10:19
→ karco: 對訓練資料用fit_transform 02/20 10:19
→ karco: 測試資料用transform 02/20 10:19
→ karco: 這樣測試資料就會套用訓練資料標準化時所用的參數,這樣應 02/20 10:19
→ karco: 該可以一致 02/20 10:19
喔 好喔 我再去研究你的意思 謝謝!
※ 編輯: wavek (36.224.114.48), 02/25/2019 23:19:09