→ Kazimir: 如果你的validation accuracy 沒上升那很明顯是寫錯了 03/16 01:59
推 p00o99o: 你先搞清楚這兩種方法的差異 03/16 02:10
推 Kazimir: 仔細想想好像也不一定 你的資料量有多大? class之間 03/16 02:22
→ Kazimir: 有沒有明顯的不平衡問題? 03/16 02:22
X.shape = 57xx, 120, 12
y.shape = 57xx, 3
我有三個class, frequency 大約都33%
推 tsoahans: 一個有shuffle一個沒有 03/16 07:24
我試著用觀測用train_test_split看X_train/X_test
是會shuffle的,假設一開始X_train = [a0, a1, a2, ..., an-1, an]
X_train = [a11, a31, ..., a1, an-9]
但是我用StratifiedKFold
X_train/X_test還是會依照順序
(shuffle設=True/False都沒差..還是我data太小了?)
X_train = [a0, a8, a15 ..., an-6, an]
智商愚鈍還是不懂為何結果會差這麼多...
※ 編輯: kiloxx (59.124.166.19), 03/16/2018 13:21:23
※ 編輯: kiloxx (59.124.166.19), 03/16/2018 14:53:03
推 tsoahans: 你的data可能有照label順序排 所以沒shuffle就會有問題 03/16 15:14
可是我有比較過兩個方法
y_train 跟 y_test class的frequency是跟原始y是一樣的
(每個class都是~33%)
等等晚點來試試看丟進去kfold前先shuffle一次看看
※ 編輯: kiloxx (59.124.166.19), 03/16/2018 18:01:59
※ 編輯: kiloxx (111.243.156.10), 03/16/2018 19:36:51