看板 Trading 關於我們 聯絡資訊
我想有很多人對計算機科學根本就不了解 最近有很多文章在談什麼參數不參數 最佳化不最佳化的 讓人看了很無力 如何避免data overfitting 在machine learning裡來說 根本就是基本中的基本 建議自己去翻書或是去資訊系上課 ※ 引述《tedinroc (真愛)》之銘言: : 喔...了解您的意思了:) : 那我前述的步驟應該改成: : 1.先從前四年資料做參數最佳化,並選出數組適合的參數。 : 2.將這幾組挑選出的參數一一跑最後兩年的資料(只是跑出績效表做比較,不做最佳化) 不 選一組最好的參數即可 如果這組參數在最後兩年跑出來的結果很差 就代表你應該換方法而不是調參數 除了以前四年的資料測後兩年的資料以外 應該還要多測幾組 以資料分成123456年來說 至少還要以3456年的資料測12年的資料 以1256年的資料測34年的資料 諸如此類 只要有哪個結果不好 就代表你的方法有問題 : 3.把不夠穩定的參數除去,選出表現較佳的參數 : 4.最後選出之參數就為未來之固定參數 : 第二步單純只跑出績效表來比較數組參數間的績效呈現 : 小弟個人的思考是把數組挑選過的參數,去跑最後兩年的資料 : 等於是把這幾組參數都投入實戰,然後依各自的表現穩定度(與過去績效之差異度)選擇 : 這樣的步驟會不會仍然有過度最佳化的偏差呢^^? : 會不會仍然變成是人工的最佳化@@? : 另外想請問您,在最佳化的過程中若是各種參數組合都不至於讓績效看起來太糟 : 是否能代表該程式在根本的邏輯上是正確的呢^^? 等你賺錢 才是正確 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.31.182