看板 DataScience 關於我們 聯絡資訊
大家好 小弟入門資料科學不久 目前做過一些實驗在調整參數或更改架構時,通常都只是用notebook或excel做每次 實驗記錄 如果用git 做version control 的話雖然方便版控但不方便比較各次實驗 用excel則方便比較但不方便版控(例如有些次實驗可能有改模組,在excel可能不好記錄(?) 不知道各位大大平常都用什麼樣的軟體做實驗記錄呢? 先謝謝分享了 ----- Sent from JPTT on my Samsung SM-A7050. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.217.85.104 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1590254738.A.C6E.html ※ 編輯: Fordevoted (180.217.85.104 臺灣), 05/24/2020 01:30:06
littleyuan: 可以git commit code寫上excel 的編號 方便你referenc 05/24 11:02
littleyuan: e?? 05/24 11:02
littleyuan: 我自己也在找最好的方法 我是用jira story 紀錄實驗 05/24 11:09
littleyuan: 結果。 git分 主branch dev branch 和一些實驗區branc 05/24 11:09
littleyuan: h 實驗區的branch可以各給邊編號 並且只有比dev區目前 05/24 11:09
littleyuan: 的model好時才會merge到dev區 dev區的完全好了之後 才 05/24 11:09
littleyuan: 會merge到master 05/24 11:09
littleyuan: 也想聽聽其他人做法 05/24 11:09
sxy67230: confluence或hackMD啊,用confluence寫實驗步驟跟上傳Ex 05/24 11:35
sxy67230: cel輸出結果,在附上GitHub 版本號。 05/24 11:35
sxy67230: confluence蠻好用的,可以寫函數跟製作表格跟check list 05/24 11:37
sxy67230: ,日後要實驗或復現也很快。 05/24 11:37
clh960524: 話說最近看到DVC,號稱是給data專用的板控,想問有人 05/24 17:20
clh960524: 用過的心得 https://github.com/iterative/dvc 05/24 17:20
Fordevoted: 感謝各位大大 好多小弟沒聽過的軟體 再來慢慢嘗試自己 05/24 22:40
Fordevoted: 最適合的是哪一個 05/24 22:40
littleyuan: 我confluence也有用 但一般只寫最後的實驗心得 所以只 05/25 11:36
littleyuan: 會記錄最好的幾個model 中間的記錄還是寫在commit裡 05/25 11:36
littleyuan: 面或jira story.... DVC出來幾年了 我自己一直沒用 也 05/25 11:36
littleyuan: 想聽聽使用心得 05/25 11:36
kigo1324: 我自己是使用 Mlflow 的 model tracking. DVC 還是在資 05/30 01:33
kigo1324: 料的版控比較適合 05/30 01:33
kigo1324: Mlflow tracking server 可以不只紀錄這次模型的 parame 05/30 01:41
kigo1324: ters 也可以紀錄 metrics. 中間迭代過程也可以把 Metric 05/30 01:41
kigo1324: s 記錄下來. 模型跟資料也可以存..要重現算是非常的無痛 05/30 01:41
kigo1324: . 05/30 01:41