看板 Baseball 關於我們 聯絡資訊
這位同學你好 聽完你的報告小弟有幾個看法 要做分類器。應該要先研究pattern 的特性。 我自己覺得用linear 的分類對棒球特性分類比較不fit 分類器的選擇可以考慮用非線性的方式做 盲不盲其實是一個感覺的形容詞 要做到量化。就變成相對來說閥值的訂立各唱各的調 再加上量化指標只有兩個。我覺得是比較少一點 我比較喜歡用cluster label的方式 設計步驟如下 投票表決這個人屬於那種類別--->多數決之後。選擇代表性的數據做為pattern feature --->挑選分類器進行分類 我前陣子用多層感知器(Multilayer Perceptron,縮寫MLP) 做分群 訓練的樣本是這些人 https://images.plurk.com/5g9IvAaum78R62KBehsp.jpg
得到的結果是 https://drive.google.com/file/d/0Byal-dX83gEMbzV5VWY5bXZNWUk/view 可以參考看看 同時間也有用svm做。效果比較差 之前想要用sony最近出的deep learning console 來做分類 結果效果不是很好,因為我對deep learning 不熟orz 可能還是要回歸到要先去挑模型與feature 要挑比較好 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.96.168.2 ※ 文章網址: https://www.ptt.cc/bbs/Baseball/M.1505182116.A.D20.html
hipocritos: 在炫耀技巧前先學會做簡報 謝謝 09/12 10:16
kimi6701: 站內信是一個很棒的東西 09/12 10:19
a129517496: 先推 我覺得前兩樓看不懂急著噓 09/12 10:20
kevininla: 錯字讓我看的很痛苦… 09/12 10:21
kevininla: 能中英都錯也不簡單… 09/12 10:21
xd 上班偷打的,英文不是很好,我改一下xddddd
gil729181: 這裡只想聽 哪隊打擊最廢 & 哪個教練最不會挑人 END 09/12 10:21
starchiang: 我覺得還ok,一二樓是??? 09/12 10:21
starchiang: 棒球版連線化很久了,不意外 09/12 10:23
hybridpi: 我會機器學習跟分類原理啊 但是我會想推原po不想推這篇 09/12 10:23
你好。我們家最近在找人做這塊 有沒有興趣投resume XD
chmod777: dick learning 09/12 10:23
max0928895: 馬克吳做這個做很久惹~上次就發表過,怎麼這次就被噓XD 09/12 10:24
Reptiler: 原來馬克也會出現在棒球板XD 09/12 10:25
nh60211as: 結果你還是啥鬼都分類不出來嗎 09/12 10:25
deep learning 那一個還沒做出來 努力中
tkucuh: markwu上次就做一個分類表出來了嗎?? 09/12 10:27
tkucuh: 真的,上次一堆推,這次看不懂就噓了一堆。 09/12 10:29
nh60211as: 加油 09/12 10:29
※ 編輯: markwu123 (140.96.168.2), 09/12/2017 10:30:11 ※ 編輯: markwu123 (140.96.168.2), 09/12/2017 10:35:22
hybridpi: 怎麼不說上次是一堆人不懂才推的? 09/12 10:38
可以指教一下模型的問題嗎? 我卡關一陣子了
banco: deep learning理論上就是多層MLP, 但數據太少用DL要進行 09/12 10:41
banco: regularization... 09/12 10:42
banco: 有沒有試過unsupervised learning進行打者分群 09/12 10:43
markwu123: 有考慮要用 非監督式的方式做。可能會用SOM 09/12 10:46
markwu123: 不過用的工具沒有SOM。要自己code 要花時間改一下 09/12 10:46
markwu123: 另外在想要不要先投影到二維空間視覺化觀察樣本特性 09/12 10:47
※ 編輯: markwu123 (140.96.168.2), 09/12/2017 10:48:30
greengreen42: 會推首篇文的人sabermetrics的水平低到讓人發笑 09/12 10:49
pounil: 獅迷出現在棒球版很奇怪嗎?? 09/12 11:01
banco: 應該說deep learning目前較成熟的模型是採用MLP架構才對 :~ 09/12 11:09
banco: 降維的視覺化可以先用最近較紅的t-SNE試試, 但要注意這些 09/12 11:11
banco: 降維視覺化工具的背後理論, 低維距離未必保有高維距離關係 09/12 11:14
markwu123: 是的。低維資訊失真不一定可以代表。但是就只是觀察 09/12 11:15
markwu123: 老實說做這種東西找有代表的數據和挑模型就搞死我了ORZ 09/12 11:16
banco: 像t-SNE是保點和點之間的機率, 不保歐氏距離 09/12 11:17
banco: "找有代表的數據和挑模型" 這是機器學習的宿命.逃不掉的:p 09/12 11:19
alcpeon911: 我再看Machine learning 版? 09/12 12:13
trylin: 連直接拿守備機會除場數的都能說一個長篇大論了 09/12 13:41
trylin: 那篇廢文被推爆不是很正常嗎 XD 09/12 13:42
ShaShoukun: 這種東西我覺得還可以啦,趣味性居多就是 09/12 13:53
ShaShoukun: 當然有些人看到有數字有圖表就覺得好像是有意義的分析 09/12 13:54
ShaShoukun: 當然就.......XD 09/12 13:54
airai: 一二樓真的好嚴格! 09/12 15:04