作者f496328mm (為什麼會流淚)
看板Soft_Job
標題Re: [請益] 非cs想走ai領域,投履歷沒公司理
時間Wed Mar 15 23:41:15 2017
既然上一篇大大講到 kaggle 和 deep learning
那我也來分享一些我目前的成果 給有興趣的朋友一個方向
我也還在努力中 談不上很厲害
----------------------------------------------------
我目前是 應數所碩班生 kaggle兩個問題有 top10% 的 rank
http://linsam.esy.es/ 流量爆了
改換這個
https://github.com/f496328mm 直接連到github上
上面是個人網站 我把兩個問題的code都放在github上 (可能會有BUG)
都是有獎金的比賽 其中一個data 7千萬筆, 3GB
玩這些很吃電腦設備 我目前 32GB RAM ( 很不夠T.T )
主要用到ML中的 XGBoost 這算是目前很厲害的ML方法
不過這都是一些基礎的ML發展來的
所以對於 RF SVM adaboost boosting 也要有一些了解
------------------------------------------------------
deep learning 部分
去買張顯卡 灌 linux 並且熟悉它 ( 顯卡超噴錢 )
因為要玩GPU 只好拿顯卡玩 我是GTX-1070
然後搭配這篇
https://cos.name/2016/04/mxnet-r/
我看這篇去弄出 kaggle 中的 手寫字辨認 by deep learing
99%正確率
這是我學習的過程, linux 對數學系學生來說 有點困難就是了
我目前是用 R 的 mxnet 還在研究 googlenet 跟微軟的resnet
python目前在deep learning這塊比較強 有google官方支援套件
------------------------------------------------------
我網頁中下面兩個問題正在研究
圖片分類部分
https://github.com/dmlc/mxnet/tree/master/example/image-classification
這裡有很多別人寫好的 net 我還在讀 有些真的很吃電腦效能
ram不夠直接死 特別是圖片維度高 ram很容易不夠 T.T
上面講的xgboost跟deep learning 都有相關paper可以參考
大致上就是這樣
如果有問題歡迎討論 我只是個小小初學者 還有好多東西要學
設備部分真的很噴錢 不過KAGGLE還不錯 是個累積作品的好地方
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.137.175.169
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1489592480.A.4D6.html
推 sttagomantis: 推分享 03/15 23:53
→ sttagomantis: 我之前用GPU都上AWS燒錢 不過現在好像GCP比較好了 03/15 23:53
推 drajan: 有些公司會看kaggle的成績 可以多少豐富履歷 03/15 23:53
推 ccfux: 推推 另外建議沒設備的人 可直接玩pre-trained model 03/16 00:51
→ ccfux: 沒gpu要跑一陣子 但至少可以跑forward 體驗一下什麼叫 03/16 00:53
→ ccfux: deep learning 沒有gpu還是可以用別人train的model做點事情 03/16 00:54
→ s860134: 還是當個調包狗比較愉快X, 你 train 完的 model 我來用XD 03/16 01:08
推 ccfux: 北極熊都快餓死了 愛護地球 請多用pre-trained model 03/16 01:14
→ pttworld: 1070應該有玩game 03/16 08:37
→ fantasydavid: 前10%算很厲害吧!請問kaggle上的id是? 03/16 10:10
我是先玩過期的比賽 還沒正式打真正的比賽
我是看 kaggle 給我的 score 來算 rank 的
kaggle的好處是 過期的一樣可以提交結果 所以可以練習各種問題
推 a8084123: 推 03/16 11:02
推 Ekmund: 對了 ram又漲了 (拍 03/16 11:06
推 HenryLiKing: ram漲價QAQ 03/16 12:18
推 tsoahans: lightGBM 聽說效能和xgboost差不多但更省記憶體 可以去 03/16 13:26
→ tsoahans: 試試看 03/16 13:26
推 penolove: 參加個真實比賽吧, 不然很難說服人 03/16 13:27
推 sttagomantis: LightGMB+1 記憶體優化和速度方面很猛 03/16 13:49
→ gozule: 順便問一下,有人在做RL於金融投資的應用嗎? 想找同好討論 03/16 15:17
推 HowLeeHi: 可以租VPS來跑嗎?這樣就不用怕ram不夠 03/17 01:18
→ viper9709: 感謝分享 03/18 00:12
網站流量爆了 直接貼上github
※ 編輯: f496328mm (114.42.99.196), 03/18/2017 03:54:43