作者a12345x (一隻小浣熊)
看板Soft_Job
標題Re: [請益] 大四畢業前機器學習規劃
時間Wed Apr 5 09:19:19 2017
※ 引述《ga6611220 (疥瘡貓)》之銘言:
: 軟體版的前輩先進們,晚安
: 小弟中部私大資管大四生
: 因為對java,app沒興趣,喜歡C,python
: 最近開始嘗試機器學習的領域
: 我是從https://github.com/ChristosChristofidis/awesome-deep-learning
: 這裡選Yoshua Bengio的電子書看
: 讀膩了就看個youtube的分享聽聽高手的理解
: 目前的認知大概落在:
: 機器不知道哪些特徵useful->representation learning->autoencoder
: Deep learning->MLP->模仿生物大腦->ANN...
: 然後開始K基本的線代
: 在這邊想問板上各位先進
: 都是怎麼學習ML的
: 或者願意提供其他的建議
: 我真的很希望有一天可以寫出自己的AI
: 不用叫我念碩,當完兵開始還學貸QQ
同年齡的小弟也有這樣子類似問題
目前在做text miming
做出來的成品不如用ML好
(見過別人做的比我們好太多了)
想要用ML去修正
有去查過資料
但背景知識覺得不夠
理論模組不熟悉
不知如何著手
怕著手是亂用
有open source可以下手嗎?
如果想要了解詳細的作品,可以私訊給我
不好意思
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.136.129.38
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1491355162.A.437.html
→ f496328mm: Kaggle上很多open source04/05 10:20
推 penolove: 從念paper開始吧04/05 11:45
推 fishlinghu: 這感覺超吃理論的啊 一定要看過些書跟paper04/05 13:47
→ DrTech: text mining 太廣泛了。光是 Text Segmentation 你做了嗎?04/05 16:23
用中研院的分詞
自己寫個java做詞頻分析
然後用tf-idf做出全值分析
不夠這樣問題是關鍵字無法抓取到
→ DrTech: 下載一個 Text Segmentation 的Open source,看看理論上04/05 16:23
→ DrTech: HMM 的公式,對照 code 實務上怎麼寫出來的。04/05 16:24
※ 編輯: a12345x (223.136.129.38), 04/05/2017 17:14:11
→ DrTech: 非常好,再來就是關鍵詞,抓法很多,沒有通用解法 04/06 09:25
→ DrTech: 去github 上搜尋 keyword extract 用星星排序 04/06 09:33
→ DrTech: 抓前幾個星星高的程式碼用用看 04/06 09:34
→ DrTech: 實務上,不同的語料,適用的演算法會不同,要多練習 04/06 09:35