作者beyondMPE (MPE/MWE)
看板NTUEE_Speech
標題[把妹] 專題生問的問題
時間Sun Dec 6 10:22:40 2009
助教您好:
我是這學期修李琳山教授專題的學生沙政亞,由於助教之前帶過我們第一階段的專題
其中有使用到yahoo奇摩新聞來當language model的training data,
想請問一下助教是怎麼抓這些新聞的呢?
是一筆一筆的複製貼上,還是寫一個程式讓它自動抓取
如果是寫程式的話,可以請問大概是怎麼寫的嗎
謝謝
----------------------------------------------------
以上是專題生問的問題,
有誰可以幫我回答一下嗎?
感激不盡
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.42.161.213
推 anguso:是用程式抓的. 而且也沒啥了不起,就是抓 RSS 格式比較乾淨 12/06 10:57
→ anguso:一開始抓網頁的時候被那個格式搞到要死掉了 12/06 10:57
推 hahaha222:謝謝,我把您的信箱給了專題生,這樣他們可以直接問您 12/06 17:50
推 Lgsun:樓上皮球踢得真快呀 12/06 22:03
推 silverblade:誰來把 Lgsun 浸水桶? 拜託 12/07 12:19
推 hahaha222:工作站又可以用了 ^_^ 12/07 22:24