作者tofuflower (無)
看板Programming
標題[問題] 抓網路部落格文章
時間Mon Oct 13 04:42:36 2008
※ [本文轉錄自 C_Sharp 看板]
作者: tofuflower (無) 看板: C_Sharp
標題: [問題] 抓網路部落格文章
時間: Mon Oct 13 00:15:02 2008
目前我需要時做個系統
系統在使用者輸入以後要及時從網路部落個抓數篇文章內容做分析
(就是跟自然語言處理相關的)
目前用Visual Studio 2008的C#裡面的webbrowser抓
可是抓的速度實在是不太能接受 囧
不知道有沒有更快方法可以從網路上抓文章的?
如果是能快速抓BBS的文章也可以
有那位版友友推薦的書可以看的嗎@@"?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.241.230
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.241.230
推 march20:如果 bottleneck 是網路就沒救了 71.136.234.193 10/13 06:37
推 march20:不然可以開多個 thread 同時抓 71.136.234.193 10/13 06:38
→ TonyQ:你是想多快 -.-a220.128.219.202 10/13 10:49
推 Deap:用wget抓網頁下來自己parser 這樣算嗎? 118.169.74.85 10/16 00:24
→ harry2258:vb.net htmlrequest 203.68.127.1 04/08 06:40