看板 java 關於我們 聯絡資訊
比較結構化的東西大概就是 VT100之類的控制碼, 剩下的就是RegExp去撈版面位置、文章位置了吧 或者去爬BBS站台提供的網頁版、 RSS, 也許處理起來會比較方便,但是更新速度就不確定了 ※ 引述《fengying (Kiss me now!)》之銘言: : 各位先進好, : 若我今天想寫一支爬telnet、BBS的程式,例如像批踢踢, : 除了透過socket programming做InputStream, OutputStream, : 來字串判斷外,是否有其他solution? : thanks in advance. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 180.217.177.72
fengying:感謝分享!昨天晚上又試了commons提供的net library 03/26 09:28
fengying:但目前爬批踢踢似乎是違反版規的行為,就先暫停了XD 03/26 09:40