※ 引述《deduce.bbs@ptt.cc ()》之銘言:
: 技術上當然是不成問題的
: 然而上述內容應該僅限於各轉信板吧?
: 再者,目前ptt轉信幾乎(?)都透過group.nctu.edu.tw
: 所以也要該group的負責站台/負責人同意才有辦法抓信
如果你願意當一個壞人, 其實你只要到 twbbs 申請一個 bbsname ,
並把 ip 直接指到你所管理或擁有固定 ip 的機器, 那就 :a
當然了, group 負責人找不到閣下的 bbs , 那就呵呵呵... 被拆穿了.
: 我想到比較可行的方式,是寫一支程式定時到http://webbbs.ptt.cc/
: 抓取想要的版面的文章
: 整理到自己的電腦 or server上
其實我想說, 這樣子是重覆了各大 search engine 的 caching 工作.
最慘的是, 明明在 web 上被扯, 還要扯完一次又一次, 負荷就不少.
我覺得, 該找個機會找那些自命 cache 大得像個黑洞的 search 大頭目,
叫他們另外設個 Machine to Server Interface, feed 一次由他們代理
分發好了.
每次翻 log , 看到一大堆 bot 在橫衝直撞, 我就有點發毛. 就是想濾走
bots, 也不是一件輕鬆的事.
: 如果說 ptt 全面支援RSS feed 上述問題 就輕而易舉地解決了XDDD
所見略同, 提過幾次了.
--
※ 發信站: 香港地(hkday.net)
◆ From: 61.238.143.229