推 janice001: 。11/04 21:42
推 shuwei12: 推 我也是用python寫 還有搭配mail會通知11/05 01:32
→ shuwei12: 為了抓股版的抄底王XD11/05 01:33
推 goldflower: 話說我每次都在想 不想被放在ptt以外的人可以告嗎XD11/05 01:41
推 Sunal: 樓上是想說智財的重製跟散佈? 11/05 08:41
→ vi000246: 站方本身是不允許這種備份行為的.. 只是抓不到11/05 11:14
推 alan23273850: 如果不允許,那麼fb的出賣表特又該如何解釋呢?11/05 20:47
→ vi000246: 違反站規的事情你做了沒被抓不代表站方默許11/06 12:29
→ vi000246: 可以去看看PttAntiBot這個看板11/06 12:29
→ vi000246: 如果是單個爬蟲就算了 做了分散式爬蟲算是DDOS了11/06 12:30
→ vi000246: 要用法律治你也是可以的11/06 12:30
→ f496328mm: 樓上其實說的沒錯,爬蟲有點遊走在法律邊緣,甚至有些11/06 20:05
→ f496328mm: 網站會擋,程式瀏覽網頁跟人的行為非常不同,不難抓/ 11/06 20:05
→ f496328mm: 擋11/06 20:05
推 bluecadence: 除非要玩文字探勘不然架這個用途想不太出要做什麼,11/07 15:21
→ bluecadence: 不如架一個股票股價相關資訊的資料庫應該會大受歡迎11/07 15:23
→ bluecadence: (純屬個人偏見)11/07 15:24
→ bluecadence: 不過受歡迎後吃掉的頻寬/資源就很可觀了 :p11/07 15:27
→ f496328mm: 我的目的就是text mining、nlp11/07 20:18
→ f496328mm: 目前在當兵,PTT也快抓完了,會再去抓其他data11/08 07:10
※ 編輯: f496328mm (42.78.158.110), 11/10/2017 07:13:55
推 chan15: 你中文都沒遇到問題嗎,我常遇到 cp950,即便對方編碼是 u 11/13 12:11
→ chan15: tf8 11/13 12:11
→ f496328mm: chan,我目前都沒遇到過,爬新聞、雜誌等等都沒遇到 11/13 19:40