看板 Python 關於我們 聯絡資訊
http://0rz.tw/4c4Vp 我用WenChuan寫了一個小程式 用來抓取無名的相簿 這其實還算蠻簡單的 還可以有更複雜很多的應用 有興趣可以參考看看 我也有包成.exe 想抓無名照片的也可以直接使用喔 :P -- 易記學 程式設計教學 http://ez2learn.com/ 易記學 程式設計討論區 http://forum.ez2learn.com VICTOR's 個人Blog http://blog.ez2learn.com/ 財報分析王 http://victorlin.serveftp.org/stock/ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.170.176.176
superGA:程式碼沒看 請問這能應付yahoo 999 error嗎 10/22 23:41
superGA:我對999 error的處理比較有興趣:P 10/22 23:41
StubbornLin:看來不只有我一個人遇到yahoo 999 = = 10/23 00:10
StubbornLin:我沒預料到居然有那種鬼機制 XD 10/23 00:10
StubbornLin:抓了一陣子居然999 我沒研究他判斷999的方式 10/23 00:10
StubbornLin:還有它到底是禁止了什麼 我猜應該是ip 10/23 00:11
StubbornLin:我重新播號換個ip就好了 10/23 00:11
StubbornLin:我覺得應該是抓圖的方式太密集 = = 10/23 00:11
StubbornLin:我想... 如果User-Agent用亂數決定 10/23 00:12
StubbornLin:不知道它會不會認定是不同電腦 10/23 00:12
StubbornLin:但如果只認ip 大概就只能延長抓的間格吧? 10/23 00:12
qrtt1:還能換 proxy XD 10/23 00:26
StubbornLin:喔喔 對厚 XD 10/23 00:36
StubbornLin:那ok阿~ 遇到999就換個proxy 應該就ok吧@@? 10/23 00:37
bizkit:google search 也檔的超嚴格 可以玩玩看:p 10/24 02:26
bizkit:random user-agent, referer, sleep interval都沒啥用 10/24 02:26
bizkit:或許只看ip ~ ~ 10/24 02:26
StubbornLin:google search我沒玩過 不過它那個自動完成我有玩過 10/24 12:45
StubbornLin:我以前有撈過上百萬筆的關聯詞資料 10/24 12:45
StubbornLin:現在可能不行了 我猜應該現在撈沒多久就被鎖了 XD 10/24 12:45
StubbornLin:我先丟一系列常見的單字 然後把它列出來的字詞 10/24 12:55
StubbornLin:全部加進去繼續找關聯字詞 這樣就會越來越多 10/24 12:55
StubbornLin:最後應該是所有字詞都會撈出來 10/24 12:56
bizkit:看來我們在玩的東西很類似 嘿嘿嘿 10/24 18:52
StubbornLin:後來那些關聯詞好像沒有我想像中的有用= = 10/24 21:42
StubbornLin:又或著我沒有更仔細去研究 就沒在玩了= .= 10/24 21:43
bizkit:可以跟你伸data嗎?:p 10/25 21:42