推 vi000246: 什麼叫虛假資料? 感覺是有限制ip請求上限 04/29 22:48
→ aidansky0989: 遇到的問題是1.預計爬20頁資料,實際只爬出2-3頁的 04/29 23:30
→ aidansky0989: 資料量2.約第100筆以後的資料是投毒返回,價格返回 04/29 23:30
→ aidansky0989: 亂數,店家地址只返回第一個字,圖片網址亂碼。前10 04/29 23:30
→ aidansky0989: 0筆搜尋驗證過資料數值都正確 04/29 23:30
→ aidansky0989: 過一段時間再爬又可以爬出約100筆正確資料,推測可 04/29 23:36
→ aidansky0989: 能是cookies時效已過被清除。電腦試過改用代理IP, 04/29 23:36
→ aidansky0989: 換過多個代理IP都無法連線 04/29 23:36
→ wsybu: 有試過設定User-Agent? 04/30 14:05
→ aidansky0989: user-agent有設,放在headers 04/30 17:44
推 pandajohn: 幫推一個 我也好奇後續解法 04/30 22:13
推 s860134: 可以給個網址範例讓大家試試? 05/01 11:58
→ s860134: cookie 會一直變很正常的,因為 response 有 set-cookie 05/01 12:43
→ s860134: requests 模擬瀏覽器行為當然會把 cookie 進行更新 05/01 12:44
→ s860134: 如果你是爬搜尋頁面,他要求 header "referer" 正確 05/01 13:10