看板 Python 關於我們 聯絡資訊
大家好 目前我寫的 midjourney 爬蟲遇到問題,想請教一下如何解決 環境是租來的 vps (主機在美國) os 是 ubuntu 22.04 爬取的步驟是先透過 get 程式如下 https://gist.github.com/HankChangGSS/8e45d1e2b836923c30118e762a59f530 透過上述回傳的 html 拆解出 form id="challenge-form" 其中的 action 位置 以及 input 發出請求的程式如下 https://gist.github.com/HankChangGSS/c0732ba1e85e8ed3c5e86af2389b1fed 但是此段程式的回傳不符預期 我期望得到的回傳是能夠像人工開啟瀏覽器,訪問 https://www.midjourney.com/showcase/recent/ 其中會有回傳以下區段 <script id="__NEXT_DATA__" type="application/json"> 以便後續能剖析 json 裡面的資料 但目前用程式來發送請求,不知程式的寫法哪裡有問題, 導致 server 回傳上述的 json 資料? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.245.121.125 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1688736680.A.0B8.html
aalexx: “上述的json資料”忘記附? 07/08 07:02