作者vi000246 (Vi)
看板Python
標題[資訊] HTML解析庫 requests-html
時間Thu Mar 15 17:47:07 2018
GithubL:
https://github.com/kennethreitz/requests-html
文件:
http://html.python-requests.org/
剛在github看到 覺得很實用就分享一下
這套件可以用來解析html
支援javascript render
不需要特地用selenium就能取得js渲染過的html
也支援複雜的CSS選擇器與xpath語法
還能自動翻頁,我不知道這怎麼實現的 還滿厲害的
之前都是用xpath搭配正規表達式硬幹
這套件看起來還滿方便的
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.218.40.109
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1521107232.A.FC1.html
→ uranusjr: 自動翻頁就是用猜的, 沒什麼魔法 03/15 18:06
推 HenryLiKing: 有支援JS有點猛欸 為什麼啊?! 03/15 21:42
推 Sunal: 用了pyppeteer 是Puppeteer的非官方py版本 03/15 23:00
→ Sunal: 會下載安裝Chromium~~~ 03/15 23:01
推 gbllggi: 推推 03/15 23:57