看板 PHP 關於我們 聯絡資訊
請問一下 我想要把一個網站裡面的所有資訊拿下來到資料庫裡面 我要怎麼開始呢? google 過有很多 github 的 source code 但由於是初學者,想要自己造輪子 我的構思大概是這樣 1 用 curl 去拿到 sourcecode 2 用 php 去分析內容 (regular expression or xpath or .... ?) 3 存入db 目前卡在2 的選型上面, 想請教版上的大大們 哪種方式比較好呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.75.186.160 ※ 文章網址: https://www.ptt.cc/bbs/PHP/M.1499911694.A.89A.html
MOONRAKER: 以2而言,弄一個HTML parser應該比較方便 07/13 10:30
shadowjohn: 2 有 simplehtmldom、phpquery 可以用,re稍累 07/13 11:04
shadowjohn: 簡單的用getBetween就好了,php manual滿多人分享 07/13 11:06