→ locka: 你的程式碼跟rvest沒關係啊…沒反應的話至少也貼上你的程式07/20 23:22
→ locka: 碼讓大家知道你卡在哪裡…07/20 23:22
→ locka: 有的時候爬不下來可能因為表格內容是動態產生的,如果對於h07/20 23:25
→ locka: tml觀念不熟的話,或許可以使用rselenium套件試看看07/20 23:25
→ asdfrtg: 感謝l大提點07/21 00:09
→ asdfrtg: 不過是想讓這段程式碼可以變成爬蟲到表格一條龍能夠解決.07/21 00:11
→ asdfrtg: ..所以才提出效能諮詢@@07/21 00:11
→ locka: 我剛剛試了一下你貼的網址,的確沒有那麼好爬,我再研究一07/21 00:29
→ locka: 下。是說你的d1長什麼樣子啊?看起來你現在是貼到csv然後再07/21 00:29
→ locka: 讀取,既然要這樣為什麼不貼上的時候就整理好?07/21 00:29
回l大就是會變成整個是一欄
但必須要做成六欄多列
做到有些崩潰就上來板上想請教有沒有更加快速的方法...
→ andrew43: 其實只是抓每個cell再排到matrix裡而已07/21 00:56
感謝a大的幫忙...orz,
另外想請問兩位大大 若爬蟲的話
通常會使用哪個套件那個函數
※ 編輯: asdfrtg (49.216.124.179 臺灣), 07/21/2020 01:22:50
推 locka: 其實爬蟲就是把網頁上你按右鍵查看原始碼的東西抓下來,所 07/21 13:20
推 locka: 以read_html()會需要,然後重點是要會解析標籤,我個人常用 07/21 13:20
推 locka: xml_find_all()取出想要的內容,以上都是rvest/xml2套件 07/21 13:20
是用selectogadget嗎?
※ 編輯: asdfrtg (49.216.124.179 臺灣), 07/21/2020 13:55:32
推 locka: 看了一下,selecttogadget是幫助你解析網頁元素的xpath,這 07/21 14:19
推 locka: 部分相同功能的東西chrome擴充應用程式商店很多,挑習慣的 07/21 14:19
推 locka: 用就好。 07/21 14:19
→ locka: 更正:SelectorGadget 07/21 14:25
→ andrew43: 推locka,最常用就是rvest或xml2。 07/21 15:23