看板 Python 關於我們 聯絡資訊
各位大大好,新手想在此請教一下,若想學習網路爬蟲,有哪些先備知識要先會呢? 也想知道,應該學多深 (像是我知道好像要先學HTML和CSS,不過不清楚應該學到哪個程度,javascript亦然) 謝謝各位大大~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.83.22.152 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1507307029.A.F35.html
neil987: 學會看youtube跟google查東西 10/07 12:04
lizkarina: 首先網路連線要懂一點,tcp/ip, udp. 怎麼用socket. 10/07 13:10
lizkarina: tls/ssl. http protocol(get,post...)/headers/cookies 10/07 13:13
lizkarina: http status code. https(http over tls). 如果要取的 10/07 13:14
lizkarina: 資料用javascript生成,你就需要web driver. 10/07 13:15
lizkarina: #webdriver. 再來看你取的資料是html,json,圖片,影像 10/07 13:17
lizkarina: 或是音樂,再學相對應的知識。 10/07 13:18
jamesxxx1997: 謝謝neil大的解答,收穫良多~ 10/07 18:09
jamesxxx1997: 好的,謝謝l大,你的意思是說其實這是一個很廣泛 10/07 18:09
jamesxxx1997: 的東西對吧,那我就先照你說的,學西一些網路連線 10/07 18:10
jamesxxx1997: 的概念,感謝~ 10/07 18:11
sean50301: 稍微了解一下css跟xpath就可以爬簡單的網頁了 10/07 18:35
areyo: 大數學堂 10/07 19:16
f496328mm: https://goo.gl/V41YL2 10/08 06:37
f496328mm: 學爬蟲 推薦這串影片 講得蠻好的 10/08 06:38
goldflower: 大數學堂無敵 真的 10/08 16:07
goldflower: 應該不會看到比這邊還詳細的影片了 10/08 16:08
vi000246: 正規表達式也可以學一下 會方便很多 10/08 16:24
f496328mm: 正規可以說是必備 10/09 00:34
jamesxxx1997: 恩恩,現在正在學正規表達式(re模組) 10/09 13:17
jamesxxx1997: 謝謝各位的指導XDD 10/09 13:17
mantour: 先找一個你想爬的網站,然後用到什麼學什麼 10/20 20:27
jamesxxx1997: 想要爬CDC網站的圖片及文章 11/14 16:14