作者rayray0410 (D-O-DoubleG)
看板Python
標題[問題] ptt 爬出作者跟文章怎麼存進excel裡?
時間Tue Mar 5 17:21:01 2019
練習爬蟲的路上先從ptt 下手
最近遇到的困境是該怎麼把爬到的內容存進excel裡
原本是想說利用list 一個存標題、一個存內文,再用dataframe輸出至excel
但一直存不進去,看著錯誤代碼才想到 爬到的不是string
而是 item 或是 object的東西
以下是簡略的程式碼,標題存進title的list、內文存進article裡
ptt_title = soup.select('span.article-meta-value')
// 標題
title[count] = ptt_title[2].text
content = soup.find(id="main-content").text
// 內文
article[count] = content
count++
但顯然.text 是沒辦法直接存入的! 所以想請教版上的各位
還有甚麼辦法可以存進excel呢??
感謝各位!!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 163.14.44.35
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1551777663.A.3A4.html
→ jiyu520: pandas 03/05 22:21
→ rayray0410: 謝謝!關鍵好像是.text()? 03/05 23:00
推 powerkshs: df.to_excel 03/06 00:47
推 lemon651: 估計是沒轉成text吧 03/06 11:47