看板 Python 關於我們 聯絡資訊
code https://pastebin.com/7nj8i6RD 如下: import requests import sys import re from bs4 import BeautifulSoup import pandas import lxml Juridical_person = "http://www.taifex.com.tw/cht/3/futContractsDateExcel" df = pandas.read_html(Juridical_person) print(df[1]) pandas讀進來之後,print出來發現表格歪掉了 可能是前兩欄有些儲存格合併的關係 我該怎麼呈現和網頁一樣的效果呢? 我應該在讀進來之前就先對html作處理 還是讀進來之後再對df作表格的排版 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.39.16.239 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1542681935.A.2B9.html
jiyu520: 或許用BeautifulSoup抓回table後, 再做清理解析比較好 11/20 16:13
感謝回覆 我相信不論pandas讀進來之前還是之後作處理應該都能解決 礙於新手對語法不熟,兩種方法都不知該如何具體的寫出code 經過下午在網上翻閱文章終於解決,在此使用的方法為後者 將print(df[1])那一行 改為下列兩行 df[1][13:15] = df[1][13:15].shift(2,None,'columns') print(df[1].loc[12:14,9:14]) 程式碼如下 https://pastecode.xyz/view/157bc1ba ※ 編輯: WhiteComet (114.39.16.239), 11/20/2018 19:48:58