看板 R_Language 關於我們 聯絡資訊
※ [本文轉錄自 Statistics 看板 #1QdHGr4X ] 作者: paranoia5201 (社會黑暗、行路難) 看板: Statistics 標題: [問題] 不乾淨的資料匯入、如何處理? 時間: Mon Mar 5 17:56:03 2018 各位好: 這裡想要請教、如果拿到的原始檔不是很漂亮、該要怎麼匯入處理? 我直接面對的例子是死因統計年報(下載:dep.mohw.gov.tw/DOS/lp-3352-113.html) 打開檔案後會發現它每個分頁的頭幾列都是各式主標題與子標題。 我該如何處理這部分、好讓它可以在匯入之後做運算整理呢? 感謝~ (預計使用的軟體為R、Python、還有SAS) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.117.132 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1520243765.A.121.html ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: paranoia5201 (140.112.117.132), 03/05/2018 17:56:35
celestialgod: readxl::read_excel會幫你讀成table格式 03/05 18:44
andrew43: 處理試算表的package大多可以按分頁讀入 03/05 18:52
andrew43: 讀入後就是各別對付了,没什麼法門。 03/05 18:54
seimwiwa: 衛福部有全死因檔從那個資料再整理出來比較快(吧) 03/06 23:25
wayturn: 想問R有套件能處理主副標嗎?還是只能手動處理excel再匯入 03/07 12:25
andrew43: 讀入的function常有前幾列不讀的參數,可幫點忙 03/07 19:22