推 Edster: 不至於這麼慢吧,我常常在讀500~600Mb的檔案,幾秒就結束 09/01 15:04
→ Edster: 大資料可以翻閱20150721 C大發的那幾篇文. 09/01 15:06
→ Edster: 或是試試readr::read_table, 作者也是dplyr的作者. 09/01 15:08
→ Edster: 這個package下的讀檔案非常快. 上禮拜才讀過5G的檔. 09/01 15:10
→ milkdad: 好的 我試試看!感謝回覆 我一開始也覺得不會這麼慢才對 09/01 16:14
→ celestialgod: 瓶頸應該在column class checking... 09/01 16:27
→ celestialgod: 建議全部設定成character,讀進來再依照自己需求做 09/01 16:27
→ celestialgod: 轉換 09/01 16:27
推 celestialgod: 我說的column class可以在read.table的colClasses 09/01 16:31
推 celestialgod: 選項設定 09/01 16:31
→ celestialgod: 我自己測試之後,還是直接讀比較好 09/02 01:22
→ celestialgod: 轉換成本太高 09/02 01:22
→ celestialgod: 除非確定你要直接橫轉直,每一個ROW的元素都同樣類 09/02 01:22
→ celestialgod: 型 09/02 01:22