看板 Statistics 關於我們 聯絡資訊
如果是跟統計軟體有關請重發文章 如果跟論文有關也煩請您重發文章 文章類別是為了幫助大家搜尋資料與解答,造成不便之處請見諒 最近我在分析一筆龐大資料,但因為檔案是別的地方得來。 目前格式有PDF 以及 TXT 黨。 但由於TXT黨格式很亂,我放棄了,轉戰PDF黨。 但PDF 在轉檔時以為格式應該會很整齊,最終還是失敗了。 轉檔方式,我用專業版的 Adobe 令存新黨轉 TXT黨。 有時很整齊如下: 傳票編號 魚號 魚 名 承 銷 人 箱數 尾數 籠 重量 單價 金額 D019984 2261 A 050 0 0 76.0 220.0 16,720 D019985 2261 A 050 0 0 237.0 160.0 37,920 D019986 4071 B 050 0 0 73.0 190.0 13,870 D019987 4091 C 050 0 0 276.0 100.0 27,600 但有時為, 傳票編號 魚號 魚 名 承 銷 人 箱數 尾數 籠 重量 單價 金額 D015860 D015861 D015862 214121652562 土魠 軟舌 什魚 071 071 071 0 0 0 0 0 0 150.0 30.0 20.0 230.0 150.0 45.0 34,500 4,500 900 表格為一整行。 令我很困擾,不知道有沒有強者可以提供建議讓PDF檔資料轉換較為整齊。 由於檔案有12份,且一份檔案都是10幾萬筆資料,手動調整有些困難。 謝謝!! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.117.96.182
gsuper:latex? 11/01 19:04
andrew43:我猜用txt檔加上正規表示式還可能容易點. 11/01 19:10
andrew43:而且txt檔, 只要把間隔處理一下, 餵食試算表軟體也很容易 11/01 19:12
andrew43:建議你貼上一些txt混亂的實際文子給大家看, 比較好解決. 11/01 19:17
chien533:你只要確定空隔有確實分割開不同的數據的話,用txt存好後 11/02 11:41
chien533:再用excel去開啟,然後將分隔符號設定為空隔,excel就會 11/02 11:42
chien533:自動幫你把數字切割整理好 11/02 11:42