作者rockken (態度)
看板Statistics
標題[問題] 資料轉換問題
時間Mon Nov 1 17:34:32 2010
如果是跟統計軟體有關請重發文章
如果跟論文有關也煩請您重發文章
文章類別是為了幫助大家搜尋資料與解答,造成不便之處請見諒
最近我在分析一筆龐大資料,但因為檔案是別的地方得來。
目前格式有PDF 以及 TXT 黨。
但由於TXT黨格式很亂,我放棄了,轉戰PDF黨。
但PDF 在轉檔時以為格式應該會很整齊,最終還是失敗了。
轉檔方式,我用專業版的 Adobe 令存新黨轉 TXT黨。
有時很整齊如下:
傳票編號 魚號 魚 名 承 銷 人 箱數 尾數 籠 重量 單價 金額
D019984 2261 A 050 0 0 76.0 220.0 16,720
D019985 2261 A 050 0 0 237.0 160.0 37,920
D019986 4071 B 050 0 0 73.0 190.0 13,870
D019987 4091 C 050 0 0 276.0 100.0 27,600
但有時為,
傳票編號 魚號 魚 名 承 銷 人 箱數 尾數 籠 重量 單價 金額
D015860 D015861 D015862 214121652562 土魠 軟舌 什魚 071 071 071 0 0 0 0 0
0 150.0 30.0 20.0 230.0 150.0 45.0 34,500 4,500 900
表格為一整行。
令我很困擾,不知道有沒有強者可以提供建議讓PDF檔資料轉換較為整齊。
由於檔案有12份,且一份檔案都是10幾萬筆資料,手動調整有些困難。
謝謝!!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.117.96.182
→ gsuper:latex? 11/01 19:04
→ andrew43:我猜用txt檔加上正規表示式還可能容易點. 11/01 19:10
→ andrew43:而且txt檔, 只要把間隔處理一下, 餵食試算表軟體也很容易 11/01 19:12
→ andrew43:建議你貼上一些txt混亂的實際文子給大家看, 比較好解決. 11/01 19:17
推 chien533:你只要確定空隔有確實分割開不同的數據的話,用txt存好後 11/02 11:41
→ chien533:再用excel去開啟,然後將分隔符號設定為空隔,excel就會 11/02 11:42
→ chien533:自動幫你把數字切割整理好 11/02 11:42