作者BugEater (無庸)
看板Statistics
標題Re: [程式]SAS利用巨集水平合併多個檔
時間Thu Jan 15 07:54:51 2015
我一般的做法是這樣的
首先把所有file的名字列出來
(應該有很多方法,我都是直接進入dos界面使用dir命令
然後copy出所有的files的名字)
然後利用excel,把它們和有次序的macro variable聯係起來
例如這樣
%let file1=TX2007Jan1;
%let file2=TX2007Jan3;
...
%let file1000=TX2015Jan14;
這樣就可用使用Loop來順序讀取所有file
如下,
%macro mergefile;
PROC DATASETS library=work; DELETE total temp;RUN;
%do i=1 %to 1000;
PROC IMPORT OUT= temp
DATAFILE= "D:\test\&&file&i.."
DBMS=DBF REPLACE;
GETDELETED=NO;
RUN;
data temp;
set temp;
filename=&&file&i..;
keep filename post_code RASTERVALU;
run;
PROC DATASETS; APPEND base =total new = temp force;RUN;
%end;
%mend;
%mergefile;
這樣你就有了一個file包括所有資料,裏面的variable filename包括了年月日
你需要什麽就用相應的function來獲取就可以,或者你要transpose data也可以
用proc datasets 的append的時候要小心,相同variable的format要一致
否則會有問題,要小心檢查。
※ 引述《ctn912 (雨兒)》之銘言:
: --------------------------------------------------------------------
: [軟體程式類別]:
: SAS9.3
: [程式問題]:
: 資料處理
: [軟體熟悉度]:
: 中(3個月到1年)
: [問題敘述]:
: 目前我有五年份的檔案(DBF檔),數量大約一千多個,每個檔案以日期命名,
: 因為不是每一天都有檔案所以數字並不連續。
: 每一個檔案內都只有一個變數RASTERVALU
: 例如一月份檔名:TX2007JAN1、TX2007JAN3、TX2007JAN11、TX2007JAN15...
: 我想用macro將所有的檔案讀入,修改變數名稱(改為日期)再合併。
: 由於檔名的數字不連續,所以結果會將原本沒有的檔案也建立在資料庫,
: 使用merge在合併時就發生沒有讀取到變數而發生錯誤不能合併。
: 在版上看過有人寫 PROC DATASET 的巨集來做,
: 雖然之後試了force option有強制併在一起但是除了共同欄位外其餘都成了缺失值。
: 所有程式語法如下。
: 因為我第一次試寫macro語法,估勾很久還是不知道如何解決,還請版友指教。
: 謝謝大家^^
: [程式範例]:
: %macro import (n);
: %Do i=1 %to &n;
: PROC IMPORT OUT= WORK.temp2007JAN&i
: DATAFILE= "D:\test\ck0701&i"
: DBMS=DBF REPLACE;
: GETDELETED=NO;
: RUN;
: data TX2007JAN&i;
: set temp2007JAN&i;
: keep post_code RASTERVALU;
: if RASTERVALU>0 then TX2007JAN&i=RASTERVALU;
: run;
: data A.TX2007JAN&i;
: set TX2007JAN&i;
: TX2007JAN&i=RASTERVALU;
: drop RASTERVALU;
: run;
: %end;
: %mend;
: %import (28);
: -------------------------------------------------------
: %macro merge ;
: PROC DATASETS library=A; RUN;
: %do i=1 %to 28;
: proc sort data=TX2007JAN&i; by post_code;
: PROC DATASETS; APPEND out =tm data=TX2007JAN&i force;
: RUN;
: %end;
: %mend merge ;
: %merge by post_code;
: -----------------------------------------------------------------------------
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.85.174.10
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1421279701.A.E79.html
→ BugEater: filename=&&file&i..;應該爲filename="&&file&i.."; 01/15 09:03
→ ctn912: 上網查了之後才對macro variable有點概念,我試跑這段語法 01/16 15:48
→ ctn912: 大概可以瞭解了,感激不盡 01/16 15:50
→ BugEater: 我要補充一點,在%do i=1 %to 1000;的後面,需要加上 01/17 10:16
→ BugEater: PROC DATASETS library=work; DELETE temp;RUN; 01/17 10:17
→ BugEater: 否則可能會有問題。這是因爲每個file在import之後 01/17 10:18
→ BugEater: 都會overwrite temp這個file,問題是如果某個file,例如 01/17 10:19
→ BugEater: file100在import的時候失敗,這時候temp就還仍然是第 01/17 10:20
→ BugEater: 99個file,然後再被append到total裏面去,相當於file99 01/17 10:21
→ BugEater: 被append了兩次,而你可能沒有發現這個問題,使得後面 01/17 10:22
→ BugEater: 的分析可能出錯。由於問題很嚴重,所以我要補充這一點。 01/17 10:23
→ ctn912: 感謝協助與指導,我已經順利跑出來了^^ 01/19 21:03