※ 引述《MIZUYAMA (致命祈願)》之銘言:
: [軟體程式類別]:
: SAS
: [程式問題]:
: 資料處理
: [軟體熟悉度]:
: 低(1~3個月)
: [問題敘述]:
: 資料分類問題 假設兩個變數 id item
: id 為B1 B2 B3.....等多個
: item 為A1 A2 A3 A4 A5 就只有5個
: 資料為 A1 A2 A3 A4 A5
: B1 0990302 . . . .
: B1 0990420 . . . .
: B2 1001001 . . . .
: B2 . . 0980130 . .
: B2 . . . 1010730 .
: B2 . . . 1020304
: .
: 希望能用SAS找出每個id最早在各item的時間
: 如上例 B1在A1的時間就是99年3月2日 第二筆就會忽略
: 但是A又有權重
: 如果A後面的數字越大且發生的時間早
: 則可忽略數字小且發生晚的
: 如 B2第一筆資料就會被忽略 B2就只會有 A3 A4兩筆資料
: 所以如果B3最早發生的item是A5
: 那B3就不會有A1~4的任何資料
: 想請問板上SAS高手能給點提示@@
後來打算先整理資料把所有的id擁有最早日期的項目列出來
整理例子
A1 A2 A3 A4 A5
B1 0990302 . . . .
B2 . . 0980130 1010730 .
但是程式跑出來變成每的id只有一個時間
(也就是如果有A1 就不會有其他項目的時間)
SAS也沒有警告~想請問高手我這樣做哪裡有問題呢?
: [程式範例]:
讀取程式的部分省略
後面為用SQL語法
proc sql;
create table test as select id,min(A5) as A5, min(A4) as A4,
min(A3) as A3, min(A2) as A2, min(A1) as A1
from data
group by id;
quit;
--
大學院研究的主題是時間~直到他們將時間用盡
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.228.16.226