作者west1996 (焦了六年變脆了)
看板Statistics
標題Re: [問題] 請問SAS的資料處理
時間Sat Apr 11 18:38:29 2009
※ 引述《duckduck2 (只來看文章的ptt)》之銘言:
: 假設有四個變數分別為end date,forecast date,firm code,analyst code
: 日期為yymmdd格式,資料舉例如下:
: end date forecast date firm code analyst code
: 19820430 19820213 01387110 000015
: 19820430 19810824 01387110 000226
: 19830831 19830511 25917GA0 000015
: 19830831 19821216 25917GA0 000461
: 19830831 19830111 25917GA0 000015
: 19851231 19850616 36710256 000226
: 19861231 19860828 48536121 000864
: 依此類推 依此類推 依此類推 依此類推
: 資料有非常多筆
: 而每間公司的end date都不一樣
: forecast date是analyst 對這家公司發出預測的日子
: 我想求的是
: 每一年,一間公司(firm)有多少分析師(analyst)在追蹤?
: 舉end date為1983年來說,雖然有三筆資料,但其實只有兩個分析師在追蹤
: 也就是在同一年裡,分析師重覆發的預測,總共只能算他是一個人
: 因為他雖然發很多筆,但都是同一個人發的,所以人數只要算1
: 之前從板上知道,"table var1 var2"可以算出數量
: 但是我後來了解這是適合code不重覆的情況
: 我曾經試過nodup,但發現不可行
: 而且還會把其他我需要的data刪掉
: 所以我想知道
: 每一年,一間公司(firm)有多少分析師(analyst)在追蹤?
: 即使他在那年對同一間公司發了十筆,一樣只算一個人
proc sql;
create table XXXX as
select count(analyst) as count
from (select distict firm, analyst
from OOOO)
group by firm;
quit;
XXXX OOOO 是你的data name
: 另外,如果我想求
: 每一年,一個分析師追蹤多少間公司
: 方法是否也跟上面的差不多呢?
把analyst和firm的角色對調就行了
: 謝謝大大們~!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.230.75.164
※ 編輯: west1996 來自: 61.230.75.164 (04/11 18:45)
推 duckduck2:請問~如果公司代碼是文字格式的話~該怎麼辦 04/11 18:49
→ duckduck2:還是一樣可以嗎? 04/11 18:50
→ duckduck2:我剛剛跑了~但不行~因為FIRM的格式是文字格式@@ 04/11 18:51
→ duckduck2:另外在from OOOO也出現error~好怪@@~我覺得from檔名應該 04/11 18:57
→ duckduck2:沒問題阿@@~ 04/11 18:57
→ west1996:我是用你貼上的資料跑的 所以firm那邊應該是沒問題的@@ 04/11 18:59
推 duckduck2:@@~傻眼......我再試試看好了@@~因為我給的資料也有用文 04/11 19:01
→ duckduck2:字格式說~ 04/11 19:01
→ duckduck2:先謝謝你的幫忙!!!非常感謝! 04/11 19:03