看板 Statistics 關於我們 聯絡資訊
※ 引述《duckduck2 (只來看文章的ptt)》之銘言: : 假設有四個變數分別為end date,forecast date,firm code,analyst code : 日期為yymmdd格式,資料舉例如下: : end date forecast date firm code analyst code : 19820430 19820213 01387110 000015 : 19820430 19810824 01387110 000226 : 19830831 19830511 25917GA0 000015 : 19830831 19821216 25917GA0 000461 : 19830831 19830111 25917GA0 000015 : 19851231 19850616 36710256 000226 : 19861231 19860828 48536121 000864 : 依此類推 依此類推 依此類推 依此類推 : 資料有非常多筆 : 而每間公司的end date都不一樣 : forecast date是analyst 對這家公司發出預測的日子 : 我想求的是 : 每一年,一間公司(firm)有多少分析師(analyst)在追蹤? : 舉end date為1983年來說,雖然有三筆資料,但其實只有兩個分析師在追蹤 : 也就是在同一年裡,分析師重覆發的預測,總共只能算他是一個人 : 因為他雖然發很多筆,但都是同一個人發的,所以人數只要算1 : 之前從板上知道,"table var1 var2"可以算出數量 : 但是我後來了解這是適合code不重覆的情況 : 我曾經試過nodup,但發現不可行 : 而且還會把其他我需要的data刪掉 : 所以我想知道 : 每一年,一間公司(firm)有多少分析師(analyst)在追蹤? : 即使他在那年對同一間公司發了十筆,一樣只算一個人 proc sql; create table XXXX as select count(analyst) as count from (select distict firm, analyst from OOOO) group by firm; quit; XXXX OOOO 是你的data name : 另外,如果我想求 : 每一年,一個分析師追蹤多少間公司 : 方法是否也跟上面的差不多呢? 把analyst和firm的角色對調就行了 : 謝謝大大們~! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.230.75.164 ※ 編輯: west1996 來自: 61.230.75.164 (04/11 18:45)
duckduck2:請問~如果公司代碼是文字格式的話~該怎麼辦 04/11 18:49
duckduck2:還是一樣可以嗎? 04/11 18:50
duckduck2:我剛剛跑了~但不行~因為FIRM的格式是文字格式@@ 04/11 18:51
duckduck2:另外在from OOOO也出現error~好怪@@~我覺得from檔名應該 04/11 18:57
duckduck2:沒問題阿@@~ 04/11 18:57
west1996:我是用你貼上的資料跑的 所以firm那邊應該是沒問題的@@ 04/11 18:59
duckduck2:@@~傻眼......我再試試看好了@@~因為我給的資料也有用文 04/11 19:01
duckduck2:字格式說~ 04/11 19:01
duckduck2:先謝謝你的幫忙!!!非常感謝! 04/11 19:03