作者fairwind (應天風)
看板Statistics
標題Re: [問題] SAS跑大量資料所需的時間
時間Tue Mar 17 16:00:50 2009
我今天有請人測了一下
data5G
筆數80萬筆
sas code 大概長這樣吧
----------
proc sort data=abc
by var_a
run;
1.在C:下
real time:5:30
cpu time:0:30
2.裝在ramdisk下 (ramdisk有9G)
不管怎麼試都會出現 out of resource?
然後只能中止程式
想請問這裡是什麼問題?
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.86.144
→ kingbee:我猜因該是SAS在讀取時快取檔案非常大 ramdisk的限制 03/17 16:10
→ kingbee:在控制台那邊監控看看 不知道是不是 我有接觸過健保資料 03/17 16:11
→ kingbee:上百萬筆連讀進去都等快20分鐘了 早期更不用說 03/17 16:11
→ kingbee:你的語法那邊 by 後面是不是沒加分號; 03/17 16:13
推 pohsin:還有一個方法可以參考,盡量不要排序,排序很花時間,盡量 03/17 19:52
→ pohsin:用proc sql的方式來處理資料,可以不用排序,速度上快很多 03/17 19:53