作者LydiaWu (小瓶子與大饅頭:D)
看板NCCU07_SOCIO
標題Re: [討論] 土法煉鋼抽樂透...
時間Tue Sep 25 19:28:22 2007
※ 引述《kenshin528 (不知恥)》之銘言:
: 剛剛試驗結果,N 這個指令用在這邊會有抽樣上的BUG QQ
: 因為刪除重複CASE的時候,所有CASE會按照大小排序,
: 用N 取1000 只會取前1000個CASE ,樣本就不是隨機抽樣了。
: 所以我把N 放在前面一點的地方 做出5000個樣本後 取前1500個
: 然後在用選擇樣本的方式從1500個中隨機抽1000個
: (因為選擇樣本的指令,其母體數量要固定才能抽出特定個樣本)
等下,既然你選擇做出 5000 個樣本 @@
又刪除了 duplicate cases ... 就已經沒有重複啦 @@
為什麼不乾脆在已經刪除過重複樣本的剩餘 cases 中隨機抽 1000 組出來 @@
這樣不是更 random 嗎? @@
: : ==
: : 明明沒什麼重點,硬是這麼大一篇 Orz
: 而且我這樣的抽法還有一個BUG,
: 就是當所有隨機跑出來的數值都相同的時候...,就只會留下一個CASE。
對啊,這就是處理 duplicate cases 的用意所在 @@
會有什麼大問題嗎? @@
: 如果SPSS有個指令能夠計算現有CASE數,然後設定如果現有CASE不到1000組,
: 就再重新抽取樣本,這樣的話就好了 囧~
那就不用動腦做啦 XD
==
我當初的步驟大概是這樣 ...
1. generate cases:
100000 * 1.3 in order to complement removed duplicate cases
loop + TRUNC(RV.UNIFORM(1, #max)) + end loop if not any (if the first
parameter is the same as any of the rest parameters, end loop)
2. sort variables within cases
to make variables in order
(3. identify duplicate cases
if PrimaryLast = 1, the case is not duplicate; if 0, duplicate.)
4. remove duplicate case
to make cases in order and make them in groups (the same cases)
the first case of one group will be marked as "first"
select all cases marked as "first"
5. N
to limit the total number
--> 如果當初不用 N 改從剩餘的 cases 數中隨機再抽出十萬組 ...
應該就不會有 N 取 sort 過較為前面 cases 的問題 @@"
==
我好像應該去唸書了 Orz
奇怪,怎麼又回想起統計,這明明是我的惡夢 XD
--
┌────
‧耐心打發 輕柔攪拌‧ *
│
φ當蛋白與蛋黃交融成細緻無瑕的鵝黃φ │
* ‧渴望烘焙的心終於得以釋放‧────┘
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.90.75
推 kenshin528:喔喔XD 感恩 我真的頭暈了 09/25 23:53
→ kenshin528:統計真的是惡夢 09/25 23:55