※ 引述《Novena (小天使是做啥用的@@a?)》之銘言:
: 各位同學,
: 統計作業經過我三天下午的努力終於搞出來啦..^^b
: 但坦白說,詳細的步驟我已經寫不太出來了..:p
: 在這邊只能講個大概...
: 首先,老師不是給了兩個檔嗎?
: 所以務必是要把兩個檔案合在一起才能做低,
: 但由於兩個檔案的變項不大一樣,
: 所以要先使兩個變項的資料變成一樣的,
: 不然合併起來會出現一大堆點點(也就是傳說中的缺失值),
: 所以啦...
: 請先gen幾個變項:性別,教育程度,族群(我這邊的定義是以父親的籍貫為準
: ,至於為什麼不用其他為準,恩...如果要的話你也可以用母親的做看看啦...)
: 父親教育程度,母親教育程度等五個變項
: (基本上老師的問題只會用到這幾個,所以其他的可以不理它)
: 接下來要recode教育,父親教育,母親教育這三個變項
: 因為兩個檔案的定義不太一樣,
: 合併起來會出事低...
: 另外一個族群我是懶得去recode啦...
關於族群要不要recode這件事情:
基本上race這個變項 1-4是我們要的
但是在兩個檔案中有一個 race有5和7
另一個 有5
我建議要將1-4以外的值recode為"."
因為合併檔案後ta race if sex==1 % edu==17時
沒有將race=5和7定義為"."的話
各項的百分比會以race 1-7的數量做分母來計算
若將5和7定義為"."的話 百分比的分母會以 race=1-4來計算
這兩種是會有出入的 (雖然相差不大 但只是在這題)
: 因為我查過,除了那老師的四大類以外,
: 其他值很少,在肉眼可辨識的範圍內,
: 如果各位覺得不保險,也是可以將他重新分類...
: 記得,兩個data都要處理喔...不然會合併不起來
: 兩個處裡完後都要存檔,
: 接下來就是快樂的合體時間,
: 請選定兩個檔當中的其中一個檔打開後,
: 使用append這個指令,指令如下:
: append using C:\(看你放哪啦)2004a(or2003a).dta
: 他就會合併起來啦...
: 接下來就只要ta就可以處理了...
: 但是是有條件的ta...
: 例如第一題:請問男性當中,各族群上大學比例各為多少?
: ta 性別 種族 if 性別= =1(男性) & 教育= =6(大學以上那一類)
: 不過這題我覺得老師題目出得很怪,
: 如果以總體男性為分母,各族群上大學為分子的話,
: 那麼閩南籍的人數比較多他的數字比例必然比較大,
: 這個數字的意義就降低許多,
: 相對的,如果問題變成:各族群當中,男性上大學的比例為多少?
: 那麼數字跑出來的意義又不一樣了...
: 但既然老師這麼問,我就這麼答吧...@@
我覺得不會很奇怪ㄝ
因為總數和百分比讀出來的資料訊息本來就不一樣
以第二題來看
也是同時要列出總數和百分比
以總數來看在fedu==4的時候達到最大值
但是並不是因為父親的學歷程度是這樣的話 子女最容易念大學
這個數字反映的只是因為這樣的父親數量上比較多而已
但是以百分比來看在fedu==6時才到達最大值
比較符合我們一般的觀點"父母學歷越好 子女學歷也相對的容易高"
所以同時列出兩種可能是要我們注意到不要犯推論上的錯誤
以總數做推論的基礎
: 然後是第二題之一:
: ta 教育程度 父親教育程度
: 馬上就會跑出個表格來...
: 這題比較像在問機率,
: 也算是跟課程有點連結吧...
: 至於老師說的同時列出N,
: 我想應該是列出總數吧...但我不太確定,
這題 我是看表裡面freq的這個數值ㄝ 振凱妳也是嗎
我就沒去給它設什麼大N小N了
我搞不太清楚 在這裡大N的意思是指組內總數嗎 還是單指念大學的人數
不過以老師上課的講法來看應該是比較接近組內總數吧!!?
所以我就兩個都標上去了
在這樣的方式:
次數/組內總數N
19/868
181/1441
類似這樣
: 如果有知道的同學或學長姐,
: 麻煩告知一下吧...@@
: 就醬
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 125.224.22.37