推 ceiba:辛苦了...統計小天使 10/25 11:55
各位同學,
統計作業經過我三天下午的努力終於搞出來啦..^^b
但坦白說,詳細的步驟我已經寫不太出來了..:p
在這邊只能講個大概...
首先,老師不是給了兩個檔嗎?
所以務必是要把兩個檔案合在一起才能做低,
但由於兩個檔案的變項不大一樣,
所以要先使兩個變項的資料變成一樣的,
不然合併起來會出現一大堆點點(也就是傳說中的缺失值),
所以啦...
請先gen幾個變項:性別,教育程度,族群(我這邊的定義是以父親的籍貫為準
,至於為什麼不用其他為準,恩...如果要的話你也可以用母親的做看看啦...)
父親教育程度,母親教育程度等五個變項
(基本上老師的問題只會用到這幾個,所以其他的可以不理它)
接下來要recode教育,父親教育,母親教育這三個變項
因為兩個檔案的定義不太一樣,
合併起來會出事低...
另外一個族群我是懶得去recode啦...
因為我查過,除了那老師的四大類以外,
其他值很少,在肉眼可辨識的範圍內,
如果各位覺得不保險,也是可以將他重新分類...
記得,兩個data都要處理喔...不然會合併不起來
兩個處裡完後都要存檔,
接下來就是快樂的合體時間,
請選定兩個檔當中的其中一個檔打開後,
使用append這個指令,指令如下:
append using C:\(看你放哪啦)2004a(or2003a).dta
他就會合併起來啦...
接下來就只要ta就可以處理了...
但是是有條件的ta...
例如第一題:請問男性當中,各族群上大學比例各為多少?
ta 性別 種族 if 性別= =1(男性) & 教育= =6(大學以上那一類)
不過這題我覺得老師題目出得很怪,
如果以總體男性為分母,各族群上大學為分子的話,
那麼閩南籍的人數比較多他的數字比例必然比較大,
這個數字的意義就降低許多,
相對的,如果問題變成:各族群當中,男性上大學的比例為多少?
那麼數字跑出來的意義又不一樣了...
但既然老師這麼問,我就這麼答吧...@@
然後是第二題之一:
ta 教育程度 父親教育程度
馬上就會跑出個表格來...
這題比較像在問機率,
也算是跟課程有點連結吧...
至於老師說的同時列出N,
我想應該是列出總數吧...但我不太確定,
如果有知道的同學或學長姐,
麻煩告知一下吧...@@
就醬
--
home is behind mist and shadow
the world ahead cloud and shade
and there are many paths to tread all shall fade
through shadow all shall fade
to the edge of night
until the stars are all alight
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 203.68.127.30