精華區beta NTPU-SOCM98 關於我們 聯絡資訊
※ 引述《Novena (小天使是做啥用的@@a?)》之銘言: : 各位同學, : 統計作業經過我三天下午的努力終於搞出來啦..^^b : 但坦白說,詳細的步驟我已經寫不太出來了..:p : 在這邊只能講個大概... : 首先,老師不是給了兩個檔嗎? : 所以務必是要把兩個檔案合在一起才能做低, : 但由於兩個檔案的變項不大一樣, : 所以要先使兩個變項的資料變成一樣的, : 不然合併起來會出現一大堆點點(也就是傳說中的缺失值), : 所以啦... : 請先gen幾個變項:性別,教育程度,族群(我這邊的定義是以父親的籍貫為準 : ,至於為什麼不用其他為準,恩...如果要的話你也可以用母親的做看看啦...) : 父親教育程度,母親教育程度等五個變項 : (基本上老師的問題只會用到這幾個,所以其他的可以不理它) : 接下來要recode教育,父親教育,母親教育這三個變項 : 因為兩個檔案的定義不太一樣, : 合併起來會出事低... : 另外一個族群我是懶得去recode啦... 關於族群要不要recode這件事情: 基本上race這個變項 1-4是我們要的 但是在兩個檔案中有一個 race有5和7 另一個 有5 我建議要將1-4以外的值recode為"." 因為合併檔案後ta race if sex==1 % edu==17時 沒有將race=5和7定義為"."的話 各項的百分比會以race 1-7的數量做分母來計算 若將5和7定義為"."的話 百分比的分母會以 race=1-4來計算 這兩種是會有出入的 (雖然相差不大 但只是在這題) : 因為我查過,除了那老師的四大類以外, : 其他值很少,在肉眼可辨識的範圍內, : 如果各位覺得不保險,也是可以將他重新分類... : 記得,兩個data都要處理喔...不然會合併不起來 : 兩個處裡完後都要存檔, : 接下來就是快樂的合體時間, : 請選定兩個檔當中的其中一個檔打開後, : 使用append這個指令,指令如下: : append using C:\(看你放哪啦)2004a(or2003a).dta : 他就會合併起來啦... : 接下來就只要ta就可以處理了... : 但是是有條件的ta... : 例如第一題:請問男性當中,各族群上大學比例各為多少? : ta 性別 種族 if 性別= =1(男性) & 教育= =6(大學以上那一類) : 不過這題我覺得老師題目出得很怪, : 如果以總體男性為分母,各族群上大學為分子的話, : 那麼閩南籍的人數比較多他的數字比例必然比較大, : 這個數字的意義就降低許多, : 相對的,如果問題變成:各族群當中,男性上大學的比例為多少? : 那麼數字跑出來的意義又不一樣了... : 但既然老師這麼問,我就這麼答吧...@@ 我覺得不會很奇怪ㄝ 因為總數和百分比讀出來的資料訊息本來就不一樣 以第二題來看 也是同時要列出總數和百分比 以總數來看在fedu==4的時候達到最大值 但是並不是因為父親的學歷程度是這樣的話 子女最容易念大學 這個數字反映的只是因為這樣的父親數量上比較多而已 但是以百分比來看在fedu==6時才到達最大值 比較符合我們一般的觀點"父母學歷越好 子女學歷也相對的容易高" 所以同時列出兩種可能是要我們注意到不要犯推論上的錯誤 以總數做推論的基礎 : 然後是第二題之一: : ta 教育程度 父親教育程度 : 馬上就會跑出個表格來... : 這題比較像在問機率, : 也算是跟課程有點連結吧... : 至於老師說的同時列出N, : 我想應該是列出總數吧...但我不太確定, 這題 我是看表裡面freq的這個數值ㄝ 振凱妳也是嗎 我就沒去給它設什麼大N小N了 我搞不太清楚 在這裡大N的意思是指組內總數嗎 還是單指念大學的人數 不過以老師上課的講法來看應該是比較接近組內總數吧!!? 所以我就兩個都標上去了 在這樣的方式: 次數/組內總數N 19/868 181/1441 類似這樣 : 如果有知道的同學或學長姐, : 麻煩告知一下吧...@@ : 就醬 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 125.224.22.37