[問題] statistical modeling如何知道distributi

作者jaids (做工的人)

看板DataScience

標題[問題] statistical modeling如何知道distributi

時間Tue Mar 21 17:40:13 2023

統計題目通常都是給定已知distribution 然後這之後由data估計出mean, variance等未知變量(data analysis) 我好奇如何能從一群data估計出是什麼distribution? 就是說statistical modeling是怎麼做的? 先感謝各位的回覆與建議了謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 92.221.218.184 (挪威) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1679391616.A.837.html

推 wtchen: 應該是先「假設」其distribution再去求相關參數吧 03/21 18:53

推 yiche: 同一樓看法 03/21 20:14

推 yiche: 看設的random variable情境為何，在不同情境有不同適用的 03/21 20:18

→ yiche: 機率分佈，至於準不準確我認為有待樣本做大之後再檢驗了 03/21 20:18

推 SilenceWFL: 承上述大大討論：統計模型之所以是「統計」，是因為 03/22 00:47

→ SilenceWFL: 基於研究者對這個領域的了解與前人經驗的累積，才能 03/22 00:47

→ SilenceWFL: 針對變數提出很強的分佈假設，透過這樣的假設才能進 03/22 00:47

→ SilenceWFL: 一步推敲變數與應變數的關係 03/22 00:47

→ SilenceWFL: 當然這時就會有人質疑，前人經驗與當下情境有所出入 03/22 00:51

→ SilenceWFL: ，究竟是否合適繼續使用同樣的分佈假設；這時除了可 03/22 00:51

→ SilenceWFL: 以透過檢定佐證外，也可以透過各式各樣的手段放寬分 03/22 00:51

→ SilenceWFL: 佈假設的限制(比方說robust, panel data… 03/22 00:51

推 raiderho: 標準做法不就是 kernel density estimation 嗎? 03/22 14:30

推 carolian: 可以用Central limit theorem假設distribution 03/22 15:53

推 bearching: 看你要做什麼用如果是計量相關分析可以用GMM方法只要 03/22 17:25

→ bearching: 知道動差就可以跑了~回到問題本身所以要先觀察data阿 03/22 17:25

→ bearching: 學這麼多分配就是要讓你知道資料有這些種類的特性都 03/22 17:26

→ bearching: 不是那些學過的話再來談 03/22 17:26

推 wieldthewave: 推一樓 03/27 18:55

→ wieldthewave: 比較「統計化」的執行方式應該是先猜測分佈然後再去 03/27 18:55

→ wieldthewave: 估計參數 03/27 18:55

推 a22735557: 標準做法還有kernel density estimation 或是更直觀的 04/02 02:45

→ a22735557: histogram 去試著看出資料的 distribution ，也有不 04/02 02:45

→ a22735557: 少針對 distribution 的檢定可以做，接著再用一樓說的 04/02 02:45

→ a22735557: 方法去繼續分析 04/02 02:45