看板 DataScience 關於我們 聯絡資訊
統計題目通常都是給定已知distribution 然後這之後由data估計出mean, variance等未知變量(data analysis) 我好奇如何能從一群data估計出是什麼distribution? 就是說statistical modeling是怎麼做的? 先感謝各位的回覆與建議了 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 92.221.218.184 (挪威) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1679391616.A.837.html
wtchen: 應該是先「假設」其distribution再去求相關參數吧 03/21 18:53
yiche: 同一樓看法 03/21 20:14
yiche: 看設的random variable情境為何,在不同情境有不同適用的 03/21 20:18
yiche: 機率分佈,至於準不準確我認為有待樣本做大之後再檢驗了 03/21 20:18
SilenceWFL: 承上述大大討論:統計模型之所以是「統計」,是因為 03/22 00:47
SilenceWFL: 基於研究者對這個領域的了解與前人經驗的累積,才能 03/22 00:47
SilenceWFL: 針對變數提出很強的分佈假設,透過這樣的假設才能進 03/22 00:47
SilenceWFL: 一步推敲變數與應變數的關係 03/22 00:47
SilenceWFL: 當然這時就會有人質疑,前人經驗與當下情境有所出入 03/22 00:51
SilenceWFL: ,究竟是否合適繼續使用同樣的分佈假設;這時除了可 03/22 00:51
SilenceWFL: 以透過檢定佐證外,也可以透過各式各樣的手段放寬分 03/22 00:51
SilenceWFL: 佈假設的限制(比方說robust, panel data… 03/22 00:51
raiderho: 標準做法不就是 kernel density estimation 嗎? 03/22 14:30
carolian: 可以用Central limit theorem假設distribution 03/22 15:53
bearching: 看你要做什麼用 如果是計量相關分析可以用GMM方法 只要 03/22 17:25
bearching: 知道動差就可以跑了~回到問題本身 所以要先觀察data阿 03/22 17:25
bearching: 學這麼多分配就是要讓你知道資料有這些種類的特性 都 03/22 17:26
bearching: 不是那些學過的話再來談 03/22 17:26
wieldthewave: 推一樓 03/27 18:55
wieldthewave: 比較「統計化」的執行方式應該是先猜測分佈然後再去 03/27 18:55
wieldthewave: 估計參數 03/27 18:55
a22735557: 標準做法還有kernel density estimation 或是更直觀的 04/02 02:45
a22735557: histogram 去試著看出資料的 distribution ,也有不 04/02 02:45
a22735557: 少針對 distribution 的檢定可以做,接著再用一樓說的 04/02 02:45
a22735557: 方法去繼續分析 04/02 02:45