閱讀文章 - 看板 Statistics

最近在自學人工神經網路(Artificial Neural Network) 這個方法在機器學習領域算是重要的工具簡單來說既是將inputs透過線性方法先進行組合然後再透過非線性轉換(例如Sigmoid或是ReLU)再進行輸出在進行線性組合那個部分需要對parameters, w進行估計這個部分和傳統的回歸模型非常類似讓我不禁好奇是否ANN透過不斷iterate找尋最佳化w的過程其實就是在創造一個擬合statistical distribution的過程? 如果是這樣的話，那和regression model背後的邏輯就很接近了各位高手對這樣的見解看法如何? 若有誤解請指教，謝謝 ※ 編輯: incessantgas (71.58.82.199 美國), 06/23/2020 01:45:15

推 joshddd: 同問 06/23 07:46

→ yhliu: ANN 通常採用的是 logistic form, 而它的 "參數估計" 是直 06/23 08:32

→ yhliu: 接按特定公式計算. 它是一直以新的資料更新參數, 並不考慮 06/23 08:34

→ yhliu: 參數估計方法的 "最優性", 也不考慮模型的統計適切性. 06/23 08:36

→ yhliu: 但由於 input 一直在增加 (n→∞), 所以, 最終得到的預測 06/23 08:38

→ yhliu: 模型將趨近於設定模型與事實最接近的狀態. 06/23 08:39

→ yhliu: 統計的 logistic regression model 操作上只有一組固定 n 06/23 08:40

→ yhliu: 的資料, 因此除了考慮模型的實務與統計適切性, 也考慮了估 06/23 08:42

→ yhliu: 計方法的最優性. 因為不是線性模型, 所以要得到最後的估計 06/23 08:44

→ yhliu: 或說是預測模型, 並沒有可直接套用的一次計算式, 而是用迭 06/23 08:45

→ yhliu: 代逼近的方法. 06/23 08:46

→ yhliu: 上面所說的 "統計適切性" 指的是模型中對資料所來自群體機 06/23 08:48

→ yhliu: 率分布的假設, 資料變異(分散)相關的假設等. 實務適切性是 06/23 08:50

→ yhliu: 指模型與事實是否足夠接近. 而 "最優性" 指的是估計方法產 06/23 08:53

→ yhliu: 生之估計結果與 "真實參數值" 之間誤差 "最小". "真實參數 06/23 08:55

→ yhliu: 值就是該模型與真實狀況最接近的狀態所對應的模型參數值. 06/23 08:57

→ yhliu: 統計的 "最優" 考慮一個結果就是估計值與 "真實參數值" 最 06/23 08:59

→ yhliu: 接近 (相同 n), 或最快趨近 (n→∞). 但由於 ANN 面對的是 06/23 09:00

→ yhliu: n→∞, 對趨近最終值速度及前面的有限 n 並不注重, 所以只 06/23 09:02

→ yhliu: 是取一個合理、易算的參數估計方法, 而不像統計人員精打細 06/23 09:04

→ yhliu: 算地想用有限 n 筆資料得到最接近真實參數值的估計. 06/23 09:06