D 大講的很全面,各種講法都顧到了,我這裡希望
能補充一些實際上在社會科學應用的論文例,以下比較無關的恕刪。
※ 引述《doom8199 (~口卡口卡 修~)》之銘言:
: ※ 引述《s8911409 (~堯)》之銘言:
: : 而且我還有想到,如果殘差是用點到直線的距離,進一步求最小平方,那麼
: : 各點盡量滿足與迴歸直線有最小值,方法上不是會來的比較好嗎?
: 方法好不好要根據 客觀的數據 + 主觀的分析 才能決定
: 就像有 Least square , 也有所謂的 Least absolute deviations
: 這些都只是被 optimize 的 cost function 不一樣而已
: 甚至你把 LS 套到某些問題上,結果出乎意料地爛
: 有可能是你用的不好/用錯地方, 而非方法差
: 一般而言,以 y 為應變數 的迴歸, 就像是在 "filter y data"
: 而原po所說的 "點到直線的距離", 就像是在 "filter linear curve"
看起來這很像資料探勘上常見的技巧,用更新潮一點的講法叫做
「機器學習」(Machine Learning),版上應該有相當比例的人在做這塊,
現實生活上的例子有很多,例如數位相機的抓臉功能,facebook的抓臉和自動tag
的功能,都是從高中的簡單回歸出發。
: : ps.我覺得這一單元真的不好教,很多公式推導對高中生不易理解,如果有先學過微分還好
: : 不曉得有家教經驗或學校實際授課經驗的老師們,你們是怎麼幫學生上這一章節呢?
: : (二維數據的分析),還是,對於高中生的理解範圍內,大多只能先硬背公式,會用就好?
: <1>
: 原po可以跟學生灌輸一個觀念, Least square 是一個工具
: 簡單介紹它的原理、使用地方、使用限制、... 等等
: 例如介紹 湯匙 和 刀叉 製作原理和使用用途
: 然後說明兩者皆為吃飯工具,但刀叉不適合用在米飯上
: 湯匙不適合用在牛排上
我這裡有個明確的例子,就是台大經濟系的駱明慶教授
前幾年有些一篇文章:「誰是台大學生?」
(http://homepage.ntu.edu.tw/~luohm/NTU.pdf)
裡面用了回歸分析的工具,拿實際的政府公開資料做分析(p.139)
其中不同的變數對應到不同的變因,探討是不是台大學生,
跟這些變因有沒有因果關係。在表15中共有 12 個回歸模型,
變因有居住地、父母學歷、所得等等,這些因素是否統計上顯著
代表了這些因素影響能否成為台大學生的條件。
雖然有些人會批評這只是在強加解釋,但從大量資料找到規律,
不也是目的之一?我想這是回歸分析運用得當,還是有他的功能和吸引人的地方。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.124.72.130