Re: [新聞] 獨／盼留一半名額給指考...高中師給蔡總

作者yoyun10121 (yoyo)

看板SENIORHIGH

標題Re: [新聞] 獨／盼留一半名額給指考...高中師給蔡總

時間Mon Apr 22 02:26:01 2019

你只要用科學實驗的觀點去理解考試，邏輯就很簡單了現在假設我們今天做一個牛頓定律的力學實驗，所以我們要測量滑車的速度來證明 F=ma，有基本科學常識的人一定都知道實驗一定有誤差，所以實驗一定會重複多次再取平均，以盡量減少誤差求得真實的速度。那用這例子來看下面你所提出的問題: ※ 引述《cookiesweets (3m)》之銘言： : 標題: Re: [新聞] 獨／盼留一半名額給指考...高中師給蔡總 : 時間: Sun Apr 21 19:58:47 2019 : : : : 我其實不太懂w大這邊想表達的邏輯 : : 先說我確實沒學過統計，因此有錯請指正 : : : : 的確，我同意題目越多/考越多次考試，獲得的結果一定更準，沒意義的切細分數不會增加 : 可信度 : : 但是亂切細分數沒有用，不等於切細“一定”沒用吧？ : : 如果我們固定題數都是50題。你切成100分一題兩分，一定比切成十五級要有鑒別度啊？ : : 我沒有辦法理解 : “在沒有增加題目數的情況下切太細沒有意義”這是對的假設我們做五次實驗，測量到的速度分別是 5, 8, 4, 9, 13, 7, 6, 8 m/s，這八筆數據的平均是 7.5、標準差是 2.8，考慮到有效位數，科學上會寫成 8+-3 m/s 用來表示誤差範圍，統計上的意義是你每做一次實驗，有68%的機率測量到的速度會落在 4.7 ~ 10.3 m/s的範圍內 95%的機率測量到的速度會落在 1.9 ~ 13.1 m/s的範圍內。所以刻度要多細才有意義?? 如果目的是拿來比較差異的話，科學上通常至少會要求兩倍的標準差，也就是你今天如果你測量到6+-3 m/s, 另個人量到8+-3 m/s, 科學上會跟你說這叫做結果吻合沒有差異... 如果今天測量到 6+-3 m/s, 另個人量到15+-3 m/s，這才叫能分的出差異所以拿來比較的刻度不是隨便定的，而是要參照你實驗誤差有多少... 有這樣大的誤差，把測量速度的刻度調成0.1 m/s 甚至0.0001 m/s 都完全沒意義 : 但是要怎麼推論到15級不輸100分呢？ : : 不然讓我滑坡理論一下，難道100分分成五級，20分一個級距，這樣你會覺得比100分好嗎？ : : 然後回到上面說的，學測的初衷。 : : 你說想測量的是一個人每天能力的平均值 : : 但是這是“你認為”吧？這並不是共識 : : 事實上，在壓力下如何調適自己的心情，以及在短時間內如何有爆發力，這是很重要的人格 : 特質 : : 高中學的東西，跟大學比根本微不足道，大學要的學生是聰明，扛的住壓力的學生。 : : 如果想測量一個人平均的實力，也有繁星了。就像前面講的，科學測量會盡量平均多次數據來減少誤差，得到比較準確的結果所以你量到的速度是 5, 8, 4, 9, 13, 7, 6, 8 m/s，平均的結果是8 m/s 其中13 m/s那次的結果叫做極端數據，直接拿出來當結果報告就等著準備被當掉... 考試的誤差來源可不只壓力，考試題目抽題有沒有剛好抽到考生會/不會的題目，甚至到考生當天身體狀況都是誤差來源... 大學想看的當然是學生長期整體的學習表現，不是評估當天早上考生有沒有烙賽，也不是看你運氣好不好有讀的題目有沒有都有抽到.. : : : → cookiesweets: 這樣說好了，你多錯一題，兩題，這跟運氣相關度高 04/21 20:16 : → cookiesweets: 嗎？ 04/21 20:16 : → wen17: 頂尖高手可能不高但是除此之外的挺高的吧 04/21 20:17 : → cookiesweets: 國文作文或許是吧（所以這吵很久）。但是譬如數學 04/21 20:19 : → cookiesweets: ，基本題大家都會，難題就那幾題，那種題目多對一 04/21 20:19 : → cookiesweets: 題，就足以說明某位學生確確實實比其他人更優秀。 04/21 20:19 : → cookiesweets: 而照你的說法，多對那一題好像只是那位學生運氣比 04/21 20:19 : → cookiesweets: 較好，而沒有給他任何實質獎勵（級分一樣） 04/21 20:19 你所謂的運氣，正是考試的誤差來源之一，所以在評估考試這個實驗的誤差時，當然要把運氣的影響也算進去 : → wen17: 你高估了台灣學生平均程度 04/21 20:19 : → wen17: 你有興趣可以找找幾本比較完善的考古題參考書 04/21 20:20 : → wen17: 都會一題一題標註正解率.... 04/21 20:20 : → wen17: 很多時候你所謂的基本題對於很多中等程度的學生來講 04/21 20:22 : → wen17: 就是看他腦袋今天有沒有靈光一閃有就答得出來沒有就GG 04/21 20:22 : → wen17: 當然我能體會您認為都是基本題的理由因為的確對於程度好 04/21 20:22 : → wen17: 的學生來講真的都很簡單解法大概一眼看出去就找到 04/21 20:23 : → wen17: 至於中等程度的學生是我家教救火隊的經驗 04/21 20:23 : → wen17: 所以說您質疑的理由是認為 ex數學考科沒啥運氣考量? 04/21 20:24 : → wen17: 當然如果您質疑這點成立的確我的理論會不成立 04/21 20:25 : → cookiesweets: 是，我認為運氣成分不大，至少沒大到要把一個級距 04/21 20:27 : → cookiesweets: 設定那麼寬 04/21 20:27 : → cookiesweets: 譬如作文，我就贊同像國中那樣6級分制。用級距方式 04/21 20:28 : → cookiesweets: 來降低運氣和人為誤差值 04/21 20:28 運氣成份大不大是可以測量的，不需要靠感覺.. 就像實驗可以重複做一樣，考試的誤差只要多寫幾屆試題就能知道.. 要實驗目前的級分會不會太高很簡單，連續寫十屆的考題，如果有至少過兩次你拿到不同的級分，就只代表目前級分還太細.. 如果今天算的是總級分還有誤差累計問題，有幾個人能連寫十屆考題，有九次都拿到完全一樣的總級分的?? 實際測試就很明白告訴你考試的誤差超大，現在級分制根本還追不上這誤差... 同一個人同一天寫不同屆試題總級分都有差了，這差異放到大學四年有什麼意義?? : → cookiesweets: 另外有個問題是，壓力當下的反應，確實是一個重要 04/21 20:31 : → cookiesweets: 的人格特質。以榜首醫學系來說，我不想要一個一大 04/21 20:31 : → cookiesweets: 考就肚子痛的人幫我開刀 04/21 20:31 : → cookiesweets: 這種人在大考被淘汰也算是一種鑒別度 04/21 20:32 你這邊完全假設誤差只有壓力, 但實際上光你前面說的運氣影響可能就大更多... 要怎麼分辨分數差異是來自壓力，不是運氣或其他因素?? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.236.215 ※ 文章網址: https://www.ptt.cc/bbs/SENIORHIGH/M.1555871163.A.056.html

推 ddss: 草莓族養成訓練營? 大聯盟 NBA 或是找工作的面試有這麼面面 04/22 03:04

→ ddss: 俱到? 面試官要考量球員、應徵者各式各樣的突發狀況予以寬 04/22 03:05

→ ddss: 容錄取? 沒被錄取家長是否要跨海告大聯盟 NBA 或是公司說甄 04/22 03:06

→ ddss: 選、面試流程沒考量我而我女的當下狀況就刷掉要求不斷測試 04/22 03:08

→ ddss: 直到錄取為止? 04/22 03:09

→ ddss: 是在害下一代還是在訓練下一代傻傻分不清 04/22 03:10

因為私人公司選人不用考慮公益性所以隨他們高興，我有認識的竹科主管，只要看到來的是女的就優先錄取，你覺得大學申請也要比照這標準才更能訓練下一代??

噓 SunSky0126: 把NBA跟政府比太不恰當了吧= = 04/22 05:02

推 installbtien: 不是68%的機率吧是信心水準 04/22 08:02

→ SeanLyee: 我怎麼記得信心水準不代表事件發生的機率= = 04/22 08:28

→ chons2332: 只能說你有68%的信心吧 04/22 08:48

→ wen17: 他用機率表示觀測到的結果的機率分布沒啥問題 04/22 10:05

→ wen17: 請注意他並不是說信賴區間 = = 他是說標準差 04/22 10:07

→ wen17: 兩者是不同的事情雖然你可以用標準差算信賴區間 04/22 10:07

→ wen17: 真的都該先去修統計 04/22 10:08

對，這邊直接用機率分布解釋比較直觀

→ wen17: 不過y大這樣講也可以挑點毛病啦= = 就是你講的是樣本標準差 04/22 10:46

→ wen17: 不過y大這樣講也可以挑點毛病啦= = 就是你講的是樣本標準差 04/22 10:52

→ wen17: 其實還要變換一下才能估計出母體標準差 04/22 10:54

這篇的解釋當然很多細節和假設都省略了啦，

→ wen17: 然後針對測試學生能力問題寫歷屆學測有個問題 04/22 10:55

→ wen17: 你找不到沒被汙染(沒寫過考古)的受試者 04/22 10:55

→ wen17: 此外課綱也有所不同 04/22 10:55

→ wen17: 所以真的要弄是要大考中心出模擬卷來測而不是寫考古就好 04/22 10:55

實驗當然能不斷改進啦，不過寫考古題就是個人人都能做的簡單評估方法，實際上大多數人也都有寫過歷屆試題的經驗，很容易就感受到分數波動有多大.. 而且如果連已經寫過考古題的受試者波動都那麼大了, 沒被汙染測出來的波動多半更大.. ※ 編輯: yoyun10121 (140.114.127.245), 04/22/2019 13:51:31

→ wen17: 不過說真的質疑這麼多之前能不能先念點基本的(?) 04/22 14:30

→ wen17: 不然沒有共同語言溝通成本太大了 04/22 14:30

→ wen17: 汙染那段是想說你測出來的很可能是汙染本身的偏向 04/22 14:44

→ wen17: ex:越靠近2年前的考古越貼和現在課綱的考古汙染度較大 04/22 14:44

推 redsa12: tway 04/23 05:49