看板 SENIORHIGH 關於我們 聯絡資訊
你只要用科學實驗的觀點去理解考試,邏輯就很簡單了 現在假設我們今天做一個牛頓定律的力學實驗, 所以我們要測量滑車的速度來證明 F=ma, 有基本科學常識的人一定都知道實驗一定有誤差, 所以實驗一定會重複多次再取平均,以盡量減少誤差求得真實的速度。 那用這例子來看下面你所提出的問題: ※ 引述《cookiesweets (3m)》之銘言: : 標題: Re: [新聞] 獨/盼留一半名額給指考...高中師給蔡總 : 時間: Sun Apr 21 19:58:47 2019 : : : : 我其實不太懂w大這邊想表達的邏輯 : : 先說我確實沒學過統計,因此有錯請指正 : : : : 的確,我同意題目越多/考越多次考試,獲得的結果一定更準,沒意義的切細分數不會增加 : 可信度 : : 但是亂切細分數沒有用,不等於切細“一定”沒用吧? : : 如果我們固定題數都是50題。你切成100分一題兩分,一定比切成十五級要有鑒別度啊? : : 我沒有辦法理解 : “在沒有增加題目數的情況下切太細沒有意義”這是對的 假設我們做五次實驗, 測量到的速度分別是 5, 8, 4, 9, 13, 7, 6, 8 m/s, 這八筆數據的平均是 7.5、標準差是 2.8, 考慮到有效位數,科學上會寫成 8+-3 m/s 用來表示誤差範圍, 統計上的意義是你每做一次實驗, 有68%的機率測量到的速度會落在 4.7 ~ 10.3 m/s的範圍內 95%的機率測量到的速度會落在 1.9 ~ 13.1 m/s的範圍內。 所以刻度要多細才有意義?? 如果目的是拿來比較差異的話,科學上通常至少會要求兩倍的標準差, 也就是你今天如果你測量到6+-3 m/s, 另個人量到8+-3 m/s, 科學上會跟你說這叫做結果吻合沒有差異... 如果今天測量到 6+-3 m/s, 另個人量到15+-3 m/s,這才叫能分的出差異 所以拿來比較的刻度不是隨便定的,而是要參照你實驗誤差有多少... 有這樣大的誤差,把測量速度的刻度調成0.1 m/s 甚至0.0001 m/s 都完全沒意義 : 但是要怎麼推論到15級不輸100分呢? : : 不然讓我滑坡理論一下,難道100分分成五級,20分一個級距,這樣你會覺得比100分好嗎? : : 然後回到上面說的,學測的初衷。 : : 你說想測量的是一個人每天能力的平均值 : : 但是這是“你認為”吧?這並不是共識 : : 事實上,在壓力下如何調適自己的心情,以及在短時間內如何有爆發力,這是很重要的人格 : 特質 : : 高中學的東西,跟大學比根本微不足道,大學要的學生是聰明,扛的住壓力的學生。 : : 如果想測量一個人平均的實力,也有繁星了。 就像前面講的,科學測量會盡量平均多次數據來減少誤差,得到比較準確的結果 所以你量到的速度是 5, 8, 4, 9, 13, 7, 6, 8 m/s,平均的結果是8 m/s 其中13 m/s那次的結果叫做極端數據,直接拿出來當結果報告就等著準備被當掉... 考試的誤差來源可不只壓力,考試題目抽題有沒有剛好抽到考生會/不會的題目, 甚至到考生當天身體狀況都是誤差來源... 大學想看的當然是學生長期整體的學習表現, 不是評估當天早上考生有沒有烙賽,也不是看你運氣好不好有讀的題目有沒有都有抽到.. : : : → cookiesweets: 這樣說好了,你多錯一題,兩題,這跟運氣相關度高 04/21 20:16 : → cookiesweets: 嗎? 04/21 20:16 : → wen17: 頂尖高手可能不高 但是除此之外的 挺高的吧 04/21 20:17 : → cookiesweets: 國文作文或許是吧(所以這吵很久)。但是譬如數學 04/21 20:19 : → cookiesweets: ,基本題大家都會,難題就那幾題,那種題目多對一 04/21 20:19 : → cookiesweets: 題,就足以說明某位學生確確實實比其他人更優秀。 04/21 20:19 : → cookiesweets: 而照你的說法,多對那一題好像只是那位學生運氣比 04/21 20:19 : → cookiesweets: 較好,而沒有給他任何實質獎勵(級分一樣) 04/21 20:19 你所謂的運氣,正是考試的誤差來源之一, 所以在評估考試這個實驗的誤差時,當然要把運氣的影響也算進去 : → wen17: 你高估了台灣學生平均程度 04/21 20:19 : → wen17: 你有興趣可以找找幾本比較完善的考古題參考書 04/21 20:20 : → wen17: 都會一題一題標註正解率.... 04/21 20:20 : → wen17: 很多時候你所謂的基本題 對於很多中等程度的學生來講 04/21 20:22 : → wen17: 就是看他腦袋今天有沒有靈光一閃 有就答得出來 沒有就GG 04/21 20:22 : → wen17: 當然我能體會您認為都是基本題的理由 因為的確對於程度好 04/21 20:22 : → wen17: 的學生來講 真的都很簡單 解法大概一眼看出去就找到 04/21 20:23 : → wen17: 至於中等程度的學生是我家教救火隊的經驗 04/21 20:23 : → wen17: 所以說 您質疑的理由是認為 ex數學考科 沒啥運氣考量? 04/21 20:24 : → wen17: 當然如果您質疑這點成立 的確我的理論會不成立 04/21 20:25 : → cookiesweets: 是,我認為運氣成分不大,至少沒大到要把一個級距 04/21 20:27 : → cookiesweets: 設定那麼寬 04/21 20:27 : → cookiesweets: 譬如作文,我就贊同像國中那樣6級分制。用級距方式 04/21 20:28 : → cookiesweets: 來降低運氣和人為誤差值 04/21 20:28 運氣成份大不大是可以測量的,不需要靠感覺.. 就像實驗可以重複做一樣,考試的誤差只要多寫幾屆試題就能知道.. 要實驗目前的級分會不會太高很簡單, 連續寫十屆的考題,如果有至少過兩次你拿到不同的級分,就只代表目前級分還太細.. 如果今天算的是總級分還有誤差累計問題, 有幾個人能連寫十屆考題,有九次都拿到完全一樣的總級分的?? 實際測試就很明白告訴你考試的誤差超大,現在級分制根本還追不上這誤差... 同一個人同一天寫不同屆試題總級分都有差了,這差異放到大學四年有什麼意義?? : → cookiesweets: 另外有個問題是,壓力當下的反應,確實是一個重要 04/21 20:31 : → cookiesweets: 的人格特質。以榜首醫學系來說,我不想要一個一大 04/21 20:31 : → cookiesweets: 考就肚子痛的人幫我開刀 04/21 20:31 : → cookiesweets: 這種人在大考被淘汰也算是一種鑒別度 04/21 20:32 你這邊完全假設誤差只有壓力, 但實際上光你前面說的運氣影響可能就大更多... 要怎麼分辨分數差異是來自壓力,不是運氣或其他因素?? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.236.215 ※ 文章網址: https://www.ptt.cc/bbs/SENIORHIGH/M.1555871163.A.056.html
ddss: 草莓族養成訓練營? 大聯盟 NBA 或是找工作的面試有這麼面面 04/22 03:04
ddss: 俱到? 面試官要考量球員、應徵者各式各樣的突發狀況予以寬 04/22 03:05
ddss: 容錄取? 沒被錄取家長是否要跨海告大聯盟 NBA 或是公司說甄 04/22 03:06
ddss: 選、面試流程沒考量我而我女的當下狀況就刷掉 要求不斷測試 04/22 03:08
ddss: 直到錄取為止? 04/22 03:09
ddss: 是在害下一代還是在訓練下一代 傻傻分不清 04/22 03:10
因為私人公司選人不用考慮公益性所以隨他們高興, 我有認識的竹科主管,只要看到來的是女的就優先錄取, 你覺得大學申請也要比照這標準才更能訓練下一代??
SunSky0126: 把NBA跟政府比太不恰當了吧= = 04/22 05:02
installbtien: 不是68%的機率吧 是信心水準 04/22 08:02
SeanLyee: 我怎麼記得信心水準不代表事件發生的機率= = 04/22 08:28
chons2332: 只能說你有68%的信心吧 04/22 08:48
wen17: 他用機率表示觀測到的結果的機率分布沒啥問題 04/22 10:05
wen17: 請注意他並不是說信賴區間 = = 他是說標準差 04/22 10:07
wen17: 兩者是不同的事情 雖然你可以用標準差算信賴區間 04/22 10:07
wen17: 真的都該先去修統計 04/22 10:08
對,這邊直接用機率分布解釋比較直觀
wen17: 不過y大這樣講也可以挑點毛病啦= = 就是你講的是樣本標準差 04/22 10:46
wen17: 不過y大這樣講也可以挑點毛病啦= = 就是你講的是樣本標準差 04/22 10:52
wen17: 其實還要變換一下才能估計出母體標準差 04/22 10:54
這篇的解釋當然很多細節和假設都省略了啦,
wen17: 然後針對測試學生能力問題 寫歷屆學測有個問題 04/22 10:55
wen17: 你找不到沒被汙染(沒寫過考古)的受試者 04/22 10:55
wen17: 此外課綱也有所不同 04/22 10:55
wen17: 所以真的要弄是要大考中心出模擬卷來測 而不是寫考古就好 04/22 10:55
實驗當然能不斷改進啦, 不過寫考古題就是個人人都能做的簡單評估方法, 實際上大多數人也都有寫過歷屆試題的經驗,很容易就感受到分數波動有多大.. 而且如果連已經寫過考古題的受試者波動都那麼大了, 沒被汙染測出來的波動多半更大.. ※ 編輯: yoyun10121 (140.114.127.245), 04/22/2019 13:51:31
wen17: 不過說真的 質疑這麼多之前 能不能先念點基本的(?) 04/22 14:30
wen17: 不然沒有共同語言 溝通成本太大了 04/22 14:30
wen17: 汙染那段是想說你測出來的很可能是汙染本身的偏向 04/22 14:44
wen17: ex:越靠近2年前的考古 越貼和現在課綱的考古 汙染度較大 04/22 14:44
redsa12: tway 04/23 05:49