看板 Kaohsiung 關於我們 聯絡資訊
其實我個人對於這一個問題也是有一些看法~ 不過還是針對我有興趣的問題來回覆一下。 先來說說偽陽(陰)性,基本上這一個問題有板有回覆過了, 有興趣的人可以自參照#1Weav5OP (Kaohsiung) 或是 條件機率的課題。 我想來聊聊的是"假設檢定",這是一個很有趣也很常看到的資訊但是大家確又貌似 不太了解,所以想來聊一下這一個問題,以下本文開始: 所謂假設檢定的概念其實很簡單,因為事實上我們無法真的作到普查(現在流行的用法是 普篩),所以我們只可以抽樣來看,然後猜一個可能的實際值看看有沒有機會被包含在 可能的機率範圍之中,這樣的概念就是假設檢定。 現在我們依據最熱門的一次抽樣確診者案1229的部份247(無確診)+1(案例本身), 所以就假定這是隨機的抽(事實上這應該比隨機抽的機率高) 那麼中獎的機率會是1/248 ,那麼我們可以算一下這樣狀況之下的標準差: [(1/248)*(1-1/248)/(248)]^0.5 大約是0.00402.., 接著我們看平均值1/248 大約是0.00403..,所以接下來我們看兩個標準差的值 0.00403..+2*0.0402..大約是0.012..,也就是說中獎的機率高於0.012的可能性大約是 2.5%左右,如果我們算三個標準差就會是0.016..,高於這一個值的可能性值接降到 0.0025以下,所以如果你說現在如果有得病的人的比例是高於2%,那科學界會說: 你的抽樣結果不支持你的假定。 這就是檢定假設。所以基本上你論文如果說高於1.2%就會有一堆人打你的臉了......。 但是我們不管就是任性的用1.2%來看目前高雄的檢測是不是應該多次快篩?我們先假定 大家都是最敏感的案例,快篩準確度結果直接上綱到95%,那麼偽陽性的機率會是0.0494 ,在來比對真的陽性0.0114,兩者的比值約是:4.33..也就是假的對象會是真的對象的 4.33倍,這就是為什麼會說偽陽性太多的結果。然後假的就消耗了更多的醫療資源!! 至於多作幾次會不會改變結果?依據取樣結果是常態分配,所以你一個正常的人作 很多次之後結果就會接近快篩告訴你的檢驗可能性95%正常、5%得病(當然還是會有特例) 所以這樣多作幾次你大概可以得知的是:藥廠表示的誤差率是不是有問題~ 如果對於抽樣有興趣的那就往下看吧~ 相信大家很常在選舉的時候看到電視的民調資訊有"信心水準", 或多或少的人有對這一個資訊充滿好奇,不過我相信多數的人就直接略過~ 所以我們就來談一下這個一個很有相關的"假設檢定",在聊這一個資訊之前我們有一些 要補齊的資訊:1.檢定樣本為常態分佈。2.二項式分佈量夠大的時候會接近常態分佈, 以上是必須有的資訊,我們簡單的解釋一下: 1-1.在統計分佈有很多種不一樣的圖型的形狀,其中有一項很特別的叫做常態分佈, 基本上就是很常出現的分佈圖型,所以就叫常態,這一個分佈有一個特色 就是68-95-99.5的配比關係,意思是離中央(平均值)的距離大的區間內發生的比例 越高,距離中央值一個標準差(距離的單位和一公分差不多)的範圍發生的機率是 68%,兩個標準差是95%,三個標準差99.5%。通常我們都是這樣表示 99.5 95 68 68 95 99.5 ([]內發生的機率) ---[----[----[----中----]----]----]--- 3 2 1 1 2 3 (標準差個數) 看不太懂可以看美圖https://reurl.cc/OXdMMR 1-2.所謂的"檢定樣本為常態分佈"意思是不管你原本的樣本分佈是怎樣的分佈,只要我們 作取樣看中籤(如:當選、得病......)的統計分佈圖就是常態分佈。所以是針對取樣 結果來說就是常態分佈,而非指原先的樣本是常態分佈,這點常常是誤解。 2.一般來說我們作的民調或是得病的取樣統計基本上多數都是"二項式分佈",而所謂的 二項式分佈則是稱"每次的取樣只有兩個結果(O 或 X)作很多次"。其實就是作很多次 是非題的概念。 基本上這樣就可以開始我們的假設檢定的內文的部份了。 所謂的假設檢定就是我們假設一個"可能的分佈比例結果",在用抽樣的方式去檢驗這樣 的可能性是不是存在,而信心水準指數就是說有多高的比例我的猜測範圍內的"假設結果" 是可能發生的。舉個例子如果我做出來的抽樣結果是0.5,我們標準差是0.1,那就是說 如果我的假定真實的結果是0.4~0.6之間,那真的被我猜到真實的結果在這一個範圍內 的比例是68%。那如果是0.2~0.8那被我猜中的比例就會有99.5%這麼高。 ※ 引述《lovebxcx (peiler :))》之銘言: : 統一一次講,都一年了,大家都長進點好嗎…不要再跳針偽陽偽陰… : Q1. 為什麼要普篩/廣篩/ whatever什麼篩? : A1. 為了要阻斷傳染,越早被篩檢出來,就越早被處置(隔離/治療) : Q2. 為什麼陽性率很低的地方,不追求普篩? : A2. 因為沒有傳染鍊存在,又何來阻斷傳染,驗了只是浪費錢。 : Q3. 那偽陽偽陰又是? : A3. 用來騙你的,偽陽偽陰從來都不是考慮該不該篩檢的因素。 : 簡單地說,假設偽陽的機率有1%,那你用一根篩檢棒有百分之1的機率誤判,一次用兩根 : 篩檢棒就只剩萬分之1,一次用三根篩檢棒的機率就只剩下百萬分之1,這就是現代人驗 : 孕一次買不同廠商的同時驗的理由。 : Q4. 那高雄該不該普篩? : A4. 不管高雄現在該不該「普篩」,也應該要建立快篩站了,全世界一年多來已經示範 : 給台灣看了,台北也示範了三天給其他縣市看,驗不到就當是演練流程也好,都已經一 : 年了,各國都在打疫苗解封,台灣人竟然還在為了篩檢排隊? : ※ 引述《tenfu (富哥)》之銘言 : : 台北快篩也只有萬華 : : 有沒有想過其他區域如 大安 信義 : : 為啥沒有快篩? 希望上篇酸的 可以來答一下 : : 平常各大醫院有一定篩檢量 : : 現在醫院也會去拼命篩 : : 當有趨勢顯示特定區域 : : 自然有可能如萬華設置 : : 現在就如同大安 信義沒設置快篩 : -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.166.43 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Kaohsiung/M.1621274764.A.A64.html
seraphimm : 半夜了趕快睡覺 05/18 02:07
別這樣阿~最近在複習量子力學,學量子計算難得轉換科目~追一下時事阿!!
darkMood : 這是政治問題,不是機率問題。 05/18 02:11
我一直以為防疫是科學問題~原來是政治問題阿!!
winterice20 : 我好像在聽sheldon說話QQ 05/18 02:17
TBBT嗎?哈~我還蠻喜歡看的~覺得好笑XDD
winterice20 : 有一點懂有一點不懂~ 05/18 02:20
可以提出來大家一起討論討論~
hancash : Simon大已經用科學化、數字化的方式解釋給大家參 05/18 03:42
hancash : 考了,看得懂的就ok,看不懂的會說哩供啥小! 05/18 03:42
hancash : 可還是有人會留言開始互嗆,一派認為這種說法可以 05/18 03:45
hancash : 接受(腦波弱?),然後另一派大概又會開始提出質疑 05/18 03:45
hancash : (跳針?) 05/18 03:45
hancash : 不然這樣,乾脆請四叉貓、qn、潔哥、蔡阿嘎來解說 05/18 03:48
hancash : 好了,反正科學家的說法聽不懂,那就找非專業人士 05/18 03:48
hancash : 來說吧 05/18 03:48
Johnny1108 : 好像回到高中數學 05/18 04:00
tingstart : 防疫是科學問題,但我們沒疫苗,呵呵 05/18 05:14
tingstart : 名嘴還說疫苗拿到先給友邦的呢 05/18 05:15
leinru : 滾 05/18 05:38
siekensou000: 推 05/18 05:47
misson : 大陸就是蓋方艙,把篩到的人管你偽陰、還是陽性, 05/18 06:21
misson : 全部塞進去住十四天,中期、出院再篩,有的繼續關, 05/18 06:21
misson : 沒事的放出來 05/18 06:21
misson : 這種把人強制抓進去住的安排,是又有多少人能接受? 05/18 06:23
joydow : 怎麼會用案1229推論,應該直接看台北快篩的偽陽性率 05/18 06:43
joydow : 就好吧 05/18 06:43
signorr : 樓主有提到 #1Weav5OP,那篇文章講出了思考上的誤區 05/18 06:50
signorr : ,一陰一陽 必定暫時依照"確診者"來對待,符合現實 05/18 06:51
signorr : 狀況。看政府一開始有避開這方面不科學的作法 05/18 06:54
signorr : 替這次疫情避免損耗不必要的戰備物資和人力 05/18 07:00
kings0904 : 但疫情真的不能用常態分布來看阿........ 05/18 07:41
我想這邊有點小誤解~所以來解釋一下,並不是把這次的疫情分佈作為常態分佈來看, 而是針對取樣結果所成的機率函數分佈視為常態分佈。 舉例來說:如果我們丟銅板,分佈只會有兩種可能(正、反),所以基本上就是二項式分佈 但是如果你把丟10次的結果作一筆數據,如:正面的次數(可能性會有11種)。 如此稱為一次試驗,接著做100次這樣的試驗(就是丟1000次的硬幣),這樣你會有100 筆數據,而這100筆數據就會呈現趨近常態分配。 所以是實驗的統計數據結果成常態分配,非指原樣本分佈為常態分配。 因此才有辦法可以做假設檢定。
sugenwei : 繼續邁邁萬歲。結案 05/18 07:50
alice0514 : 專業推 05/18 07:59
brfiyu : 推 05/18 08:14
malisse74 : 為什麼叫別人滾 05/18 08:19
ww1234528 : 某些推文在氣什麼 05/18 08:20
namie520 : 中國的方艙 別人很難學 主因是不只需要把這些人 05/18 08:37
namie520 : 跟一般人隔離 他們彼此之間也要有很好的隔離 否 05/18 08:37
namie520 : 則根本群聚煉蠱 光這點就很難做到 還要找足夠的 05/18 08:37
namie520 : 醫護 攜帶足夠的裝備 來照顧他們 這每一點都甚 05/18 08:37
namie520 : 難啊 05/18 08:37
namie520 : 中國不在意煉蠱 反正如果都群聚感染 就處理掉好 05/18 08:42
namie520 : 了 韭菜到處是 就好像武漢到底死了多少人 數字 05/18 08:42
namie520 : 始終是個謎 05/18 08:42
namie520 : 但我們就很難 如果沒能提出確實完善 的地方 就想 05/18 08:42
namie520 : 把人丟進去 只怕會引爆更大的恐慌 甚至可能讓人 05/18 08:42
namie520 : 民拒絕篩檢 05/18 08:42
somanyee : 太難了,看不懂XD 05/18 08:43
我在想想有什麼更好的說法 @.@
soyjay : 這篇好像在複習大學統計課~ 社會科學做問卷很常用到 05/18 08:48
jganet : 有的人知識與訊息來自於名嘴。我是建議喔。不如好好 05/18 08:56
jganet : 聽天線寶寶在說什麼 05/18 08:56
ds1441 : 連看都沒看,寫一大串通常是護航仔 05/18 09:05
klvs : 推你啦 05/18 09:10
tingstart : 相信網路寫手也是不錯的建議,加油 05/18 09:12
alaroom : 普篩仔的能力看不了這篇啦,前幾樓有人示範了 05/18 09:19
alaroom : 相信名嘴不相信科學也是很有智慧 05/18 09:20
macaron5566 : 暖 05/18 09:29
LZzzz : 推 05/18 09:45
wingthink : 我不喜歡上生統課XD 05/18 09:47
Linezolid : S大解釋的比我生統老師好太多了 05/18 09:53
ahbbbbb : 好好笑 早上上統計看到這個好親切 05/18 09:56
sharkleos : 量子檢測,你想測就有,你想測沒有就沒有 05/18 10:01
sanwan : 太難了,我大腦只能接受一句話解釋 05/18 10:25
tkucuh : 疫苗又是另一個問題:在第一批AZ進來前,我們一直向 05/18 10:25
tkucuh : 外採購疫苗,姑且不論是不是有對岸介入,但我們買的 05/18 10:26
tkucuh : 量少,施打率又不高,防疫又做得不錯,那自然會拿疫 05/18 10:26
tkucuh : 苗去做外交,不過這點我是存疑啦,因為理論上也不會 05/18 10:27
tkucuh : 有什麼廠商會鳥台灣,比較有可能是大量採購方式然後 05/18 10:28
tkucuh : 把多餘的轉給友邦,因為台灣打不到那些數量。 05/18 10:28
yun0112 : 台灣簽約的量已經是符合人口數的了,如果像加拿大那 05/18 10:28
yun0112 : 種簽約五倍,那才真的詭異 05/18 10:28
yun0112 : 之前沒疫情的時候光是AZ價格就有立委就吵說買貴要彈 05/18 10:30
yun0112 : 劾官員 05/18 10:30
ARCHER2234 : 呃,結果反政府反到不相信科學的是要信神學嗎?還是 05/18 10:48
ARCHER2234 : 信發大財 05/18 10:48
Carrarese : 專業 05/18 11:14
show282 : 爛死了,你說5%偽陽性機率,那這次就有12個偽陽性 05/18 11:30
show282 : 被驗出 05/18 11:30
show282 : 結果驗出是0個,還在偽陽性5% 05/18 11:30
seigtmh : 那個快篩不會只用一種試劑,而且快篩完還是要跑pcr 05/18 11:35
seigtmh : 跟隔離,自然看不到偽陽性5%,而且該擔心的反而是 05/18 11:35
seigtmh : 偽陰性,怕他們知道自己是陰性就不遵守隔離或自主 05/18 11:35
seigtmh : 管理政策,到處亂跑 05/18 11:35
jorden : 隔離還是最有效政策 快篩只是分流 特定熱區篩檢有效 05/18 11:37
keroro870123: 這篇很有內容了不要看到作者就噓好嗎... 05/18 12:08
hancash : 這篇本來就有內容了,像我那篇全篇廢話就被噓到爆 05/18 12:28
hancash : 啊! 05/18 12:28
marc47 : https://pansci.asia/archives/197883 05/18 12:47
Annis812 : 不用幫黨寫這麼多字 政治凌駕專業 就這樣 05/18 13:59
chowyc : 推有內容,但統計實在是讓人霧裡看花XDD 05/18 18:36
有可能這樣的結果是來自於我的描述不夠清楚,所以可以提出不清楚的地方討論討論。
sendicmimic : 你寫這些看起來不是要讓大家懂,反而像要幫黨開脫. 05/18 18:37
sendicmimic : 站方不讓你繼續在這個板裝中立實在太好了 05/18 18:39
其實針對你這樣的內容沒什麼好回覆的,如果有哪裡不符合科學計算的概念可以提出來, 難道科學也要考慮黨的立場?如果是有利黨的資訊就是幫黨說話?還是你有資訊我領 黨的薪水?我想什麼是中立應該是顯而易見了。 不過如果你在意的是我是不是中立,那你就看不到我更在乎的是科學怎麼討論。
albam : 有個問題95%篩兩次篩不出來的機率只有5%*5% 05/18 21:34
albam : 怎麼會篩很多次還是接近95%....這個推論很詭異 05/18 21:34
這件事情可以這樣想,你丟一次銅板想得到正面的機率是1/2(如果是公正的), 兩次正面的機率是1/4,我想你的想法應該是這樣,但這是你考慮特定的樣本型態 (連續兩次正面),當你考慮的是都100萬次的正面和總次數的比值時是不是又回到了1/2 這就是統計學有趣的地方。而我說的95%正是這一個概念。根據藥廠的實驗數據告訴你 95%很準,僅5%是錯誤的,你做很多次自然也應該得到這一個數據結果,如果不是~那可能 是因為個人因素或是藥廠不實。
terry1128 : 其實你忽略了當取樣數夠多的時候,你的結果會更趨 05/18 22:13
terry1128 : 近於常態分佈,你的CPK夠高的時候,你的模型信任度 05/18 22:13
terry1128 : 才是高的,這個疫情在很多國家失控在於你用傳統的 05/18 22:13
就"假設檢定"來說其中的一個假設是:如果你做得夠多次,而這次的試驗是你做得夠多次 的某一次試驗整合出一個值(暫稱整合值),且你猜測了一項做了夠多次的整合值結果的 中央值,討論這樣的中央值是否屬於可能發生的可能?這才是假設檢定,並不是實際的 我就看我這100筆或是1000筆的數據的分佈狀況。這塊也是常有的誤會。 所以我們看民調樣本數多數都是1000上下筆數,做到2000的也不會特別的準 ,原因是1000筆數據的統計的信賴區已經很小了,2000增益部份實在是不大。 然就是假設檢定常給人的誤解,以為1000筆數據的分佈就是數據本身討論的分佈, 事實上數據討論的分佈是1000筆資料視為某一特定的樣本資料(整合值),用所有可能的 方式去建構成的樣本資訊,但事實上我們根本沒去建立這一個可能的樣本資訊,而是 直接經由二項式分配在極大化的狀況之下所構成的結果 => 常態分配直接套用。 因此"檢定假設"只可以用來檢驗你所假設的中央值是否有可能發生,而無法去真的知道 中央值的結果。
terry1128 : 傳染病模型去推估,目前最重要的就是建立新的模型, 05/18 22:13
terry1128 : 才有辦法對未來的狀況做準備 05/18 22:13
傳染病的傳播還可以用SIR模型來看,如果有興趣~也是可以來一篇來討論討論。 ※ 編輯: simonjen (114.25.166.43 臺灣), 05/18/2021 23:22:13