看板 DataScience 關於我們 聯絡資訊
最近在學貝氏分類器,看了很多網路上的文章, 證明過程我都能理解,但是一直對結論很頭痛。 假設X為特徵向量,N為標籤類別;給定一組特徵向量x,用貝氏分類器判斷屬於哪一類別 為什麼是比較P(X=x|N=n1)P(X=x|N=n2)的大小, 而不是比較P(N=n1|X=x)P(N=n2|X=x)的大小呢? 直覺來說,給定一組特徵,在已知此特徵的條件下,比較各類別的條件機率感覺很合理? 以下面這個網站的範例來說: http://hadoopspark.blogspot.com/2016/05/spark-naive-bayes.html 給定特徵向量[高氣壓,濕度51~60,西風],判斷該情況會不會下雨。 他比較了P(高氣壓,濕度51~60,西風|會下雨)P(高氣壓,濕度51~60,西風|不下雨)兩者的大小,判斷出不會下雨。 但給定特徵向量了,為什麼不是比較 P(會下雨|高氣壓,濕度51~60,西風)P(不下雨|高氣壓,濕度51~60,西風)的大小? 困擾好幾天了,爬了好多文都沒解釋到這一部份,求大大們解惑, 感激不盡! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 117.56.186.8 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1561195666.A.6D8.html
jiyu520: 這是條件機率定義吧 06/22 18:26
jiyu520: 在此“資料”-->進行“分類” 06/22 18:29
youngman77: 想求的是你說的後驗,按照Bayes rule把後驗展開成: 06/22 18:38
youngman77: P(會)P(特徵|會)和P(不會)P(特徵|不會)比較大小 06/22 18:38
jiyu520: 可是和原PO說的一樣..我也有點困惑了@@ 06/22 18:38
yiefaung: https://i.imgur.com/HVhGLdD.jpg 06/22 20:04
jiyu520: 感謝樓上 06/22 20:48
Dminor: 看來關鍵是前面有乘以一個類別的機率,我漏看了@@ 06/23 22:52
Dminor: 感謝各位 06/23 22:52
erre: 你有call package嗎… 06/24 06:57