作者kaltu (ka)
看板DataScience
標題[問題] ROC worse than random
時間Mon Mar 11 20:22:41 2019
問題類別:(ex:ML,SVM,RL,DL,RNN,CNN,NLP,BD,Vis,etc...)
資料科學
使用工具:(ex:python,Java,C++,tensorflow,keras,MATLAB,etc...)
Python sklearn
問題內容:
背景
目前試圖用GAN來處理small dataset的問題
用的是一個大約五十個病人的直腸癌MRI影像
有放射科醫師label的KRAS值,0和1
基本思路是先切成5個fold然後各用DCGAN對0和1label產生一千、共一萬張slice
然後把generated data跟著true data下去用VGG19判斷label
問題
產生的K-fold ROC是漂亮的worse than random
http://i.imgur.com/YhS1O0B.jpg
查了網路文章,有人說這代表我的classifier依然建立了correlation
只是data preparation出問題
簡單解法就把label flip即可
請問真的是這樣嗎?總覺得不大對勁
-----
Sent from JPTT on my Asus ASUS_Z01KDA.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.173.65.97
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1552306963.A.9E3.html
推 andrew43: 我會建議先檢查全部code,很可能只是個低級錯誤。 03/11 21:02
推 andrew43: 於是發現翻轉就是正確結果也說不定。 03/11 21:05
→ erre: 無言… 你有call package嗎 03/12 14:03
推 phoenixlife: 我知道這招 DCGAN產圖當input你要慎重 03/27 08:48
→ sma1033: DCGAN產出的圖你確定會跟原本的圖有相同性質?打個問號.. 03/27 13:16