作者ms0344303 (我不玩了)
看板DataScience
標題[問題] 想找適合預測佔比組成的模型
時間Mon Jan 11 13:50:25 2021
作業系統:linux
問題類別:ML、DL、Optimization
使用工具:python3
問題內容:
小弟我遇到一類問題,需要預測一個母體中的各項item的組成成分比例
所以Target可能有A,B,C,D+others五種構成 五種加起來總合為1(100%)
因為是同一母體,所取得用來預測的特徵或訊號是一樣的
等於我要用同一組預測五種Y(預測結果舉例: A20%, B30%, C10%, D10%, others30%)
看了一下Sklearn的 multiple output regression並沒有適合的限制式模型(限制總預測需小於1)
而如果要自己設計模型
目前想到的是用簡單神經網路BPNN 加上客製化的MSE Loss funciton
除了五種Y的MSE加總外再加上懲罰項α(Sum(yA+yB+yC+yD+yOthers)-1)^2
不知道我這樣構想有無缺漏,因為就算這樣好像也不能保證神經網路出來的總和必定小於1?
還是有更適合的模型
已經爬很久了 都沒有類似的收穫
Beta Regression很類似我需求但沒有往Multiple Y拓展的參考
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.214.202.244 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1610344227.A.1A5.html
→ patrick2dot0: softmax + cross entropy?! 01/11 16:04
→ ms0344303: softmax畢竟比較偏向classification 不確定是否能用來 01/11 17:28
→ ms0344303: 預測真正的比例回歸問題 01/11 17:28
→ wtchen: 要不要考慮無/半監督式模型?藉助原資料結構來預測? 01/11 18:18
推 patrick0302: 卡位 我也有這樣的研究需求.. 01/11 18:21
推 tigon6260: 試試看最後一層softmax,loss用mse,能符合限制,又能 01/11 21:17
→ tigon6260: 做regression 01/11 21:18
推 bearz: 預測結果的總和當分母算比例不行嗎? 01/18 02:55
推 p122607: 我也覺得直接算比例就可以了? 01/18 18:35
推 mewtwo: linear programming + penality function 01/18 21:07
推 ruokcnn: Softmax最合啊 01/21 15:12
→ ruokcnn: Loss用mse +1 01/21 15:13