看板 DataScience 關於我們 聯絡資訊
大家好 小弟想請教一個機率模型問題 最近在處裡一個預測訂房機率的問題 手上有兩個類型房間 單人房跟雙人房的歷史訂單數據 現在想預測的是兩個類型房間 在未來某一天被訂購的機率有多少 input features這邊先假設就是(日期, 房間類型, 各種feature) 這邊想請教的對於目標函數的設定 目前就是假定目標Y就是某個房間類型在某一天的訂購機率 現在很簡單的設定當天的訂購機率就是 某一天的訂購數量/房間數量 所以訓練數據的長相像是 (2019/12/01, 單人房, 各種feature, 訂購機率) 但現在遇到一個問題 這個機率會是一個離散的數字 比如說雙人房只有一間可以訂 他的目標機率要嘛是100% 要嘛是0% 但是單人房有100間,他的機率分布會比較漂亮 可以畫出一個近似高斯的圖形 想請教這種情況下 這個目標函數的設定是否合乎邏輯 有沒有辦法改善對於Y的定義 還請高手指教m(_ _)m -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 92.203.228.53 (日本) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1578811172.A.830.html
rockhotdog: 直接拿 是否(1/0)被訂購 這個feature做為target就好? 01/13 16:58
del680202: 嗯 ...直接對單筆紀錄做整理好像也行 01/14 11:24
Pieteacher: 想成1/0分群 在估算機率就好啦 01/14 23:18
Kazimir: 我是有點看不懂 一個硬幣投下去也不會有0.5的結果不是嗎 01/15 17:48
qwaszx780917: 覺得你要預測的比較不像是機率,應該比較像是單/雙 01/16 16:08
qwaszx780917: 人房的 訂房率 (例如 單人房被訂間數/全部單人房 01/16 16:08
qwaszx780917: 的房數) 01/16 16:08
qwaszx780917: 我的想法是直接預測訂單數 如果有收的話也把客滿接 01/16 16:19
qwaszx780917: 不下的訂單也納入預測target,預測完再轉成訂房比例 01/16 16:19
qwaszx780917: ,個人淺見供您參考 01/16 16:19
del680202: 感謝意見 01/16 18:37