作者del680202 (HANA)
看板DataScience
標題[問題] 請教一個機率問題
時間Sun Jan 12 14:39:30 2020
大家好 小弟想請教一個機率模型問題
最近在處裡一個預測訂房機率的問題
手上有兩個類型房間 單人房跟雙人房的歷史訂單數據
現在想預測的是兩個類型房間 在未來某一天被訂購的機率有多少
input features這邊先假設就是(日期, 房間類型, 各種feature)
這邊想請教的對於目標函數的設定
目前就是假定目標Y就是某個房間類型在某一天的訂購機率
現在很簡單的設定當天的訂購機率就是 某一天的訂購數量/房間數量
所以訓練數據的長相像是
(2019/12/01, 單人房, 各種feature, 訂購機率)
但現在遇到一個問題 這個機率會是一個離散的數字
比如說雙人房只有一間可以訂 他的目標機率要嘛是100% 要嘛是0%
但是單人房有100間,他的機率分布會比較漂亮 可以畫出一個近似高斯的圖形
想請教這種情況下 這個目標函數的設定是否合乎邏輯
有沒有辦法改善對於Y的定義
還請高手指教m(_ _)m
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 92.203.228.53 (日本)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1578811172.A.830.html
推 rockhotdog: 直接拿 是否(1/0)被訂購 這個feature做為target就好? 01/13 16:58
→ del680202: 嗯 ...直接對單筆紀錄做整理好像也行 01/14 11:24
→ Pieteacher: 想成1/0分群 在估算機率就好啦 01/14 23:18
→ Kazimir: 我是有點看不懂 一個硬幣投下去也不會有0.5的結果不是嗎 01/15 17:48
推 qwaszx780917: 覺得你要預測的比較不像是機率,應該比較像是單/雙 01/16 16:08
→ qwaszx780917: 人房的 訂房率 (例如 單人房被訂間數/全部單人房 01/16 16:08
→ qwaszx780917: 的房數) 01/16 16:08
推 qwaszx780917: 我的想法是直接預測訂單數 如果有收的話也把客滿接 01/16 16:19
→ qwaszx780917: 不下的訂單也納入預測target,預測完再轉成訂房比例 01/16 16:19
→ qwaszx780917: ,個人淺見供您參考 01/16 16:19
→ del680202: 感謝意見 01/16 18:37