推 xiangying: 目的是要做什麼?03/07 19:00
→ empireisme: 預測評分,找出評分高的關鍵字03/07 19:17
推 ddavid: 我怎麼覺得這問題定義就很奇怪03/08 04:08
→ ddavid: App的評分是評功能而不是評說明文字啊XD03/08 04:08
→ ddavid: 兩個App可以有超級接近的關鍵字集,因為做的是同一個功能03/08 04:09
→ ddavid: ,但是使用者評分可以天差地遠,因為實際用起來的好壞03/08 04:09
→ ddavid: 如果你要硬套 說明文字 -> 使用者評分 去做預測模型,可以03/08 04:10
→ ddavid: 當然是可以,但我只覺得會garbage in garbage out03/08 04:11
→ ddavid: 自己邏輯想想就知道,你用App會因為它的介紹文字寫比較好03/08 04:12
→ ddavid: 或者用了特定字眼就給它評比較高分嗎,不會吧。03/08 04:12
那如果我的資料是使用者評論的話,有什麼推薦的模型關鍵字嗎?
※ 編輯: empireisme (49.216.49.183 臺灣), 03/08/2020 12:22:32
推 penolove5566: 統計正面負面的字詞數不就行了? 03/08 14:44
推 goldflower: kaggle就有amazon review的比賽呀 可以去看看 03/08 17:19
推 ddavid: 一般的text mining就做得到了吧,Bag-of-words做完套個合 03/08 23:30
→ ddavid: 理的分類器就可以做個基本架構了 03/08 23:31
→ ddavid: 但是你如果連Bag-of-words都還不知道,表示連text mining 03/08 23:32
→ ddavid: 的基礎根本都還沒開始看,你要做的不是找model,是Google 03/08 23:32
→ ddavid: text mining然後把基礎看一看 03/08 23:32
→ patrick2dot0: 如果只是要預測分數 03/08 23:36
→ patrick2dot0: word embedding後接個RNN就行吧 03/08 23:38