看板 DataScience 關於我們 聯絡資訊
小弟文字探勘新手 最近想要分析一筆資料 Y是APP的評分 1到5 我有每個APP的官方英文敘述 就是APP的功能是啥 以下是文字敘述的範例 The eBay app is the best way to find anything you need, from dresses, handbags and fashion accessories to new & used cars. Browse our inventory of millions of products from sellers locally and globall. 請問有甚麼文字探勘的模型可以做到嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.91.75.186 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1583574957.A.A0F.html
xiangying: 目的是要做什麼?03/07 19:00
empireisme: 預測評分,找出評分高的關鍵字03/07 19:17
ddavid: 我怎麼覺得這問題定義就很奇怪03/08 04:08
ddavid: App的評分是評功能而不是評說明文字啊XD03/08 04:08
ddavid: 兩個App可以有超級接近的關鍵字集,因為做的是同一個功能03/08 04:09
ddavid: ,但是使用者評分可以天差地遠,因為實際用起來的好壞03/08 04:09
ddavid: 如果你要硬套 說明文字 -> 使用者評分 去做預測模型,可以03/08 04:10
ddavid: 當然是可以,但我只覺得會garbage in garbage out03/08 04:11
ddavid: 自己邏輯想想就知道,你用App會因為它的介紹文字寫比較好03/08 04:12
ddavid: 或者用了特定字眼就給它評比較高分嗎,不會吧。03/08 04:12
那如果我的資料是使用者評論的話,有什麼推薦的模型關鍵字嗎? ※ 編輯: empireisme (49.216.49.183 臺灣), 03/08/2020 12:22:32
penolove5566: 統計正面負面的字詞數不就行了? 03/08 14:44
goldflower: kaggle就有amazon review的比賽呀 可以去看看 03/08 17:19
ddavid: 一般的text mining就做得到了吧,Bag-of-words做完套個合 03/08 23:30
ddavid: 理的分類器就可以做個基本架構了 03/08 23:31
ddavid: 但是你如果連Bag-of-words都還不知道,表示連text mining 03/08 23:32
ddavid: 的基礎根本都還沒開始看,你要做的不是找model,是Google 03/08 23:32
ddavid: text mining然後把基礎看一看 03/08 23:32
patrick2dot0: 如果只是要預測分數 03/08 23:36
patrick2dot0: word embedding後接個RNN就行吧 03/08 23:38