看板 Python 關於我們 聯絡資訊
大家好 小弟最近在學習中文sentiment analysis 目前想對PTT文章的情緒做分類 我找到的中文語料庫大多是中文維基或者新聞的 比較少PTT的情緒分類語料 請問現在有好用的PTT語料庫可以用來training嗎? 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.121.85 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1574909269.A.281.html
penut85420: 可以試著自己爬看看,PTT Web還蠻好爬的 11/28 11:54
penut85420: 這是小弟以前以谷歌關鍵字為入口的PTT爬蟲,參考看看 11/28 11:56
penut85420: https://git.io/JeXMZ 11/28 11:56
CodingMan: 可以用 PTT Library 可以下關鍵字搜尋 11/28 12:01
CodingMan: 不用下載你不在意的資料 減少資料清洗時間 11/28 12:02
CodingMan: https://github.com/Truth0906/PTTLibrary 11/28 12:02
DeepLearning: 推 PTT Library 穩定好用 作者回覆問題很快 11/28 13:36
nesiron: 感謝大家XD,我都用看看 11/28 17:21