→ ccwang002: Python 可以做到。想法也正確。不過實際上複雜很多 11/11 19:18
→ ccwang002: 例如你覺得 Python 這個版斷完詞之後哪些詞最熱門? 11/11 19:19
→ ccwang002: 不意外會有 Python,但我想「問題」「錯誤」也會很熱門 11/11 19:19
→ ccwang002: 更 general 一點,中文高詞頻有你、大家,商品有漂亮 11/11 19:20
→ bibo9901: 想法很OK 但是細節很多 11/11 19:20
→ ccwang002: 這些詞次數高,但會是關鍵字嗎?就要進一步要思考 11/11 19:21
推 flarehunter: 樓上說的是TF-IDF吧 11/11 21:39
→ ccwang002: 恩恩,還有 LDA HDP 甚至用 word2vec 做 clustering 11/11 21:48
推 sa0124: 推薦你可以用jieba斷詞 語意分析好多東西可以玩耶 從你的 11/12 09:40
→ sa0124: 敘述可以先做TF-Idf 11/12 09:40
推 aa000017: sk-learn和gensim這兩個套件可以拿來用,之前用來做過to 11/20 17:27
→ aa000017: pic modeling和clustering 11/20 17:27
推 aa000017: scikit-learn,剛才打到簡稱=x= 11/20 17:31
推 new122851: 這牽涉到超多..我現在在搞text SVM classification 12/05 01:58