看板 Python 關於我們 聯絡資訊
不好意思我目前想學習有關語意分析這塊 那我做了些功課後發現,使用python是最簡單的 我想問各位,我對語意分析的用法是不是有錯 我想實用在抓取關鍵字 例如去某個網站,利用Python先斷詞,再把出現的次數最高的依序抓出來,這樣就能知道 哪個關鍵字最熱門,進一步做推論 請問我這樣的想法有錯嗎?python可以做到這樣嗎?感謝各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.242.90.187 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1447240570.A.6D7.html
ccwang002: Python 可以做到。想法也正確。不過實際上複雜很多 11/11 19:18
ccwang002: 例如你覺得 Python 這個版斷完詞之後哪些詞最熱門? 11/11 19:19
ccwang002: 不意外會有 Python,但我想「問題」「錯誤」也會很熱門 11/11 19:19
ccwang002: 更 general 一點,中文高詞頻有你、大家,商品有漂亮 11/11 19:20
bibo9901: 想法很OK 但是細節很多 11/11 19:20
ccwang002: 這些詞次數高,但會是關鍵字嗎?就要進一步要思考 11/11 19:21
flarehunter: 樓上說的是TF-IDF吧 11/11 21:39
ccwang002: 恩恩,還有 LDA HDP 甚至用 word2vec 做 clustering 11/11 21:48
sa0124: 推薦你可以用jieba斷詞 語意分析好多東西可以玩耶 從你的 11/12 09:40
sa0124: 敘述可以先做TF-Idf 11/12 09:40
aa000017: sk-learn和gensim這兩個套件可以拿來用,之前用來做過to 11/20 17:27
aa000017: pic modeling和clustering 11/20 17:27
aa000017: scikit-learn,剛才打到簡稱=x= 11/20 17:31
new122851: 這牽涉到超多..我現在在搞text SVM classification 12/05 01:58