看板 R_Language 關於我們 聯絡資訊
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 現在收集完需要分析的字詞 要建構出字詞與字詞間的關聯性,會以節點與連線的方式呈現。 假設關鍵字中Apple Apple是節點 連線出去連結到的節點就是與之相關的關鍵字 像是iOS、iPhone、iPad等等 1.想了解有那些Package能夠做到文字關聯性分析的效果 2.那些Package可以把計算完的結果視覺化成節點與連線的樣式 [程式範例]: 自己還沒開始寫 但找到Normalized Google distance法 Normalized Google distance是用google的搜尋當基礎 資料量計算強度後會證明兩字關聯性 若兩者越接近0表示兩字關聯越強的方式計算 但不太知道還有沒有更精確的方法可以做做看 [環境敘述]: 目前抓取的字詞約800多筆 以CSV檔案的形式存取 由於小弟的目標是論文的關鍵字 所以同一篇論文使用的關鍵字會存在同一行 [關鍵字]: 字詞 計算文字關聯 視覺化(節點與連線) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.238.37.101 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1439745890.A.A6C.html
Wush978: 也許用word2vec 加上一些高維度資料的視覺化工具 08/17 20:57