看板 Python 關於我們 聯絡資訊
小的我最近在學爬蟲、以及文字處理這塊,想到 不知到有沒有辦法利用文字分析得到一個程式讓輸入 一個知名人士或機構能夠得出相關的外號。 這樣在做文章的文字判讀時的資料量會多一 點,還是其實有更好的做法呢? 舉例像搜尋郭台銘會跳出郭董,台灣積體電路 公司會跳出台積電等等 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.27 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1568604831.A.52D.html
justoncetime: 若內文只有「郭台銘」沒有「郭董」,你期待的結果? 09/16 12:12
jiyu520: Google NER 09/16 12:30
bibo9901: 不只NER, 還有entity linking + information extraction 09/16 12:48
bibo9901: 並不是那麼簡單的 09/16 12:48
jiyu520: NER概念有包括樓上講的啊 09/16 18:42
shala: 中共的關鍵字技術應該是目前最強的 09/17 22:27