[問題] OCR（光學辨識）推薦書籍或函式庫

作者tonytonyjan (南洋大兜蟲)

看板CSSE

標題[問題] OCR（光學辨識）推薦書籍或函式庫

時間Wed Nov 2 22:21:14 2011

有鑑於在像 komica 這類的討論版或論壇回覆時都夾帶圖片，而圖片上常常會有字幕或者是漫畫角色的台詞，笑果十足但是要蒐集這些東西其實很累，於是我有個 idea：我打算實做一個 content based image search engine 對圖片上的文字，經過辨識之後做 indexing 如此只要把想要的話輸入進去，就可以找到任何相關動漫或電影台詞的引用圖片（我 google 老半天發現這世界好像還沒有這樣的搜尋引擎，讓我更想做了）我有IR背景知識，但對於圖形辨識完全不得其門而入希望在圖形辨識上有經驗的人可以給我一些指引我目前試過 tesseract, gocr 不過經過測試我發現他們似乎主力在「文件」，對於卡通圖片中的文字辨識能力薄弱問題： 1. 對於我的需求，我要找得技術是 OCR 沒錯吧？或者我弄錯關鍵字了？ 2. 如果關鍵字確實是 OCR，是否有其他適合辨識圖畫（非文件）的函式庫？ 3. 接續 2，有什麼推薦的書籍，可以學習如何實做一個 OCR system 呢？感激不盡^_^ PS. 這是自娛專案，有興趣參與的人也可來信 XD -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.246.1 ※ 編輯: tonytonyjan 來自: 140.113.246.1 (11/02 22:22)

推 kewang:還蠻有趣的，要不要試試MODI這個library，不過要安裝OFFICE 11/02 22:55

→ tonytonyjan:但我要跑在 UN*X Server上耶，這樣 MODI 沒問題嗎 11/02 23:01

推 hilorrk:關鍵字：字幕辨識/擷取.. 11/03 01:03