作者be00148 (有新信件還沒看)
看板Python
標題[問題] google ocr api的辨識問題
時間Thu Jun 23 14:25:35 2022
一直以來都有使用google cloud vision的api來幫我做圖片辨識
但是最近常會發生 段落亂跳的問題
讓我無法依據過去經驗擷取我要的文字
例如一本書的辨識
過去會一行一行辨識下來
標題
內文
頁碼
但是現在可能會由左至右 的方式
可能變成
標題
頁碼 (因為頁碼在最左邊)
內容
不曉得是不是有什麼參數可以去調整?
還是我必須將圖片的背景改成單一顏色,讓他不會亂區分段落?
感謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.163.220 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1655965537.A.100.html
推 papple23g: 辨識結果有附文字框座標 可以用 相對位置+正則表達式判 06/24 01:02
→ papple23g: 斷 來決定讀字的順序 06/24 01:03