看板 Soft_Job 關於我們 聯絡資訊
※ 引述《Leon (Achilles)》之銘言: : 這叫 skew detection.. : 用橢圓不太對, 應該用兩條 line 去 bound 住一行文字. : 我查了一下, 網路上能夠 download 的文章 : http://cdn.intechopen.com/pdfs/11405/ : InTech-Preprocessing_techniques_in_character_recognition.pdf 專業術語我沒辦法像原po一樣的水平 這邊大概講一下我當時的做法 第一步是做二值化, threshold的取法是先找中位數, 接下來利用低於中位數的值去計算平均值,標準差 偶後利用這個平均值標準差產生threshold 這部分是因為每張圖片的亮度差很多,所以採用這樣的做法 第二步是直接投影到 x, y軸去,利用histogram去找bound box 找出bound box後,就直接resize到22*32 這邊大概會有兩個問題, 一個是字體斷掉 另一個是會有雜點跟污損,而這邊的做法大概是 因為圖片只有 22*32, 所以以上問題直接針對case來做調整 副產品是因為 I 的字體寬度小於5pixel,直接解決1, I不分的問題 以演算法部分,其實算不上是演算法 但是以結果論,在deadline前面趕出一個可以用的版本 (記得給我兩天還三天吧,辨識錯誤率達到要求) 另一個問題,是要在圖片上面找出方形 ▇ 要求的做法是使用edge base的做法, 當時要求利用hough line來做 而我手上的hough line版本,能抓到的是直線而非線段 雖然找出直線後,可以搜尋出方形 但是直線延伸處,也會交出方形 這時候很難判斷這個方形到底是真的有方形,還是假的方形 特別是真的方形上面又疊了一個假的方形. 這邊我最後是選擇直接回到原圖比對,勉強可以有結果, 但是這樣的做法沒辦法被接受 自己希望加入region base的做法,但是直接被打槍 XD 用線段的方式則會卡在方形有缺損,這時候找出來的線段很容易斷掉. 其他雜項的話,圖片上可能會有其他線條,要能夠避免這些線條被當成方形 這個問題我目前正在搜尋,看有沒有比較好的解答 實際上這種問題應該已經有很多別人做出來的結果才對 也希望能有板友願意給小弟一些方向的參考 <(_ _)> 討論方向可能有點偏離soft_job的主軸 假如版主認為討論這樣的問題不妥,就請將我的文章刪除吧 :) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.160.175.25
hSATAC:這討論比原串有趣... 07/28 21:04
hidog:恩恩? 這是我當時卡住的問題 基本上還是想找出一個可用的解 07/28 21:07
TonyQ:原則上跟軟體有關,你要在版上討論演算法我們也不會管你..XD 07/28 23:16