作者hidog (.....)
看板Soft_Job
標題Re: [請益] 如何快速學習一個framework
時間Sun Jul 28 20:02:18 2013
※ 引述《Leon (Achilles)》之銘言:
: 這叫 skew detection..
: 用橢圓不太對, 應該用兩條 line 去 bound 住一行文字.
: 我查了一下, 網路上能夠 download 的文章
: http://cdn.intechopen.com/pdfs/11405/
: InTech-Preprocessing_techniques_in_character_recognition.pdf
專業術語我沒辦法像原po一樣的水平
這邊大概講一下我當時的做法
第一步是做二值化,
threshold的取法是先找中位數,
接下來利用低於中位數的值去計算平均值,標準差
偶後利用這個平均值標準差產生threshold
這部分是因為每張圖片的亮度差很多,所以採用這樣的做法
第二步是直接投影到 x, y軸去,利用histogram去找bound box
找出bound box後,就直接resize到22*32
這邊大概會有兩個問題, 一個是字體斷掉
另一個是會有雜點跟污損,而這邊的做法大概是
因為圖片只有 22*32, 所以以上問題直接針對case來做調整
副產品是因為 I 的字體寬度小於5pixel,直接解決1, I不分的問題
以演算法部分,其實算不上是演算法
但是以結果論,在deadline前面趕出一個可以用的版本
(記得給我兩天還三天吧,辨識錯誤率達到要求)
另一個問題,是要在圖片上面找出方形
█ █
▇ ▇
要求的做法是使用edge base的做法, 當時要求利用hough line來做
而我手上的hough line版本,能抓到的是直線而非線段
雖然找出直線後,可以搜尋出方形
但是直線延伸處,也會交出方形
這時候很難判斷這個方形到底是真的有方形,還是假的方形
特別是真的方形上面又疊了一個假的方形.
這邊我最後是選擇直接回到原圖比對,勉強可以有結果,
但是這樣的做法沒辦法被接受
自己希望加入region base的做法,但是直接被打槍 XD
用線段的方式則會卡在方形有缺損,這時候找出來的線段很容易斷掉.
其他雜項的話,圖片上可能會有其他線條,要能夠避免這些線條被當成方形
這個問題我目前正在搜尋,看有沒有比較好的解答
實際上這種問題應該已經有很多別人做出來的結果才對
也希望能有板友願意給小弟一些方向的參考 <(_ _)>
討論方向可能有點偏離soft_job的主軸
假如版主認為討論這樣的問題不妥,就請將我的文章刪除吧 :)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.160.175.25
推 hSATAC:這討論比原串有趣... 07/28 21:04
→ hidog:恩恩? 這是我當時卡住的問題 基本上還是想找出一個可用的解 07/28 21:07
→ TonyQ:原則上跟軟體有關,你要在版上討論演算法我們也不會管你..XD 07/28 23:16