作者Leon (Achilles)
站內Soft_Job
標題Re: [請益] 如何快速學習一個framework
時間Mon Jul 29 02:16:44 2013
※ 引述《hidog (.....)》之銘言:
: ※ 引述《Leon (Achilles)》之銘言:
: : 這叫 skew detection..
: : 用橢圓不太對, 應該用兩條 line 去 bound 住一行文字.
: : 我查了一下, 網路上能夠 download 的文章
: : http://cdn.intechopen.com/pdfs/11405/
: : InTech-Preprocessing_techniques_in_character_recognition.pdf
: 專業術語我沒辦法像原po一樣的水平
: 這邊大概講一下我當時的做法
你應該去修課, ( open class 應該有 image processing )
或是把上面那篇好好讀一讀, 學習整個 image pre-processing for OCR.
: 第一步是做二值化,
: threshold的取法是先找中位數,
: 接下來利用低於中位數的值去計算平均值,標準差
: 偶後利用這個平均值標準差產生threshold
: 這部分是因為每張圖片的亮度差很多,所以採用這樣的做法
這樣做會有嚴重的問題.
shot noise, 或是打光不均勻, 你會得到一個很差的 binary image
而且救不回來.
一般的作法是先用 histrogram normalization,
解決亮度不均勻.
再用 filter 幹掉 shot noise.
當然, 所有的作法都是 heuristic, 但是直接 make it into binary
除非你有特殊的要求, 不然問題很多.
: 第二步是直接投影到 x, y軸去,利用histogram去找bound box
: 找出bound box後,就直接resize到22*32
: 這邊大概會有兩個問題, 一個是字體斷掉
: 另一個是會有雜點跟污損,而這邊的做法大概是
: 因為圖片只有 22*32, 所以以上問題直接針對case來做調整
: 副產品是因為 I 的字體寬度小於5pixel,直接解決1, I不分的問題
: 以演算法部分,其實算不上是演算法
: 但是以結果論,在deadline前面趕出一個可以用的版本
: (記得給我兩天還三天吧,辨識錯誤率達到要求)
上面聽起來真是混亂.
我的 comment 是, 你第一步做得不好, 後面應該就..
: 另一個問題,是要在圖片上面找出方形
: █ █
: ▇ ▇
: 要求的做法是使用edge base的做法, 當時要求利用hough line來做
: 而我手上的hough line版本,能抓到的是直線而非線段
: 雖然找出直線後,可以搜尋出方形
: 但是直線延伸處,也會交出方形
: 這時候很難判斷這個方形到底是真的有方形,還是假的方形
: 特別是真的方形上面又疊了一個假的方形.
: 這邊我最後是選擇直接回到原圖比對,勉強可以有結果,
: 但是這樣的做法沒辦法被接受
: 自己希望加入region base的做法,但是直接被打槍 XD
: 用線段的方式則會卡在方形有缺損,這時候找出來的線段很容易斷掉.
: 其他雜項的話,圖片上可能會有其他線條,要能夠避免這些線條被當成方形
: 這個問題我目前正在搜尋,看有沒有比較好的解答
: 實際上這種問題應該已經有很多別人做出來的結果才對
: 也希望能有板友願意給小弟一些方向的參考 <(_ _)>
: 討論方向可能有點偏離soft_job的主軸
: 假如版主認為討論這樣的問題不妥,就請將我的文章刪除吧 :)
用 hough transform 是對的, 因為圖片 (鈔票) 很固定
你可以加入一些條件去限制住 bounding box 的範圍.
我知道的都是一些很 advanced 的作法, computational power 要求都很高.
舉個例子來說吧, 更難的人臉範圍 bounding 在 Iphone 上都做得那麼好了
你的問題, 也絕對有人已經處理過了.
So, keep google..
--
趙客縵胡纓,吾鉤霜雪明。銀鞍照白馬,颯沓如流星。
十步殺一人,千里不留行。是了拂衣去,深藏身與名。
閑過信陵飲,脫劍膝前橫。將炙啖朱亥,持觴勸侯贏。
三杯吐然諾,五嶽倒為輕。眼花耳熱後,意氣素霓生。
就趙揮金錘,邯鄲先震驚。千秋二壯士,烜赫大梁城。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 76.170.77.110
推 typepeter:原原PO是我學長,他是數學系轉行的 影像處理可能沒碰過 07/29 03:29
推 hidog:說到這個 當時禁止我用filter處理noise問題 XD 07/29 07:09
→ hidog:再來就是 第二個問題 對像並不是鈔票 07/29 07:12
→ hidog:圖片基本上是隨機 也會出現方形顏色跟底色很接近的case 07/29 07:14
→ hidog:至於google 最後一天還被說是不是要拔你網路線才能專心 QQ 07/29 07:15
→ hidog:這部分目前還是回到google 以及openCV 因為網路上也有找到 07/29 07:26
→ hidog:別人做好的code XD 07/29 07:26
→ hidog:所以其實還是回到第一句話 最近打算去大學旁聽 建立觀念 07/29 07:27
→ hidog:工作部分則是找part time性質的 充實自己中 07/29 07:29
推 hidog:不過還是感謝原po 因為原po蠻專業的!! 07/29 07:33
推 ccccboom:我記得直方圖等化是很前面的章節耶 07/29 09:11
推 hidog:我其實沒修過相關課程 (汗) 07/29 09:14
→ xsoho:去借一本頁數最少的影像處理書翻一下就好 07/29 19:36
推 yangyr:最後一天還專心啥啊?o.O 這主管是怎樣.. 07/29 22:42