※ 引述《Leon (Achilles)》之銘言:
: : 第一步是做二值化,
: : threshold的取法是先找中位數,
: : 接下來利用低於中位數的值去計算平均值,標準差
: : 偶後利用這個平均值標準差產生threshold
: : 這部分是因為每張圖片的亮度差很多,所以採用這樣的做法
: 這樣做會有嚴重的問題.
: shot noise, 或是打光不均勻, 你會得到一個很差的 binary image
請教一個問題,是說類似這個情況嗎
http://www.wretch.cc/album/show.php?i=hidog&b=2&f=1135712532&p=12
A是斷掉的,中間有一條白線 (註: 白線255, 底色是淺灰色 我放上去的圖底色是255)
當時確實也碰過,這邊是用heuristic的方式救回來
: 而且救不回來.
: 一般的作法是先用 histrogram normalization,
感謝 這邊讓我學到一課!!
: 解決亮度不均勻.
: 再用 filter 幹掉 shot noise.
上面禁止使用filter的理由蠻多的
例如....
"雜訊不是不好,我要保留雜訊"
"不要隨便加一道filter上去"
所以當我第一句話開口說要加上filter的時候,就直接打槍了
: 當然, 所有的作法都是 heuristic, 但是直接 make it into binary
: 除非你有特殊的要求, 不然問題很多.
確實是有特殊要求沒錯
因為接手recognized的人想要一張二值化的圖來取某些特徵
而當時我的想法是
"既然都要二值化了,何不先做二值化,用二值化的圖來求出resize的縮放比例"
這邊誠如原po所講的,第一步沒做好,後面都是只能補破洞
因為後面的做法大概就是設一堆magic number,解決有限case
無法解決的,丟入辨識失敗,讓辨識失敗率能接受就好 (汗)
那篇paper不錯,因為接手這個案子的時候,我完全沒碰過OCR
: 上面聽起來真是混亂.
: 我的 comment 是, 你第一步做得不好, 後面應該就..
http://www.wretch.cc/album/show.php?i=hidog&b=2&f=1135712531&p=11
類似這種感覺
一個P字旁邊有一個點,而我必須能把這個點移除.
這邊當時也是magic number解決有限case
假如L大方便的話,希望能得到您的建議
: 用 hough transform 是對的, 因為圖片 (鈔票) 很固定
: 你可以加入一些條件去限制住 bounding box 的範圍.
第二個問題的對象並不是鈔票,這邊我沒講清楚,很抱歉
http://www.wretch.cc/album/show.php?i=hidog&b=2&f=1135712533&p=13
這是當時碰到的一個case
而我寫出來的code,會容易連同旁邊的框線也一併抓進來
例如灰色的方形,實際上edge比較強的反而是旁邊的黑框.
這邊自己的做法是,把圖片丟入一個轉換
----
\
\
---------
類似這樣的函數,讓灰色的方形的edge強度增強
(這邊原本是用tanh, 為了加速所以改成piesewise linear)
缺點是本來不應該有edge的地方,也會被加強edge,而抓出多餘的方形
http://www.wretch.cc/album/show.php?i=hidog&b=2&f=1135712534&p=14
這是另一個case
旁邊的黑線可以想像成是ㄧ維條碼
而我的code會在條碼區找到方形 XD
(回去追hough line的資料,這些線確實組成了方形....)
綠色方形旁邊的黑點是圖片的一部分
這邊我的code會抓出多個方形,目前是回報最小的那個
框線跟方形的的距離最近大概是3~5pixel左右
而這邊,我當時沒辦法只靠自己思考想出解決方式的做法
(hough line報了一堆方形回來,必須精準的挑出哪些是正確的)
: 我知道的都是一些很 advanced 的作法, computational power 要求都很高.
: 舉個例子來說吧, 更難的人臉範圍 bounding 在 Iphone 上都做得那麼好了
: 你的問題, 也絕對有人已經處理過了.
: So, keep google..
感謝 :)
下面這邊算是閒聊吧
面試的時候我有提到,我沒有影像處理的經驗
主管當時說,沒關係,進來在學就好
進來後說,上班是工作,學習是下班後的事情 XD
(不過這邊並沒有管到非常死,
只是常被念看一堆資料能幹嘛,找paper是回家的事情之類的)
這似乎是台灣常有的思維,請不起有經驗的,就隨便找一個人進來...
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.160.171.183
※ 編輯: hidog 來自: 118.160.171.183 (07/29 09:15)