作者doomdied (Died)
看板Soft_Job
標題Re: [請益] 如何選擇影像辨識工具?
時間Fri Dec 1 17:48:09 2017
※ 引述《kingx163 (果醬貓)》之銘言:
: 各位版友好
: 小弟剛接觸影像辨識沒有多久
: 看到目前有yolo, Azure Computer Vision,
: Cloud Vision API等等可以選擇
: 請問各位年薪300w大大都用哪一種呢?
: 另外,應該如何判斷用哪家的呢?
: 謝謝!
YOLO是model
Azure Computer Vision跟Google Cloud Vision API都是platform
你應該先釐清你的需求,才知道要用何種工具/framework/model
不然就像是問網友出發要搭啥交通工具,卻連要去哪裡都沒說一樣
我最近也自學Computer Vision/Machine Learning,可以給你一點建議
有些需求AOI就可以解決,有些用CV效果會更好,有些需要用到ML其良率才能接受
如果剛接觸這塊,可以先玩一下OpenCV,看一些早期的論文
了解一下以前在做CV時是怎麼用GLCM,小波之類的特徵去辨識
現在如果不是自己從頭寫,已經不太會接觸到這塊了
直接拿現成Model network去使用或train都難度很低
剛好這幾天做了個投影片,你可以參考一下,簡單展示了CV跟ML可以做的東西
https://goo.gl/SYEvbe (一直按 > 就可以照著flow播了)
據我自學的認知,Machine Learning裡,
跟CV比較有關的就是Classification跟Object Recognition
簡單來說Classification就是辨識這張圖是啥
Object Recognition是認出圖內的物體位置與名稱,你說的YOLO就是這種
屬於R-CNN家族之一,它家族大概是這樣:
R-CNN, Fast R-CNN, Faster R-CNN, YOLO, SSD, R-FCN....(最後一個我沒試過)
如果只是想做Computer Vision,建議你玩OpenCV
如果要用Machine Learning,我前陣子有寫篇很雜的心得在fb社團
https://www.facebook.com/groups/616369245163622/permalink/1204406499693224/
那時候邊忙邊寫,寫得很亂也沒整理,簡單來說是這樣
平台: linux/ubuntu最多人用,windows資源比較少
語言: C++/python吃遍天下,其他語言看運氣
Framework:Caffe還是最多,tensforflow最近比較熱門,Keras似乎也不少人用
Torch有點老了,CNTK微軟努力推當中(至少社群回應蠻熱情的)
如果你只是想測效果,用OpenCV DNN Moudle去讀 Model來測
找到你需要的model再選擇要用怎麼環境改成production
這樣可以少花很多時間在建置環境上
大致上是這樣,如果要問怎麼建模的話我還沒學到那,只會很簡單的CNN,就幫不上忙了
--
上班不務正業的證據
http://died.tw
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.250.150.39
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1512121699.A.1D5.html
推 senjor: 熱心推 12/01 17:53
推 smalldra: 整理推 12/01 18:03
推 dali17dali17: 推 12/01 19:48
→ dragon229: 熱心推,但YOLO跟SSD不是R-CNN家族的。 12/01 22:47
我看feature類似就當作同家族了XD,畢竟沒有完整學習過
推 hizuki: 求推薦參考書,也需要補全數學知識 12/02 12:11
http://course.fast.ai/lessons/lessons.html
我沒看書,要補知識網路上不少course,上面這個可以看看
想快速瞭解可以看一下微軟的講解
https://goo.gl/64Pjse
篇幅不長,如果沒接觸過也蠻好懂的
推 jjwei: push 12/02 14:41
推 FreeGeng: 推! 12/02 19:57
推 yupog2003: 推整理,可以看到很多關鍵字 12/02 21:22
推 ant00039: 推 12/03 01:37
※ 編輯: doomdied (122.116.29.31), 12/03/2017 22:54:38
推 howayi: 圖像問題還有segmentation (還分 semantic, instance) 12/11 20:21
→ howayi: framework方面未來有潛力的是 caffe2 tensorflow pytorch 12/11 20:23