看板 MobileComm 關於我們 聯絡資訊
我只能說不管怎樣 他們一定會侵犯隱私 人工審核照片的 如果是我來設計抓未成年影像的AI 我會先判斷年齡,用臉或是體形,判斷是否為未成年 再判斷圖片是否有裸露,性行為 當符合的特徵越多,就越有可能是未成年色情 你用hash抓到,當然毫無疑問,不需人工審核就知道是犯罪圖片 但未成年色情不只有那些已存在的,可以用hash辨識 還有新拍攝的,需要靠AI找出來的 像我上面講的,越多符合特徵的圖片篩出來, 再經由人工審核才有辨法判斷是否違法 hash是一種低效率手段,光是整理資料庫就是大工程 更別說數千萬計的圖片都要一張一張掃過,這個只能偶爾排程跑一次 或是先用AI抓出可疑圖片,再用hash掃過, 掃不到再交給人工審核 這樣才能縮小範圍,快速抓到違法圖片 我只能說雲端相簿都是沒隱私的 會怕的人可以把照片zip起來再丟雲端 或是自架NAS,自己的資料自己管 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.26.40.120 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/MobileComm/M.1628357507.A.C90.html
jason2641668: 你在上傳圖片的時候就會算 hash 值記在資料庫了... 08/08 01:39
jason2641668: 你傳上去的圖片hash值又不會變 = = 08/08 01:40
jason2641668: 如果你有看過大公司 Storage System 的 paper 的話 08/08 01:42
jason2641668: 基本上都會存 data 的 sha-1 08/08 01:42
vi000246 : 我說的是色情圖片的資料庫 每張圖都要loop這資料庫 08/08 01:55
vi000246 : 一次吧 08/08 01:56
jason2641668: Apple 現在的作法就是在你手機丟個 hash 資料庫 08/08 01:57
jason2641668: 你手機晶片都能運算的檢查 你覺得這樣會沒效率嗎 08/08 01:57
jason2641668: 現代資料庫也不會用 loop 一個一個比對 08/08 02:00
jason2641668: 你的想法是 hash 比對這件事情是 O(N) N=資料筆數 08/08 02:00
jason2641668: 可是實際上資料庫不是這樣運作的 08/08 02:00
jason2641668: 資料庫不要太大的話 比對的效率可以趨近於 O(1) 08/08 02:02
jason2641668: 你如果有興趣可以看一下 HashMap 跟 B-Tree 08/08 02:03
jason2641668: PS B-Tree 不是 O(1) 08/08 02:03
jason2641668: 這也不算現代了 幾乎都是二三十年前就有的東西 08/08 02:05
jason2641668: 現在都是在這上面做優化 所以肯定查的速度更快 08/08 02:05
vi000246 : 可是根據我逛過暗網看過的東西 應該不會是O(1) 08/08 02:06
jason2641668: 這不用暗網啊 資工大二的資料結構就有教了 = = 08/08 02:08
jason2641668: 資料結構是必修課 算是資工系的常識吧 08/08 02:09
jason2641668: https://i.imgur.com/NS9fpbe.png 08/08 02:13
jason2641668: 你可以不信我 但你要信一下 Google 08/08 02:13
s25g5d4 : 其實我覺得非蘋果員工在那邊幫蘋果擔心運算資源不足 08/08 02:14
s25g5d4 : 還蠻有趣的 08/08 02:14
trywish : 抓有兩種方式,兩種都對,一種的確是FBI資料庫,但 08/08 21:11
trywish : 另一種就是FB那種方式,偵測後自動判斷,連泳裝都能 08/08 21:12
trywish : 被當猥褻照片,只要多加幾個參數,就是原PO講的人工 08/08 21:12
trywish : 審核,至於蘋果要用哪種沒講,也應該不會講。所以考 08/08 21:13
trywish : 慮隱私,兩種加總才是答案,這也就是為什麼說,別用 08/08 21:13
trywish : 手機拍小孩,這也不是危言聳聽,想拍小孩記得買相機 08/08 21:14
trywish : 另外運算資源?FB雖很不穩,但有聽過是因為運算太兇 08/08 21:15
trywish : 出包嗎?中國那種審更兇地也都沒問題,不用你擔心啦 08/08 21:15
trywish : 喔,原文有講犯罪資料庫喔。但還是老話,別太相信那 08/08 21:25
trywish : 些人講法,今天他們不注重隱私,未來也不可能注重, 08/08 21:25
trywish : 像google已經好幾起抓好幾年前的人了,他們改變政策 08/08 21:26
trywish : 的話,被抓也不意外,雲端基本上沒隱私可言,不管哪 08/08 21:27
trywish : 個國家都一樣,而且別以為只有這類犯罪,版權物也一 08/08 21:27
trywish : 樣,放上雲端最好還是加密,不然你用10幾年帳號被凍 08/08 21:28
trywish : 就欲哭無淚了。 08/08 21:28
a1234567289 : 相似度搜尋並不是純hashmap的O(1)複雜度喔。詳情可 08/09 11:42
a1234567289 : 以搜An optimal Algorithm for Approximate Nearest 08/09 11:42
a1234567289 : Neighbor Searching in Fixed Dimensions這篇論文 08/09 11:42
a1234567289 : hashmap適用的條件是找物件“本身“ 但這裡的功能是 08/09 11:43
a1234567289 : 在做相似度的尋找 08/09 11:43
a1234567289 : 使用k-d樹的話找相似度的複雜度是O(log N) 08/09 11:50