→ jason2641668: 你在上傳圖片的時候就會算 hash 值記在資料庫了... 08/08 01:39
→ jason2641668: 你傳上去的圖片hash值又不會變 = = 08/08 01:40
→ jason2641668: 如果你有看過大公司 Storage System 的 paper 的話 08/08 01:42
→ jason2641668: 基本上都會存 data 的 sha-1 08/08 01:42
→ vi000246 : 我說的是色情圖片的資料庫 每張圖都要loop這資料庫 08/08 01:55
→ vi000246 : 一次吧 08/08 01:56
→ jason2641668: Apple 現在的作法就是在你手機丟個 hash 資料庫 08/08 01:57
→ jason2641668: 你手機晶片都能運算的檢查 你覺得這樣會沒效率嗎 08/08 01:57
→ jason2641668: 現代資料庫也不會用 loop 一個一個比對 08/08 02:00
→ jason2641668: 你的想法是 hash 比對這件事情是 O(N) N=資料筆數 08/08 02:00
→ jason2641668: 可是實際上資料庫不是這樣運作的 08/08 02:00
→ jason2641668: 資料庫不要太大的話 比對的效率可以趨近於 O(1) 08/08 02:02
→ jason2641668: 你如果有興趣可以看一下 HashMap 跟 B-Tree 08/08 02:03
→ jason2641668: PS B-Tree 不是 O(1) 08/08 02:03
→ jason2641668: 這也不算現代了 幾乎都是二三十年前就有的東西 08/08 02:05
→ jason2641668: 現在都是在這上面做優化 所以肯定查的速度更快 08/08 02:05
→ vi000246 : 可是根據我逛過暗網看過的東西 應該不會是O(1) 08/08 02:06
→ jason2641668: 這不用暗網啊 資工大二的資料結構就有教了 = = 08/08 02:08
→ jason2641668: 資料結構是必修課 算是資工系的常識吧 08/08 02:09
→ jason2641668: 你可以不信我 但你要信一下 Google 08/08 02:13
推 s25g5d4 : 其實我覺得非蘋果員工在那邊幫蘋果擔心運算資源不足 08/08 02:14
→ s25g5d4 : 還蠻有趣的 08/08 02:14
→ trywish : 抓有兩種方式,兩種都對,一種的確是FBI資料庫,但 08/08 21:11
→ trywish : 另一種就是FB那種方式,偵測後自動判斷,連泳裝都能 08/08 21:12
→ trywish : 被當猥褻照片,只要多加幾個參數,就是原PO講的人工 08/08 21:12
→ trywish : 審核,至於蘋果要用哪種沒講,也應該不會講。所以考 08/08 21:13
→ trywish : 慮隱私,兩種加總才是答案,這也就是為什麼說,別用 08/08 21:13
→ trywish : 手機拍小孩,這也不是危言聳聽,想拍小孩記得買相機 08/08 21:14
→ trywish : 另外運算資源?FB雖很不穩,但有聽過是因為運算太兇 08/08 21:15
→ trywish : 出包嗎?中國那種審更兇地也都沒問題,不用你擔心啦 08/08 21:15
→ trywish : 喔,原文有講犯罪資料庫喔。但還是老話,別太相信那 08/08 21:25
→ trywish : 些人講法,今天他們不注重隱私,未來也不可能注重, 08/08 21:25
→ trywish : 像google已經好幾起抓好幾年前的人了,他們改變政策 08/08 21:26
→ trywish : 的話,被抓也不意外,雲端基本上沒隱私可言,不管哪 08/08 21:27
→ trywish : 個國家都一樣,而且別以為只有這類犯罪,版權物也一 08/08 21:27
→ trywish : 樣,放上雲端最好還是加密,不然你用10幾年帳號被凍 08/08 21:28
→ trywish : 就欲哭無淚了。 08/08 21:28
推 a1234567289 : 相似度搜尋並不是純hashmap的O(1)複雜度喔。詳情可 08/09 11:42
→ a1234567289 : 以搜An optimal Algorithm for Approximate Nearest 08/09 11:42
→ a1234567289 : Neighbor Searching in Fixed Dimensions這篇論文 08/09 11:42
→ a1234567289 : hashmap適用的條件是找物件“本身“ 但這裡的功能是 08/09 11:43
→ a1234567289 : 在做相似度的尋找 08/09 11:43
推 a1234567289 : 使用k-d樹的話找相似度的複雜度是O(log N) 08/09 11:50