→ vi000246 : 不可能吧 這樣每上傳一張照片 就要掃上萬次hash 08/07 21:44
→ vi000246 : 效率很低耶 08/07 21:44
→ vi000246 : 不過zip起來就沒事了 根本抓不到 08/07 21:44
哪裡效率低 xdddd
推 LastAttack : 以下開放卓_,果_,中國機_互咬 08/07 21:45
→ Medic : 應該是自己的手機就算出hash值 等上傳時提供該值 08/07 21:46
推 fmatt : hash值應該可以用轉檔的方式改變? 08/07 21:46
可以 只要一個 pixel 不一樣 hash 值就會變了
推 MengXian : 30678這個代號XD 08/07 21:47
推 hms5232 : 一樓的意思是算出檔案雜湊值後還要和資料庫比對 08/07 21:48
請相信我這兩件事情 在現代資訊科學技術都做得非常快了
都是一年成本 100 萬美金以內可以搞定的
→ nevikw39 : hash 值是會碰撞的 無限大的定義域映射到有限的值域 08/07 21:48
→ hms5232 : 當然這個我相信一定有辦法解決 先不說有沒有什麼 08/07 21:48
→ hms5232 : 搜尋法 你上傳後他再慢慢比對就好 08/07 21:49
※ 編輯: jason2641668 (140.113.0.229 臺灣), 08/07/2021 21:52:47
→ hms5232 : 雜湊碰撞的問題也不算難解決 演算法更新或是符合時 08/07 21:50
→ hms5232 : 再抓檔案出來比對就好 畢竟要常常發生碰撞的機會也 08/07 21:50
→ hms5232 : 不會太多(雜湊演算法不要太舊的話 08/07 21:50
→ Medic : 現在怕的是 是不是不上傳 手機也會比對資料庫 只差 08/07 21:50
→ Medic : 再如果上傳 就把答案上傳 XD 08/07 21:51
推 Barefoot24 : 按照這方法,只要Genius或小畫家加工不就繞過了 08/07 21:53
→ hollen9 : 掃hash是防堵已知兒色 08/07 21:53
→ hollen9 : 第一手兒色還是要倚賴AI和人工 08/07 21:53
推 hms5232 : 我相信比對很快 只是好像有人誤會一樓是指計算雜湊 08/07 21:57
推 roc074 : 上傳這種東西靠壓縮檔能避開嗎? 08/07 21:57
可以 你用 7zip 加密
或是一些黑科技的加密算法
除非 FBI 有意要查你 不然不可能自然掃掃的出來
不過還是不鼓勵違法啊
→ hms5232 : 很慢 08/07 21:57
→ hms5232 : 不過比對雜湊值這個有沒有啥方法加速我就不知道了 08/07 21:57
→ hms5232 : 另外 ho大說的沒錯 大家自己想想Google相簿和FB怎麼 08/07 21:58
→ hms5232 : 幫你找臉孔對應的就知道現在對圖片的分析已經很強了 08/07 21:58
雜湊值其實就是資料庫的字串比對而已
用最一般的 B-Tree 資料庫有加 index 要判斷其實速度很快
(更何況還有一堆新穎的技術)
總之雜湊值比對真的很 EZ 啦
我一個研究生給我足夠的錢 我都有信心可以處理 iCloud 量的雜湊值比對
推 roc074 : 了解,我沒有違法的東西,只是我上傳私人東西都會 08/07 22:01
→ roc074 : 習慣用7z壓縮並加上密碼... 08/07 22:01
那就穩
小案子你用 7z + AES-256 我猜台灣政府應該是沒能力解
(如果是大案子會找國外的公司處理就不好說)
※ 編輯: jason2641668 (114.34.224.21 臺灣), 08/07/2021 22:03:57
推 hugh509 : 微軟的也會掃,從很久以前就明白告訴使用者了 08/07 22:03
推 nevikw39 : 其實 Google 最近也有新聞 08/07 22:07
推 Luos : md5? 08/07 22:09
→ Luos : 這根music fingerprint 又不一樣 08/07 22:10
推 roc074 : MD5不安全,現在應該都是用sha1的樣子 08/07 22:10
→ Luos : 單純就是每張圖算一個hash 丟去跟server比對? 08/07 22:11
→ Xperia : Apple跟Google都有相關規定,也就證明了Apple引以 08/07 22:11
→ Xperia : 為傲的隱私保障可不包含雲端空間 08/07 22:11
→ Luos : 這樣 原圖截一點 或者縮小 算出來的hash不就不一 08/07 22:13
→ Luos : 樣了? 08/07 22:13
我不確定 Apple 算 Hash 的方式有沒有黑科技
廣義的 Hash 確實一個 pixel 不一樣就不一樣
因為就我所知有一些優化方式是可以部份取樣的 取樣出有問題在完整比對
如果剛好取到那段一樣的特徵 一樣 gg
所以別做壞事才是真的
※ 編輯: jason2641668 (114.34.224.21 臺灣), 08/07/2021 22:20:01
→ roc074 : 光靠截圖或是改變解析度大概都逃不過 08/07 22:19
推 ZnOnZ : 專業推 08/07 22:22
→ square4 : 電子包漿跟副檔名的問題 08/07 22:28
※ 編輯: jason2641668 (114.34.224.21 臺灣), 08/07/2021 22:29:43
推 Luos : 這樣真的就像music fingerprint 的算法 08/07 22:32
推 HOLAHOJIAN : Google很早就有了啊,最近才上新聞 08/07 22:36
推 duckbill360 : 所以其實蘋果沒有掃描你的照片‘內容’,只是掃描你 08/07 22:37
→ duckbill360 : 客戶端產生出的照片Hash值而已?? 08/07 22:37
推 CJhang : 下載被解壓縮 調色 裁剪 都會不一樣吧 08/07 22:37
→ q02210221 : google雲端就有人被抓了 08/07 22:43
推 s25g5d4 : 哪裡有說到蘋果是用 hash 值比對違規檔案的? 08/07 22:44
https://techcrunch.com/2021/08/05/apple-icloud-photos-scanning/
推 tommy123310 : 意思是犯罪者如果上傳一手的照片就繼續逍遙法外? 08/07 22:55
這我不敢保證
不過 Google 的確定會抓 下面那篇有新聞
台灣人拍未成年表妹的鮑魚
自產應該是第一手
總之還是違法的事情不要做 QQ
推 tom282f3 : hash很容易跑掉欸 隨便編輯一下就完全不一樣了 08/07 22:56
→ tom282f3 : 不知道他們實務上怎麼判斷 說不定還是跟Google一樣 08/07 22:56
→ tom282f3 : 用AI識別 08/07 22:56
Apple 好像就是想要宣稱這種方式比較不會侵犯隱私 (也確實)
※ 編輯: jason2641668 (114.34.224.21 臺灣), 08/07/2021 22:57:54
→ qss05 : 為什麼要一張一張比對,如果真的有色情圖的資料庫 08/07 22:58
→ qss05 : ,又真的是用hash比對,他只要去select你上傳的ha 08/07 22:58
→ qss05 : sh有沒有出現在裡面就好了,0.0x秒的事,可是我覺 08/07 22:58
→ qss05 : 得不可能這樣做,就像前面講到的,只要有變動,他 08/07 22:58
→ qss05 : 就會改變hash,你不可能知道上傳人變動什麼,而且 08/07 22:58
→ qss05 : 每天會有多少要上傳,又有多少新的出現,這樣去檢 08/07 22:58
→ qss05 : 查根本不合理,你說用圖像辨識去確認,感覺還比較 08/07 22:58
→ qss05 : 有機會,也許你的手機在存的時候,就自動跟辨識資 08/07 22:58
→ qss05 : 料庫做比對,寫入可能的tag,上傳的時候會去比對包 08/07 22:58
→ qss05 : 含這些tag的,是不是兒童色情 08/07 22:58
推 IScmDa : 就我google相簿使用經驗,相片都很自動加上特徵,例 08/07 23:03
→ IScmDa : 如狗,貓,海之類的,或許針對媒體檔會用機器學習比對 08/07 23:03
→ IScmDa : ? 08/07 23:03
→ henry78925 : 你都說一個pixel值不一樣hash就不一樣了 08/07 23:23
→ henry78925 : 隨便拍一張照怎麼可能跟出現在資料庫 08/07 23:23
→ henry78925 : 你不可能事先有這張照片放資料庫 08/07 23:23
對 所以他們宣稱這樣比較照顧使用者隱私 xd
推 change701213: 如果用ai圖片學習,就等於可能出錯,出錯就要人工審 08/07 23:25
→ change701213: 核,人工審核就侵犯隱私了。誰有權利這樣做?他們又 08/07 23:25
→ change701213: 受誰監督 08/07 23:25
Hash 幾乎不會誤判 可能相對代價就是守備範圍沒那麼廣
※ 編輯: jason2641668 (114.34.224.21 臺灣), 08/07/2021 23:36:37
※ 編輯: jason2641668 (114.34.224.21 臺灣), 08/07/2021 23:37:19
→ Rynin : 推 謝謝講解 08/07 23:44
→ y800122155 : Google的以圖搜圖是可以用部分圖片搜到完整原圖,所 08/08 00:01
→ y800122155 : 以並不是你做簡單微調人家就一定查不到,不過Google 08/08 00:01
→ y800122155 : 好像搜不到左右相反的原圖,所以做過某種程度的影像 08/08 00:01
→ y800122155 : 處理還是有可能避開審查,這是指同一張圖的審查。如 08/08 00:01
→ y800122155 : 果是像CNN那樣抽取出圖片的輪廓特徵再比對就完全不 08/08 00:01
→ y800122155 : 是同一回事了 08/08 00:01
→ abadjoke : hash值這種藉口我是覺得很爛啦 08/08 00:12
→ abadjoke : 別人隨便圖片裁一裁加浮水印 影片剪一剪放上廣告 08/08 00:12
→ abadjoke : 就是完全不同的新檔案了 更別提還有新的犯罪內容 08/08 00:12
→ abadjoke : 只看hash是能看什麼?老實承認會看用戶上傳的內容 08/08 00:12
→ abadjoke : (無論是人工還是AI看)會很難嗎? 08/08 00:12
→ abadjoke : 在我看來這也不過是另一個蘋果宣傳的日常 08/08 00:14
→ abadjoke : 一邊說打擊犯罪討好一部分的人 同時又用很爛的藉口 08/08 00:14
→ abadjoke : 說我們打擊犯罪的過程不會看到你們這些無辜的人 08/08 00:14
→ abadjoke : 上傳的東西去騙另一部分在乎的消費者 08/08 00:14
推 kevin190 : Google一堆影像處理專家, hash值計算會這麼單純? 08/08 00:26
推 pig4306 : 只要老師沒對到答案 那就不是違法的啦 08/08 00:37
→ kevin190 : 現今老早就有許多影像特徵抽取方法, 可以克服因影 08/08 00:41
→ kevin190 : 像放大縮小位移或多次重壓縮造成的影響 08/08 00:41
→ demintree : 哪裡有技術文件說蘋果用hash值檢查? 08/08 00:52
→ demintree : 用hash來做效率很差,更新一下exif 就完全不同了,你 08/08 00:56
→ demintree : 這個設計跟沒有一樣 08/08 00:56
→ atrix : 這樣就可以看得出來, 08/08 01:09
→ atrix : 很多人根本沒有相關知識卻在高談闊論。 08/08 01:09
→ atrix : 講個最簡單卻是外行容易搞混的事, 08/08 01:09
→ atrix : sha256,md5這些是hash算法不是加密算法。 08/08 01:09
推 ben1357956 : 長知識 08/08 01:13
推 change701213: 蘋果原文還有說未成年想傳裸露自拍也會跳出警告,父 08/08 02:12
→ change701213: 母也能收到通知,這種不可能有資料庫可以比對的 08/08 02:12
→ Medic : 好像有提 Message 傳送露骨照片會警告兒童和父母 08/08 02:20
→ Medic : 還會順便將收到的照片模糊化 08/08 02:21
噓 nike319546 : 根本不是用HASH值,你自己腦補的嗎? 你哪邊看到的 08/08 03:15
→ nike319546 : 也講不出來,這一定是用AI辨識 08/08 03:15
板上討論這麼多篇
可以不用硬要回
完全不會顯得你比較專業
虧你還 NTU 的
※ 編輯: jason2641668 (114.34.224.21 臺灣), 08/08/2021 04:23:14
推 rrrrr123 : cool 08/08 04:55
推 tomliu1923 : ai辨識比較可能吧,hash值太容易閃了,加個浮水印就 08/08 18:38
→ tomliu1923 : 不一樣了,根本不可行 08/08 18:38
推 aspeter : 不同圖的hash值不同,那是用來加密的吧,最好分得出來 08/08 18:48
推 aspeter : 128bit=>1/2^128才碰撞,更別說你的圖檔了 08/08 18:54
推 stocktonty : 本來就想查都查得到了 會覺得這個能保密的人才神奇 08/08 19:14
推 a1234567289 : 用AI來做image embedding也可以說是hash阿 然後再和 08/08 21:34
→ a1234567289 : 色圖比embedding的相似度就可以了 08/08 21:34
→ a1234567289 : 他用的hash是辨識相似度的hash 不是那種密碼學用對 08/08 21:35
→ a1234567289 : 抗修改的那種md5或SHA 08/08 21:35
→ a1234567289 : 密碼學用的hash值的相似度與否與原始檔案是否相似無 08/08 21:37
→ a1234567289 : 關 08/08 21:37
→ k5a : Google雲端硬碟也一樣會檢查 上禮拜八卦才吵過 08/09 00:56
推 k5a : 看推文 就未成年表妹鮑魚照那篇新聞 08/09 00:59
推 zjin1126 : locality sensitive hashing 08/09 11:11
→ joeboy : 你可以不要存jpg阿 你可以存zip heehee 08/09 16:26
→ joeboy : 你去TG晃一圈就知道有多少東西都放雲端了 08/09 16:27
→ joeboy : 只不過三不五時會直接沒了 08/09 16:27
噓 pig0038 : 我 mega drive 力抗法西斯 FBI 08/10 16:20