精華區beta Oversea_Job 關於我們 聯絡資訊
※ 引述《michaelz (michaelz)》之銘言: : ※ 引述《Baudelaire.bbs@ptt.cc (遺憾太常。)》之銘言: : : 我會設計的方法: : : URL的有效字元 A-Z a-z 加上一些符號,大概總共算是60個symbol, : : n0*60^0+n1*60^1+n2*60^2+n3*60^3+n4*60^4+...+ni*60^i : : 不過這個數字大的一塌糊塗,所以不是什麼好方法; : : 如果不想要collision的話,資料量可能就是那麼大。 : : 至於partition的話,用開頭字母就可以作uniform dist.了。 : 用開頭字母的話大概會看到一堆http, www之類的東西..然後所有的東西都要放在同一個 : partition, 用整個url算hash code可能會好一點 這部份當然要把http 或者www fliter掉,用後面的domain name來作處理; 這樣的balancing應該就夠了。 如果要考慮cryptographic hash function,會把事情變得太複雜, 加上我自己也寫不出來SHA....。 -- http://feedblendr.com/blends/14113.html 回來,我們重建家園 穿過兩個夜晚的白色走廊 或永遠走開,像慧星那樣 在回聲四起的山谷裡 燦爛而冷若冰霜 你獨自歌唱 擯棄黑暗,又沈溺於黑暗中 〈北島‧慧星〉 -- ※ 發信站: 批踢踢參(ptt3.cc) ◆ From: 216.145.49.21