作者PsMonkey (痞子軍團團長)
站內java
標題Re: [問題] 有人寫過PageRank嘛?(Google搜尋引擎技術)
時間Thu Nov 1 19:29:55 2007
※ 引述《kians (臨兵鬥者皆陣列在前)》之銘言:
: 如題,Google利用頁面分析+PageRank技術達成了搜尋引擎霸主的地位
: PageRank就是給予每一個網頁一個value啦,用google自己發展的PageRank演算法
: 用在搜尋後的網頁排序,越重要的網頁會放在越前面
: 最近對PageRank滿有興趣的,要如何讓電腦對數以億計的網頁進行運算
: 一般的電腦根本不可能達成吧,有點想知道演算法是怎麼寫的
^^^^^^^^^^^^^^^^^^^^^^^^^^ ?
一般的電腦能不能計算目前所有網頁的 PageRank?
可以... 只是算完可能一個月過去了
: 還是說關鍵在硬體? 用multiprocess的方式達成?
^^^^^^^^^^^^ ?
: 有人用java寫過PageRank的演算法嘛?
有,在固定某個 test data 量下,我就寫過
: 希望能找到範例來參考一下,想對手邊有的幾十萬筆的連結資訊算出所有url的PageRank值
: (格式(txt): url1->url2
: url1->url3
: url2->url3
: .
: .
: . )
: 不知道有沒有辦法辦到,先謝謝各位囉
有
==== 好了,回答完問題,以下是個人喇賽區,不爽不要看 ====
不考慮效率問題
只要寫的出演算法,為甚麼要問某某語言可不可以寫得出來?
(問題是,原 po 是不是真的知道 PageRank 演算法的基本式子?)
如果要問如何平行處理
請去找平行計算 or 分散式系統的書、或是到專版討論
除非要問到 Java 有哪些平行處理的 framework 或是 library
那請另起標題,不然,就這篇文章而言...
好吧... 這是介在作業文與「與版面無關文」的中間
說白了,版規沒辦法做什麼
只是個人很討厭這種文章
--
侃侃長論鮮窒礙 首頁:
http://www.psmonkey.idv.tw
眾目睽睽無心顫 Blog:
http://ps-think.blogspot.com
煢居少聊常人事
殺頭容易告白難 歡迎參觀 Java 版(@ptt.cc)精華區 \囧/
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.136.152.117
推 SCSonic:推…與版面無關文 11/01 20:26
推 godfat:不知道為什麼想說因為 google 名氣大 XD 11/01 23:12
→ kians:真的很抱歉 謝謝 11/02 17:02
推 forkome:可是感覺蠻有討論的價值滴說,看到就很想點 11/02 23:53
推 coolne:個人很討厭這種文章→不應該是身為版主該說的話吧 11/09 13:07