看板 Wikipedia 關於我們 聯絡資訊
新浪新聞中心 | 北京新浪網 | 維基搜索:引爆搜索2.0革命 http://news.sina.com.tw/tech/sinacn/cn/2006-12-25/112538108948.shtml 北京新浪網 (2006-12-25 11:25) 【eNet特約評論】對於正準備過節的IT博客群體來說,維基百科創始人正在開發搜 索引擎的消息無異于一枚重磅炸彈。許多博客從平安夜的休憩中『挺身而出』,在 博客上見仁見智。顯然,維基百科已經是一個前無古人、後無來者的成功應用,再 有一個『維基搜索』將是奇跡。   維基百科創始人威爾斯對《泰晤士報》說,這個搜索引擎的名稱是『Wikiasari 』,前者是夏威夷當地語言中『快』的意思,後者是日語『搜索』的意思。筆者在 此不深究為何威爾斯青睞日語,姑且『擅自』暫名為『維基搜索』(實際上,『 Wikisearch』不算是一個壞的選擇)。   Wiki一詞在當今的含義已經遠非原先的『快』,這已經成為一種讀者修改內容的 資訊交互傳播模式。按照威爾斯的話說,未來的維基搜索,也將沿襲維基百科的模式 。不過這一次,不是有志願者編輯來對網頁進行排序──那顯然是不可能的。威爾斯 將邀請數以萬計的維客來對網頁進行評估。   實際上,威爾斯對於Google的『耿耿于懷』已經由來已久。此前,他曾幾次表示 ,Google的搜索在某些方面很成功,但是另外一方面,搜索結果中會出現大量的無用 甚至是『欺騙性』資訊。他認為,許多所謂的『SEO(搜索引擎優化)』高手正在挂著 羊頭欺騙Google的Pagerank等網頁排序體系,並最終欺騙搜索用戶。   想必威爾斯的觀點也是許多Google搜索用戶的普遍看法,許多有用的資訊並沒有 出現在第一頁的搜索結果當中。   此外,從李彥宏獲得專利的超鏈分析到Google公司的Pagerank,無疑不將其他網 頁對於某一個網頁的鏈結以及鏈結文字作為考量物件。這種技術體系的一個先天缺陷 就是依賴一個有可能是『偽造』的『鏈結聯盟』。此外,尤其是在中國市場,我們所 熟悉的『鏈結』模式是非法的轉載和拷貝,幾乎任何一篇文章都存在至少5個的轉載 網頁。。通過鏈結原文這種『尊重版權』的方式引介文章的做法已經是上世紀90年代 個人主頁流行時的『古風』。   另外,在博客中較為常見的是,即使添加鏈結也只是一個URL網址,省去了敲打 鏈結文字的做法。這讓李彥宏分析錨文字的超鏈分析演算法哭笑不得。   因此,如果說現有的演算法系統已經成為提升搜索引擎質量的一個障礙,威爾斯 對於網頁的全新的人工評級將提供另外一個選擇,或許是一個性能更佳的選擇。   威爾斯面對媒體沒有披露如何通過人工對網頁評估質量的細節,只是稱將可以利 用維基百科凝聚的編輯人力資源對於網頁進行評估。當然,除了網頁評估之外,智慧 文本分析仍然是搜索引擎的基本功,不過,對於有雄厚資金支援和技術功底的威爾斯 來說,這些基本功可能不是難題。   以內容自產為特徵的WEB2.0颶風席捲全球。而在視頻共用、維基、博客(含播客) 等業務模式逐漸成熟之後,我們可以看到,依靠網民自己對網頁質量進行評估的『 2.0版』搜索引擎即將湧現。如果這一機制通過一個高效的後台軟件得以實現,維基 搜索將帶來另外一場搜索引擎的革命。(令狐達評) -- 歷史小說寫作,沒有準備請你遠離 史杰鵬《嬰齊傳》在這裏刻上了一個標準, 沒有同樣的準備,就應該遠離歷史小說的寫作。 揭露宣告:http://blog.mingwangx.org/?p=328 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.130.193.226
kandance:我有點好奇,80年代的slashdot不是就在做這個事了嗎 12/25 16:28
invicta:英文翻中文? 好難閱讀的新聞... 12/26 13:09