作者b6s (b6s)
看板Wikipedia
標題Re: [情報] 維基百科全文搜索引擎 (日)
時間Sun Apr 2 01:49:40 2006
http://nutch.taipedia.info/
這是用
http://lucene.apache.org/nutch/ 做的,底層是 Lucene。
目前是 demo 性質,所以可能只有首頁上出現的字才查得到。
整個中文維基大概要跑一天才抓得完,屆時再通知。
搜尋結果頁面上顯示的都是簡體,但查詢時通常無此限制。時間有限,多多包涵。^^;
我同時也在測 Indri,但它的 web interface 比較難搞。
另外也可以直接寫個小頁面來用 Lucene,不要經過 Nutch。
但目前手邊能夠以最短時間建置起來的大概只有 Nutch,就先這樣。
如果覺得很慢,那是我的 ADSL 和 P3 1.266G 的問題......
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.105.131.104
推 pektiong:可以有Holopedia版的搜尋引擎嗎? 04/02 09:33
推 b6s:當然可以,我做好會再通知。 04/03 00:57
推 jnlyu:搜尋出來是亂碼 04/03 12:44
推 b6s:jnlyu: 請問您用什麼 browser? os? 用什麼關鍵字查? 謝謝 04/03 13:03