看板 Wikipedia 關於我們 聯絡資訊
※ 引述《alexsh (Lin4h)》之銘言: : http://download.wikimedia.org/ : http://download-yaseo.wikimedia.org/ (ja,ko,th,ms四種語言) : 下載的是從資料庫解出來、以XML整合後再壓縮的檔。(還包括含歷史記錄,不含記錄, : 文章標題清單…等等(個人登錄資料也有,不過不給下) : 重點來了:現階段,你要自己架MediaWiki才能Import這些資料。 : 方法在這裡(http://0rz.net/361SB) 借個標題問一下... 目前我們實驗室有需求需要做一個幾乎是 Mirror 的站台... 若是照上述前輩所提供的方法的話..這樣子做下來..時間與人力不敷成本.. 因為研二學長的國科會計畫與大學部的畢業專題..都需要用到 Wikipedia 的東西... 國科會計畫 - 利用維基百科詞條具有各種語言翻譯及定義的特性, 將其功能利用C#語言撰寫成DLL函式庫,亦即維基外覆程式, 讓使用者能夠利用維基外覆程式達到跨語言的語料收集,我們寫了 一套 API 將維基外覆程式的功能以圖形介面呈現供使用者操作, 另外我們也提供 Web service 讓使用者透過簡易的URL 便能夠使用 維基外覆程式提供的功能,將維基外覆程式實際應用在跨語言資訊檢索上。 畢業專題 - 概念是..目前 Wikipedia 搜尋出來的結果沒有經過排序... 學弟目前是計畫做一個 Ranking 排序的動作 ( 類似於Goole搜尋完的結果 ) (這是從我老闆那聽來的..細節不大清楚) 所以...我目前是已經有架設好一個 MediaWiki 站台... 為了學弟的專題,跟學長的Demo能順利... 因為連到英文站時,在速度上會有點小慢.... 所以才希望自己能 Mirror 回來使用... 但因為我的架站的經驗不足,不知道怎麼去動作比較省時、省事... 所以想上來問一下有沒有前輩已經有 Mirror 過的經驗,可以指導一下.. PS:我們老闆還希望能夠把 Import 進資料庫的資料... 能還原成網頁跟連去 Wikipedia 看到的東西一樣... 我也正頭痛這一點.... 先感謝板友們您的閱讀,有點落落長... 希望不會擔誤到大家的時間.. 期待能激發一些好的 Idea 與經驗傳承 先謝謝各位前輩的回答了 ^^" -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 163.17.10.250