美聯社倫敦 26 日電
研究人員 26 日說,使 podcast(播客)、celebutante(名流新寵)
等新字進入牛津字典的龐大文字研究資料庫,蒐集的英文字詞已正式
達到 10 億個。
牛津英文語料庫經常搜尋網路部落格、網路聊天室、報章雜誌和小說
等來源,發掘文字應用的新潮流,以協助引導彙編最新版字典的作業
。
牛津英文字典向來被視為英文用字的最完整工具書,去年 8 月出版
的最新版本增加了 supersize(超大號)、wiki(維基,全民共同創
作審核)和「retail politcs」(零售政治學)等字詞。
牛津大學出版社辭典編纂者索亞尼斯說,這個資料庫並非收集 10 億
個不同的字,而是包括句子,以及其他使用方式和拼字的例子。
英文字典出版經理茱迪‧皮爾沙說:「這個語料庫是純粹的 21 世紀
英文,我們看到的是現在的英文和當前的發展。這是文字的尖端。」
皮爾沙說,隨著 geek-chik(電腦技客時尚)、inner-child(內心
幼童)和 gabfest(閒談)等混合字使用日益頻繁,這項研究計畫的
一個目標是辨識能夠持久留存的用語。
她說:「英文非常有創意,非常有趣。字典收錄的是會繼續使用下去
的字句。」
2000 年 1 月展開的牛津英文語料庫計畫,每年耗費 9 萬至 10 萬
7000 美元(約台幣 287 萬元至 341 萬元),也是全世界資金最多
的文字研究計畫,
這個資料庫曾協助辨認出一些常用片語的拼法出現改變,例如 fazed
by(因某事煩惱害怕)變成 phased by,free rein(隨心所欲)變
成 free reign,buck naked(赤身裸體)也逐漸演變成 butt naked
(光屁股)。
【2006/04/28 聯合報】 @ http://udn.com
http://udn.com/NEWS/WORLD/WOR4/3284146.shtml
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.167.173.104