牛津詞典收了幾個中文詞?

2018年10月中旬,我首度發現直譯自中文「加油」的add oil收進了《牛津英語詞典》(Oxford English Dictionary,簡稱OED),這個語言上的現象引爆了廣泛且高度的熱議,不僅紅遍海峽兩岸及香港、澳門,甚至傳播到了東南亞與北美的華語圈。許多英文媒體跟進報導,就連本該與此無關的日本、西班牙、法國、土耳其等國,也能看到這條漢英語言的新聞。

於此稍早的10月上旬,我的另一個發現就冷清許多,沒受到什麼關注。OED在其年度第3季的更新中,增收了源自中文、漢傳佛教「禪」的音譯詞Chan,這則添補得以讓英語世界認識到,禪宗不是只有日本的Zen,更有日本禪宗源頭的中國禪宗。

我研究OED多年,常有學界的前輩、朋友問我,在這部英語世界的詞彙寶庫裡,究竟收錄了多少源自中文的詞語?網上有人說120個,有人說200多個,甚至有人說1000多個。數字差距如此懸殊,到底哪一個答案才對?

答案應該是官方說法的兩倍

2018年11月19日,牛津大學出版社(中國)的詞典部總編輯劉浩賢(Franky Lau) 出面,在接受媒體的採訪時表示,英國OED編輯部提供的數字是250個。

牛津英國總部的說法看似一槌定音,然而我卻半信半疑。胡適曾說,做學問要在不疑處有疑,於是我便在眾說紛紜之中,花了一週的時間,從早到晚密集研究。根據我得出的第一手資料,我的答案是500個左右,數字是OED官方說法的兩倍。

在回答問題前,請容我先把必要的背景說明一下。

如何統計英語詞典裡的中文字?

我在2005年曾經做過一個類似的研究,不過對象是規模較小、2大冊的《牛津英語詞典簡編》(Shorter Oxford English Dictionary,簡稱SOED)。這套SOED是20大冊完整版OED的節本(abridgement),當年的統計數字是250個左右,詳細的詞表發佈在大陸的《廣東外語外貿大學學報》上。

如果有人認為,「2大冊有250個中文詞語,20大冊是10倍的規模,所以中文詞語的總數就是2500個」,如此推論就差之毫釐、謬以千里了,因為這不是個簡單的算術問題。簡編版的SOED保留了完整版OED大多數的詞語條目,只是在詞源、定義、書證等其他地方刪節壓縮。是故,欲知OED收錄了多少中文詞語,這研究還得從頭做起,無法貪快,沒有捷徑可走。

有幾個觀念也得界定釐清,否則這項研究無法進行。

判定標準一:源自中文,還必須是「漢語」

首先,什麼是源自中文的詞語?這問題看似容易,實則不然。根據大陸權威的《現代漢語詞典》所載,中文是「中國的語言文字,特指漢族的語言文字」。準此,OED收錄的Kalgan(喀拉干,河北省張家口的舊稱),用來指稱張家口特產的羊毛皮,因其源自蒙古語,我就覺得不該算。同理,OED收錄的Lhasa Apso(拉薩犬)源自藏語,也不能算是源自中文的詞語。然而,OED收錄的hutung(胡同,威妥瑪拼音)就得算,因為追本溯源,「胡同」雖來自蒙古語,唯其漢化已深,早已是漢語詞彙的堅定的一員。OED也收錄了Manchu(滿族;滿語),該詞雖源自滿州語,道理同上,也得算是源自中文的詞語。

實際的情況,有些並非這麼黑白分明。碰到棘手的例子,我只能運用我的專業知識,在幾分掙扎之後,逐一迅速下判斷了。

判定標準二:音譯、借譯才算外來語

另外,怎麼樣的中文詞語才算是英文裡的「外來語」?我認為「異化」較深的才算,這其中包含兩大類。其一是音譯詞(transliteration,即語音轉寫),如:

其二是借譯詞(calque,即逐字翻譯),如:

當然,這個部分在操作的時候,情況也沒有想像中的清楚明瞭,有時還得根據自身的認知加以取捨。茲舉數例。

英文裡有些音譯詞最終來自中文,然而卻是透過其他語言進入英文的,如:

我基於理性,把這類詞排除在外,但做這個決定時,心裡是有幾分痛苦和不平的。

英文有些依中文而造的借譯詞,結構、內容上並不夠嚴謹,如:

碰到這種情況,我依照OED的詞源和定義,參考漢英詞語之間的吻合度,做出綜合判斷。「紅包」的red envelope和「燕窩」的bird’s-nest soup,此二者我把它們納入計算,視之為英文裡來自中文的借譯詞。

如果概念事物是中國的,但英文的對應是相對自由的意譯,我便傾向於將之排除在外,如:

500個中文詞語,多數不親民

1989年第2版的OED有20大冊,紙質詞典只能用於個別詞語的翻查瀏覽,無法做系統、深入的學術研究。最新的OED是個有償使用的超大型線上詞典,是個在第2版的基礎上整合更新而成的巨型電子資料庫。

身為OED的訂戶,我藉由官網上的進階搜尋(Advanced search),配合地毯式的審閱與交叉求證,電腦、手動雙管齊下,按照上揭的原則,花了一週的潛心鑽研,終於整理出了最新的研究成果。《牛津英語詞典》,這個簡稱為OED的英語詞彙終極寶庫,究竟一共收錄了多少源自中文的詞語?我的答案是,500個左右。

說「左右」,是因為有一些我主觀判斷的成分,有一些我對衍生詞和複合詞的取捨,甚至我可能遺漏了部分詞語。

我對這個詞表的整體印象是,500個左右的詞語中,大部分既冷僻又專業,反映了OED這個曠世巨著長久以來的體質。OED於1857年正式啟動,迄今百餘年,是個早年英國文人醉心其中的計畫,內容以「高大上」著稱,近來雖調整了方向,儘量反映英語的全貌,試圖貼近庶民的生活,不過高大上的體質依舊。

*高大上:中國流行語,全稱「高端、大氣、上檔次」。

按類別來看,在來自中文的500個左右詞語裡,依數量多寡排列:

哲學宗教20個左右、地方(特產)20個左右、棋藝遊戲15個左右、歷史15個左右、情感表達15個左右、各色人等15左右個、音樂戲曲15個左右、朝代15個左右、商業貨幣15個左右、社會黑暗面15個左右、中醫中藥10個左右、布料服飾10個左右、植物10個左右、動物10個左右、武術健身10個左右,建築、度量衡、書法、自然物質4項均不足10個。

這是先有結果再行分門別類的,分類時也常碰到一些兩難的情況。比如地名,OED收錄的地名幾乎都不是單純的地名,而是作為修飾語,用以表該地的歷史、語言、特產、風格等,因此在定其歸屬時僅能擇一而為,有時單純,有時只得武斷。

這個500詞表的體量偏大,本文難以容納,將於下一期完整刊出,敬請期待。


 文/ 曾泰元 東吳大學英文系教授

收錄於英語島 2019年1月號
訂閱雜誌 

專欄最新文章