規範性詞典和描述性詞典
詞典分兩類:規範性和描述性。規範性詞典,列出種種規矩,要你怎樣怎樣。比如何文匯的粵語正音字典,要求大家都把「屋簷」讀成「屋鹽」。
描述性詞典,旨在描述語文的實際使用情況。由於現實裡大部分人把「屋簷」讀成「屋禪」,故詞典會收進這個音。描述性詞典不是不會作出規範,只是該等規範是客觀的,不是主觀的。
為甚麼規範性詞典是主觀的呢?規範性詞典,通常有兩個做法。第一個做法,就是憑編者的功力,自己編一本。於是,詞典裡的種種文法規範,種種詞彙搭配,種種例句,都是由編者自己撰寫的。由於全部都是出於編者自己一個人,那就肯定是主觀了。規範性詞典的第二個做法是,參考其他詞典和古籍。比如何文匯會說自己參考《廣韻》。只是,為甚麼我們要跟這些古籍呢?一來,古籍本身可能也是規範性詞典,是古籍編者自己主觀撰寫。二來,古籍本身即使是描述性詞典,詞典描述的可是古代的用法,我們又為甚麼要跟隨古代的用法呢?更甚者,古代也分很多種,有詞典解釋甲骨文、有的解小篆、有的展示唐朝的用法、有的展示宋朝的用法,那我們選哪一個作為根據呢?這個選擇是不是也是主觀的呢?於是,規範性詞典總走不出主觀的問題。舉凡主觀的詞典,都比較容易和現實脫節,工具書是不應該和現實脫節的。
描述性詞典為何比較客觀呢?因為描述性詞典多是建基於「語料庫」而編寫的。語料庫蒐集大量真實世界的文章,包括流行讀物和報章雜誌,然後做統計,計出各個字詞跟不同字詞的搭配頻率,從而找出該等字詞的常用搭配,再依此來擷選例句,反映出該些字詞在真實世界裡的用法,所以比較客觀。規範性詞典所顯示的詞彙搭配,都是由編者自己設想的,沒有經過統計分析,所以比較主觀。當然,很多規範性詞典是可能連例句也沒有的,缺乏真實的語料庫支援,要生安白造一大堆例句自然非常痛苦。
在中文詞典的世界裡,幾乎全部詞典都是規範性的。《現代漢語詞典》更是其中的表表者。由於政府想推廣羅馬拼音和規範簡體字,之前又一直沒有以簡體字編寫的詞典,所以就出了這部以羅馬拼音為序的簡體詞典,補充了空缺。
相反,在英文詞典的世界裡,很多詞典都是描述性的。Oxford Advanced Learner's Dictionary、Longman Dictionary of Contemporary English和Collins COBUILD English Dictioanry等等大家耳熟聞詳的學習型英語詞典都是描述性的。他們都是根據語料庫而編寫。COBUILD更是其中的開山鼻祖,於一九八七年推出了第一本依語料庫而編寫的英英詞典,廣獲好評,成為詞典界的新彗星,搶奪了Oxford等出版社的很多市場。踏入九十年代中期,其他出版社才完成語料庫和詞典的關連,紛紛在市場推出以語料庫為基礎的描述性詞典,和COBUILD抗衡。
從一個很簡單的例子可以看出中文詞典和英文詞典不同的理念。在英文詞典裡,你可以查到現時流行的粗口,但中文詞典卻不會願意收現時流行的粗口,不信你可以看看門部。這是因為英文詞典是根據語料庫而編,而語料庫又顯示出這些詞語有相當使用率,故英文詞典會描述這個語言現象。中文詞典是按編者心意而行,而編者又多是捍衛純淨語文的戰士,不齒這類粗言穢語,故沒有收錄。
至於為何會出現如此南轅北轍的詞典編纂方針,我就不得而知了。也許是和中國在語料庫的技術方面稍微落後有關,也許是和中國人尊崇權威有關,這方面我也不敢侃侃而談。阿東編詞典最為熱心,我希望未來可以編多些描述性的中文詞典,彌補中文詞典世界在這方面的空缺。