【恒大譯站】句式明顯差異大 中英分句一樣難
文匯報 2022年5月23日
【恒大譯站】句式明顯差異大 中英分句一樣難
我們分析中英對照的語料時,有時想找出英漢語的對應語義單位,一般首先遇到的一個困難,是如何把篇章分成便於分析的單位。中英文分段方式不一樣,這不難理解,稍為考察一下中英文報章便可略知一二。但以段落作為仔細分析的單位,一般太大了,不利分析,除非想要分析篇章的文步。只考察如詞組和詞等較小的語言單位,卻一般不足以考究各種語言詮釋人類經驗的規律,所以很多時候第一層分析單位是句。
然而,中英文的分句方式明顯差異很大,而且不易理解。這裏中文句子的定義是以句號分隔的單位,英文則用句點。一般的講法是中文句子比英文長,因為英文句子有只能帶一組帶時式的動詞詞組的限制,中文卻沒有,反而有所謂流水句的特色。有些中文語法分析會用某種英語的拆句方式,即是句(sentence)和子句(clause)。句以句號分隔;複句由子句組成,逗號分隔。
不過,用這種方式看中文其實不太合理,而且十分困難,只要我們看看稍舊的文章,便會察覺中文的「句」有太多「子句」了。細看之下,可能一個四字詞的資訊量已經等於兩句子句。用這種方法,會有形形色色的類似問題。其實這樣分析英語句子,也會有同樣的問題,只不過沒那麼明顯。
另一種分析方法來自系統功能語法,當中句子的觀點並沒有子句 (clause)和句 (sentence)的分別,只有句(clause)和句群(clause complex)的差異。Sentence的概念還是有的,但這只是書寫文字的慣例,並不是語言本身的固有規律。
其實這不難理解,只要看看現在大家用手機打信息、在論壇留言時的規律便知道,只用空格分隔,不用標點,因為這更貼近口語,只用不同時長的停頓分隔。從語言分析角度看,第一種方式仍很主流,因為第二種分句方法要很多人力處理,不利大量自動化的語料分析。
然而,這有時候會令我們誤解某些語言的本質,所以分析口語語料還是很重要。我們每天大部分時間用語音溝通,加上我們往往低估了口語和書面語的差異,這會使學生能寫文章,但與人談不上幾句。科技進步了,現在收集、處理、分析口語語料比從前容易得多,或許也可令我們更了解語言的本質。
現代文字或多或少是表語(logographic)符號,不純粹表音(phonographic)或表意(ideographic)。常見的表意符號有「嚴禁吸煙」的標誌,由一個表形(pictographic)符號(香煙)和一個表意符號(圓形加斜線)組成,往往分別塗上兩種顏色。我們理解這個符號時,不經語言;純表音符號有國際音標(IPA),當中每個符號代表一種音質。但我們理解文字時,大部分情況都是必經語言的。