翻譯「電政」合璧 共融大有裨益
文匯報 2019年7月8日
翻譯「電政」合璧 共融大有裨益
在人工智能時代,各行各業重視科技運用,提升工作效率及服務水平。政府也不例外,近年「智慧政府」(Smart Government)和「電子政府服務」(e-Government services,或稱「電子政務」)成為焦點,透過應用資訊科技,為市民提供更方便及優質的服務。
電子政府服務要讓各界市民受惠,跨語言的支援十分重要。香港華洋共處,中英文均為法定語言,雙語政府資訊及服務平台不可或缺。此外,部分居港的少數族裔人士不諳雙語,對於中英文以外的政府資訊也有需求。
為此政府下了不少工夫,以「香港政府一站通」為例,大部分資料均以繁簡中文及英文刊行,關於勞工、衛生等資訊更設立了「多種語言平台」,備有印地語、印尼語、尼泊爾語、烏爾都語等其他語言版本,對於社區共融大有裨益。
若要進一步提升跨語言的政府資訊及服務,增加多語內容及語言種類,不妨考慮把翻譯科技與智慧政府兩者結合。以下是三大要點:
其一,分別為專業譯員及市民大眾發展不同的翻譯科技。對於專業譯員而言,翻譯科技可協助他們完成翻譯工作,如提供譯稿以便譯者修改,並且確保術語及專有名詞翻譯準確,提升效率。
不過政府資訊繁多,悉數由人力處理誠非易事,因此對於市民大眾來說,電子平台若提供專門處理政府資訊的自動翻譯插件,即使有些內容未經人手翻譯,用戶也可掌握要義。情況就像政府透過軟件進行繁簡網頁轉換,翻譯結果僅供參考,政府不核准或認可有關內容,也不承擔責任。
其二,構建跨語言的政府文件資料庫。政府一直以來發佈大量雙語及多語文本,若加以收集整理,既可方便譯者尋找參考譯文,也可用來訓練自動翻譯系統。政府近年大力開放數據,若以此為基礎,加強文字數據的發放,對於建設有關資料庫有莫大助益。
其三,結合不同人工智能方法,針對政府文本開發翻譯科技。最近人造神經網絡成為了不少網上翻譯平台的核心技術,我們可運用上文提到的多語資料庫,訓練專門為政府文件而設的翻譯模型,讓系統學習常用的語句及行文風格。除了神經網絡外,翻譯科技也可同時結合傳統基於規則或實例的方法,兼收各家之長。
為了探索跨語言科技與電子政務之融合,筆者去年開展了一項關於新聞公報的翻譯技術研究。此項目以上述所言為基礎,以自動方法定期從開放數據平台收集雙語數據,進行對齊及語言處理工作,有關數據可用於開發政府翻譯系統與其他工具,期望研究所得應用在本港乃至其他地區的跨語言電子公共事務項目。
香港恒生大學翻譯文學碩士(電腦輔助翻譯)課程總監蕭世昌博士