【学习班车】机器翻译与传统翻译行业的碰撞

发布者:文学院学工办发布时间:2024-06-27浏览次数:10

2024年3月25日,在“翻译学研究”公众号上发表了一篇题为“冯志伟:当机器翻译遇到“人文硬核”时……”的采访文章。冯志伟教授是计算语言学家,专门从事语言学和计算机科学的跨学科研究。他研制了世界上第一个从汉语到多种外语的机器翻译系统、世界上第一个中文术语数据库,曾获得奥地利维斯特奖、中国计算机学会NLPCC杰出贡献奖,用中外文出版著作及译著40多部。由于冯教授的采访内容极为丰富,篇幅较长,今天我将着重介绍他对于两个问题的看法:机器翻译与人类译员关系,以及机器翻译的优势和问题。


在转述冯教授观点之前,我先介绍一下本篇采访中涉及到的几个术语。机器翻译(Machine Translation, MT)是人工智能领域的一项关键技术,旨在实现不同语言之间的自动翻译。机器翻译的概念最早出现在20世纪40年代,初期以规则为基础,依赖于详尽的词典和语法规则。然而,这种方法局限于规则的严格性和语言的复杂性。随着20世纪90年代统计机器翻译(Statistical Machine Translation, SMT)的兴起,机器翻译开始依赖大量双语语料库来“学习”翻译。

21世纪初,随着深度学习和神经网络的发展,机器翻译进入了一个新时代:神经机器翻译(Neural Machine Translation, NMT)。与基于规则或统计的方法不同,NMT使用深度神经网络,特别是RNN(循环神经网络)和后来的Transformer模型,以端到端的方式学习语言转换。简单来说,就是通过使用计算机神经网络技术,利用人工智能模仿大脑神经元进行语言翻译。目前很多大公司都在开展NMT的研发,比如谷歌,微软,脸书等。

大语言模型是一种基于深度学习的人工智能技术,其核心是使用大规模数据集对模型进行训练,从而使其能够理解、生成自然语言文本。这些模型通过层叠的神经网络结构,学习并模拟人类语言的复杂规律,达到接近人类水平的文本生成能力。

在采访中,冯教授指出机器翻译技术虽然发展迅速,但目前并不能取代人类译员,复杂的高端翻译工作必须由人来承担。其原因在于,一方面,文学作品、科技文献等垂直领域的翻译仍需人类完成;另一方面,有较高保密要求的翻译任务以及重要场合的同声传译和交替传译等也需要人类完成。具体来说,文学翻译需要译者具备极高的人文科学素养和对源语文化背景的深刻理解能力,同时也要能熟练并创造性地运用目标语,这是机器翻译难以胜任的,需由人类译员来承担。科技翻译中的多义术语可以表示不同领域的多种概念,机器翻译难以正确辨别这样的多义术语,往往会造成翻译错误,需要由人类译员进行判断。此外,尽管机器翻译也可以做同声传译和交替传译,但是,实时翻译场景中,机器传译往往难以及时纠错纠偏,可能会造成无法挽回的后果,因此重要的同声传译和交替传译也要由人类译员来承担。由此可见,机器翻译并不能代替人类译员,高端翻译专家是机器翻译永远也取代不了的。

而对于热度很高的神经网络机器翻译,他认为其使用的深度学习技术在本质上是一种模式识别技术。计算机在翻译时,只是使用编码器-解码器模型进行文本数据的转换,并不能真正理解文本内容。但依托大规模语料和强大计算能力,深度学习可以把语言内部的语义转换为上下文的关联性并采用词向量(word vector)的方式来描述这样的关联性。由于深度学习和神经网络技术都是建立在模式识别基础之上的,是一种基于大数据的连接主义方法,在辨别多义词、确定指代关系等方面常常显得无能为力,其可解释性也不强,而且神经网络机器翻译模拟外在世界以及社会历史背景的能力还十分有限,也难以处理这些复杂而丰富的“人文硬核”。

此外,冯教授肯定了大语言模型的优势,即节省了时间和经济成本,提高翻译质量和用户体验,促进全球化发展和跨文化交流等,认为其翻译结果还可以自动结合大模型中的数据信息,上下文理解能力相较于神经网络机器翻译有显著提升。但他也指出了其存在的问题,包括可能会生成不真实、前后不一致的内容,生成以假乱真的假新闻,可能帮助黑客们对网络上的设备开展攻击等。所以需要加强对大语言模型时代的语言治理。

根据整篇采访,冯教授对于机器翻译持有客观的态度,既肯定了机器翻译的时代需求和巨大进步,也强调了其目前存在的问题和应采取的措施。针对现在广泛存在的观点,即机器翻译将取代人类译员,他进行了理性的驳斥。他认为机器翻译将成为人类译员的好朋友和得力助手。两者应当和谐共生、相得益彰。在人工智能时代,各种翻译技术工具的智能化程度越来越高,这都将有助于提升人类译员翻译效率。翻译工作者应当与时俱进,拥抱技术、学习技术、掌握技术。