机器翻译将会是人工智能领域最难攻克的课题

2018-08-30 14:00:45 来源: 电子工程世界

机器翻译 (简称“机译”)涉及数学、语言学、认知科学、计算机科学等学科,一直被科学界公认为是 人工智能 领域最难的课题之一。它从基于规则的机译技术,到基于实例的机译技术,再到基于统计的机译技术,最终发展到目前主流的神经网络机译技术。

神经网络机译(NMT)是最近几年提出来的一种机译方法。相比于传统的机译方法而言,神经网络机译能够训练一张能够从一个序列映射到另一个序列的神经网络,输出的可以是一个变长的序列,这在翻译方面能够获得较好的表现。

目前市场上机译技术相对成熟的是谷歌翻译,谷歌机译原来背后的技术即为基于统计的机译方法,基本运行原理是通过搜索大量的双语网页内容,将其作为语料库,然后由计算机自动选取最为常见的词与词的对应关系,最后给出翻译结果。而现在谷歌机译采用神经网络和深度学习的方法,使机译技术有了很大的进步。

然而,无论是哪种机译方法,目前影响机译发展的最大因素在于译文质量。就已有的成就来看,译文质量离理想目标(达到高级译员的翻译水准)仍相差甚远。众所周知,人工翻译(简称“人译”)的过程是人工译者集理解、分析、选择及再创造为一体的综合过程,是大脑思维活动的过程。因此,机译的译文质量要达到人译的水准,就必须解开大脑处理语言信息之谜。

其实早在20多年前,中国科学家及未来学家周海中教授就预言:在人类尚未明了大脑是如何进行语言的模糊识别和逻辑判断的情况下,机译要想达到“信、达、雅”的程度是不可能的。这个预言今天已经可以被证实。

近年实施的欧洲大脑计划、美国大脑计划、中国大脑计划等都旨在利用计算机模拟人类大脑, 其核心内容是神经信息学。这一新兴前沿学科的研究成果将有助于人们了解大脑是如何进行自然语言处理的,并有望为人工智能领域,尤其是机译技术的进展铺平道路。

机译要达到人译的程度还有很长很难的路要走,这有待未来科技的发展,尤其是大脑科学的重大突破;目前人们只能将机译与人译结合起来,相辅相成,既能节省翻译的时间,又能翻译出高质量的译文。

责任编辑:Sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论