大市中国

大市中国 > 滚动 >

透视科大讯飞“同传造假”:机器翻译之困

2021-08-07 19:50:16

 

来源:互联网

透视科大讯飞“同传造假”:机器翻译之困

唐金燕、李甜、陈佳岚、张靖超

近日,人工智能语音领域领军企业科大讯飞(002230.SZ)被曝出“同传造假”,科大讯飞官方回应这是由于与同传译员沟通不足造成的误会。

据悉,引发此次事件是在2018创新与新兴产业发展国际会议上,该会议曾以“机器翻译”作为宣传,科大讯飞官方最近解释称这种方式是“人机耦合”,并承认机器翻译仍难以代替人工。

物联网资深专家杨剑勇对《中国经营报》记者表示,科大讯飞提出人机耦合背后,是智能(机器)翻译技术相对语音识别技术难度更大。

近年来,随着AI的热度递增,机器翻译也呈现出爆发之势。但根据本报记者了解,实际行业现状是目前机器翻译仍难以达到接近人类对话的效果,尽管不同企业开始竞相研发机器翻译新品,但如何令翻译更准确是AI领域待解的一大难题。

技术鸿沟未跨越

曾在脸书担任软件实习工程师的王赟,目前在知乎上有6万关注人次,是语音领域方面的专业答主。王赟告诉记者,“语音识别”是指把声音转换成文字的过程,不包括后续的理解、翻译等。而“同传”(同声传译)指的是在(识别)一个人说话的同时翻译成另一种(语言)。

业内普遍认为AI同传比语音识别更难,只有先识别才能进行翻译。据了解,搜狗机器同传技术系统需要将语音预处理、语音识别、文本预处理、机器翻译、语音合成五项技术模块进行结合。

中国传媒大学研究大数据与人工智能方向的教授沈浩认为,目前机器翻译这方面的技术已经成熟,水平强于(英语)六级,但易受处于近场或远场、有无噪音等因素影响。

沈浩对本报记者举例:“如果是日常生活用语,以及标准的一些话语,都没有问题,但涉及到诗、歌、抒情散文等,翻译结果容易出现问题。”

北京市速记协会理事长唐可为认为同传翻译和速录都要求精准,速录员和同传翻译在速录和翻译过程中要求精简记录,进行语义理解后更接近讲话者的记录,而目前的同传翻译并不能做到结合上下文完整表达句子意思。

“很多时候,机器速录、机器翻译后还需要人为进行实时修改,甚至更考验速录员和同传翻译,还更耗费时间。”唐可为表示。

搜狗语言交互技术中心技术总监陈伟表示,同传场景对语音识别的要求很高,错一个字对于源语言的理解基本不受影响,但若将同传后的文字翻译成另一种语言,可能整句都是错的。

科大讯飞方面则对本报记者表示,目前机器翻译已经取得非常大的进步,能够帮助人们在一些场景中处理语言交流的问题,但距离会议同传以及高水平翻译所讲究的“信、达、雅”(翻译中常要求的忠实原文、通顺畅达、译文优美三大原则)还存在很大的差距。

尽管有深度学习技术在语音、翻译等领域的快速突破以及大数据的红利,但是相比于训练有素的人工而言,机器实际上缺乏语音识别的稳定性、机器翻译的稳定性、对语言理解和再创造的能力。

此外,机器同传要与人工同传媲美,就要聪明而灵活地结合前后内容进行“创作”。陈伟表示,人工同传是对译文二次创造,因此译文往往流利度高,而机器对于口语化、命名实体和多义词较多等情况下翻译效果不够好,目前(利用机器进行)同传翻译仍基于当前单句进行翻译,上文的历史信息无法较好使用,以及在语言的理解和再创造的能力方面,目前机器无法基于原文进行引申和扩展,确保翻译效果的流畅性。

仍具备实际性价值

继前两年微软、百度、腾讯、科大讯飞、谷歌等纷纷推出翻译软件、发布翻译机器后,本报记者梳理发现,今年市面上仅公开发布的产品就有近十款,包括搜狗推出的搜狗旅行翻译宝、搜狗速记翻译笔、搜狗录音翻译笔记、搜狗翻译宝pro。华为、360手机、OPPO在推出新机时以机器翻译为卖点,甚至业内一家手机品牌糖果手机直接打出了“翻译手机”的概念,而猎豹移动也推出了一款小豹AI翻译棒。

“翻译机不是高高在上的黑科技,而是通过场景落地,解决用户在特定场景中需求的真正有用的技术。” 猎豹移动CEO傅盛在推出小豹AI翻译棒时称。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。