透视科大讯飞“同传造假” 称沟通不足造成误会

近日，人工智能语音领域领军企业科大讯飞被曝出“同传造假”，科大讯飞官方回应这是由于与同传译员沟通不足造成的误会。据悉，引发此次事件是在2018创新与新兴产业发展国际会议上，该会议曾以“机器翻译”作为宣传，科大讯飞官方最近解释称这种方式是“人机耦合”，并承认机器翻译仍难以代替人工。

物联网资深专家杨剑勇对记者表示，科大讯飞提出人机耦合背后，是智能(机器)翻译技术相对语音识别技术难度更大。

近年来，随着AI的热度递增，机器翻译也呈现出爆发之势。但根据本报记者了解，实际行业现状是目前机器翻译仍难以达到接近人类对话的效果，尽管不同企业开始竞相研发机器翻译新品，但如何令翻译更准确是AI领域待解的一大难题。

技术鸿沟未跨越

曾在脸书担任软件实习工程师的王谟，目前在知乎上有6万关注人次，是语音领域方面的专业答主。王谟告诉记者，“语音识别”是指把声音转换成文字的过程，不包括后续的理解、翻译等。而“同传”(同声传译)指的是在(识别)一个人说话的同时翻译成另一种(语言)。

业内普遍认为AI同传比语音识别更难，只有先识别才能进行翻译。据了解，搜狗机器同传技术系统需要将语音预处理、语音识别、文本预处理、机器翻译、语音合成五项技术模块进行结合。

中国传媒大学研究大数据与人工智能方向的教授沈浩认为，目前机器翻译这方面的技术已经成熟，水平强于(英语)六级，但易受处于近场或远场、有无噪音等因素影响。

沈浩对本报记者举例：“如果是日常生活用语，以及标准的一些话语，都没有问题，但涉及到诗、歌、抒情散文等，翻译结果容易出现问题。”

北京市速记协会理事长唐可为认为同传翻译和速录都要求精准，速录员和同传翻译在速录和翻译过程中要求精简记录，进行语义理解后更接近讲话者的记录，而目前的同传翻译并不能做到结合上下文完整表达句子意思。

“很多时候，机器速录、机器翻译后还需要人为进行实时修改，甚至更考验速录员和同传翻译，还更耗费时间。”唐可为表示。

搜狗语言交互技术中心技术总监陈伟表示，同传场景对语音识别的要求很高，错一个字对于源语言的理解基本不受影响，但若将同传后的文字翻译成另一种语言，可能整句都是错的。

科大讯飞方面则对本报记者表示，目前机器翻译已经取得非常大的进步，能够帮助人们在一些场景中处理语言交流的问题，但距离会议同传以及高水平翻译所讲究的“信、达、雅”(翻译中常要求的忠实原文、通顺畅达、译文优美三大原则)还存在很大的差距。

尽管有深度学习技术在语音、翻译等领域的快速突破以及大数据的红利，但是相比于训练有素的人工而言，机器实际上缺乏语音识别的稳定性、机器翻译的稳定性、对语言理解和再创造的能力。

此外，机器同传要与人工同传媲美，就要聪明而灵活地结合前后内容进行“创作”。陈伟表示，人工同传是对译文二次创造，因此译文往往流利度高，而机器对于口语化、命名实体和多义词较多等情况下翻译效果不够好，目前(利用机器进行)同传翻译仍基于当前单句进行翻译，上文的历史信息无法较好使用，以及在语言的理解和再创造的能力方面，目前机器无法基于原文进行引申和扩展，确保翻译效果的流畅性。

仍具备实际性价值

继前两年微软、百度、腾讯、科大讯飞、谷歌等纷纷推出翻译软件、发布翻译机器后，本报记者梳理发现，今年市面上仅公开发布的产品就有近十款，包括搜狗推出的搜狗旅行翻译宝、搜狗速记翻译笔、搜狗录音翻译笔记、搜狗翻译宝pro。华为、360手机、OPPO在推出新机时以机器翻译为卖点，甚至业内一家手机品牌糖果手机直接打出了“翻译手机”的概念，而猎豹移动也推出了一款小豹AI翻译棒。

“翻译机不是高高在上的黑科技，而是通过场景落地，解决用户在特定场景中需求的真正有用的技术。”猎豹移动CEO傅盛在推出小豹AI翻译棒时称。

易观互动娱乐组群高级分析师殷实告诉本报记者，从商业或者专业会议的角度来看，翻译机还未能代替人工翻译在正式场合运用，更多是扮演一个辅助工具角色。“今年来，翻译技术火爆的原因主要在于它对翻译精度要求不高场合下有很高的使用价值。”

殷实认为，目前，翻译机在市场上主要用于在类似出行、旅游等对翻译精度要求相对低一些的行业，为游客解决在国外语言不通的问题，甚至在一定程度上推动了旅游业的发展。

据易观千帆的数据，旅游APP的月活跃用户量一年内增长了近30%，国外游的热度也一直没有减退。殷实认为，不能因为机器翻译当下存在问题就否认它存在的价值。

陈伟表示，对比人工同传和机器同传的能力，机器相较于人的优势是：机器基于海量数据能针对某个领域进行快速学习，机器同传能够忠实原文，一般不会遗漏译文，可长时间记忆，机器能够实现快速、高并发的部署，同时支持多场会议的同传，很大程度缓解人工同传资源不足的问题，降低同传成本。

尽管机器翻译的发展未完全尽如人意，但是陈伟认为机器翻译目前满足部分使用需求的价值已经显现。近些年，各种规模的国际交流越来越多，从行业大会到闭门小会，甚至到课堂培训，均存在同传的需求，而目前虽然有不错的大量(人工)同传从业者，但事实上还仍满足不了国际交流的需求。

沈浩认为，目前机器学习算法的趋势慢慢接近人工同传的可靠性，人们应该注重事物未来的发展趋势。

准确度壁垒待破

本报记者注意到，市场也不乏有众多声音称某某产品语音识别准确率、翻译准确率能达到多少。就语音识别准确率而言，各家公司自有其说法。

搜狗、百度和科大讯飞三家公司2016年11月各自宣布其中文语音识别准确率达到了97%。搜狗称其语音翻译的准确率可以达到90%。今年6月，央广网科技报道称，目前讯飞输入法的语音识别准确率提升到98%。近日，科大讯飞方面对本报表示，其机器翻译已经达到大学六级水平，2019年将达到英语专业八级水平。

王谟告诉本报记者，行业内一般采用“词错误率”进行测评，这个标准主要是看测试所用的“数据集”的难度，不同的数据集难度不同，所以单看一个词错误率的数字，并不能判断系统性能的好坏。如果要对技术进行测评，必须指明在哪个数据集上取得了这样的词错误率。王谟举例表示，在一个叫Switchboard的数据集上，目前微软和IBM都做到了百分之五点几的词错误率，已是行业领先。

王谟告诉记者，用标准数据集来测试也有局限性，一些标准数据集里没有考虑到噪音环境，另外，有团队可能专注于“刷榜”，把标准数据集上的词错误率刷到很低，但一换成别的数据，就会“现出原形”。

“这也是为什么有些时候一个宣传得很牛的产品到了实际中就各种不好用。毕竟实际环境是千变万化的，如果训练时没有覆盖到这么广的实际场景，在实际中就容易出问题。”王谟向本报记者解释道。

陈伟告诉本报记者，“现在很多翻译机的产品，特别是低价的翻译机更多是从第三方公司获取，这种情况下很难做二次的优化和开发。”

“根据我们在同传产品得到的经验，它并不是简单的‘语音识别+翻译’，出现‘1+1>；2’的能力，往往(现实是)远远小于2，所以我们要把单点能力做好，同时产生‘1+1=2’甚至远大于2的效果。这件事情是目前搜狗同传和搜狗翻译宝具有的技术壁垒。”陈伟说。

沈浩认为各主要玩家的语音识别准确率已经差别不大，厂商们均掌握着技术原理，只是看哪家能够不断地去训练，对结果进行提升，如准确率从95%提升至96%，但实际上达到95%的准确率时，就可以将其现实化和商业化。“所以判断他们哪一款产品优秀，我也只能谈他们的界面、开源甚至使用成本等其他方面。”沈浩表示。

沈浩表示，从国内外对比上，谷歌能够实现全球多种语言之间的互译，而国内企业，例如科大讯飞主要是汉语以及方言的识别，或解决主流使用语言的翻译。

陈伟表示，搜狗正在横向扩展多语种的机器翻译技术，实现跨语音交流，“在这个技术上面临的很大问题是，如果我们没有足够的数据怎么办？在没有足够数据时，我们会考虑要不要面向于低资源(一门语言的数据很少，不足够训练语音识别或机器翻译系统的资源)，或者是做没有数据、单向的翻译语料，或者是文本语料，做两个语种之间的翻译。”陈伟表示，“这两项技术是目前我们着重做的。”