前不久,智能硬件圈的微博被一则新闻小小地刷了个屏——IBM Watson联合澳洲创企Lingmo推出了一款能够进行“机器同声传译”的耳机Translate One2One。这款耳机不仅支持英语、中文、日语、法语、意大利语、德语、葡萄牙语、以及西班牙语的同声传译(3-5秒内),而且不需要外接蓝牙或是WiFi,售价179美元,官网显示7月将发货。
巧合的是,就在前几天,国内一间名叫双猴科技的创企也一口气推出了四款翻译机:魔脑神笔、魔脑晓秘、魔脑导游、魔脑翻译官。四款产品形态大小与应用场景各异,但号称可以同声传译28国语言。
据智东西统计发现,从2016年5月到2017年6月这一年之间,同时有6间企业推出了类似形态的翻译机/翻译耳机,既有我们熟悉的国内语音巨头科大讯飞,也有来自澳大利亚、日本、荷兰的创业企业。在这些翻译机硬件,则有更多如IBM Watson、谷歌、百度……以及其他创业公司如彩云AI等提供翻译技术。
一、翻译耳机
1、澳洲创企Lingmo——Translate One2One
既然文章缘起是这部翻译耳机,那么我们就先来讲讲IBM Watson+澳洲创企Lingmo的组合。
机器翻译的步骤大概可以如下划分:语音识别-自然语意理解-翻译-语音合成(也有划分为:语音识别-机器翻译-语音合成)。Translate One2One中使用了IBM Watson的自然语意理解(NLU, Natural Language Understand)翻译的API,同时结合了Lingmo自己的硬件技术与机器学习应用。
而这部耳机的特性,正如上文介绍,不仅支持英语、中文、日语、法语、意大利语、德语、葡萄牙语、以及西班牙语的同声传译(3-5秒内),而且不需要外接蓝牙或是WiFi,售价179美元,官网显示7月将发货。
IBM Watson几乎可以算得上是自然语言处理(NLP)老祖式的人物了。早在2011年,Watson就被搬上了美国智力问答节目《危险边缘》。这个问答节目与传统游戏设置不同,选手面对的是答案,需要给出与这个答案相对应的问题,参赛者需具备历史、文学、政治、科学和通俗文化等知识。比如:当给出的线索是“美国之父,砍倒樱桃树”是,选手可以这样回应:“谁是乔治·华盛顿?”
此外,参赛者有时还需要具备解析隐晦含义、反讽与谜语等技能,才能够得出答案。例如,在某次节目中,参赛选手抽到了一个名为“Chicks Dig Me”的类别,字面意义理解是“小鸡喜欢我”,但其实真正含义是“妹子喜欢我”。
对Watson来说,参与这种智力竞赛节目的难题并不是知识量的储备——毕竟Watson存储了4TB的数据,远超人类大脑。真正困难的是让计算机学会解析人类的语言、识别人类语言中微妙的含义、分辨讽刺口吻、谜语、构词断句、诗篇线索等等这些逻辑和线索。然后才是对题目进行分解,快速搜索自己的内存资料,寻找到最佳答案。
至于这次比赛的结果,大家都知道了——Watson打败两位人类冠军,获得第一名。
6年过去了,Watson不怎么上电视答题了,但它从未停止对自然语言处理(及其他人工智能技术)的研发。如今的Watson不仅能翻译各种语言,还能从人们的语言文本中进行情绪分析、人格特质判别、写作风格归类、社会倾向划分。
2、纽约创企Waverley Lab——The Pilot Translator
在描写Translate One2One的文章中,常常提到了另外一个类似的翻译耳机——The Pilot Translator(也被简称为Pilot耳机)。这款翻译耳机由纽约创企Waverley Lab在2016年5月推出,最初在Indiegogo众筹平台上获得了1万9千人支持,筹得450万美元。如今总共预售了2万5千套,共筹集了500万美元,第一批产品预计2017年秋季就会发货,公司还参加了今年3年在巴塞罗那举办的MWC世界移动大会。
Waverley Lab成立于2014年,据CEO Andrew Ochoa表示,成立这个公司的初衷是……他遇到了一个法国女孩,想要和对方交流却苦于存在语言障碍。目前公司核心成员有5位,除了CEO Andrew Ochoa外,还有硬件工程副总裁Jainam Shah、生产制造副总裁William Goethals、设计副总裁Sergio Delrio Diaz、以及市场营销副总裁Marion Guerriero。
这款无线翻译耳机需要配合手机App,使用蓝牙相连,使用时交谈双方各戴着一只耳机。目前预售版支持五种语言的同声传译(英语、法语、意大利语、葡萄牙语、西班牙语)官网显示今年秋季时用户还可以额外购买中文、德语、日语、波兰语、希腊语等众多额外语种。
当然啦,就像其他所有无线耳机一样,你还可以直接用它来听音乐,目前有红、白、黑三种颜色可供选择。而最为神奇的是,这款耳机你也可以在神奇的淘宝上找到大量非官方预售链接……
二、翻译机
除了翻译耳机外,一个扁平的长方形状翻译机也是翻译硬件的常见形态。有的会带一小块屏幕,将识别/合成的文字显示在屏幕上,有的则没有屏幕,只能进行语音翻译。
1、科大讯飞——晓译翻译机
这款晓译翻译机可以算得上是“网红翻译机”了,在去年11月23日的2016年度发布会上,科大讯飞推出了一款“晓译翻译机”,能够实现了中英互译或是汉维互译。
这是一个类似小型遥控器的扁平长方形装置,有一红一蓝两个语言的摁钮,说英语或者维吾尔语之前需要摁下相应摁钮。今年3月10日,也有国家领导人体验了晓译翻译机,这消息当时还被小小刷了个屏。
2、双猴科技——魔脑系列翻译机
双猴科技是一个比较神奇(神秘)的企业,除了官方宣传稿件外网络上能查到的信息几乎为零。就在上周,他们刚刚在海南举行了一场发布会,推出了魔脑神笔、魔脑晓秘、魔脑导游、魔脑翻译官四款产品。其中魔脑神笔与本栏中介绍的其他翻译机类似,除了号称支持28国语言的同声传译外,还同时具备了录音与语音/文字转换功能,售价1999人民币。
双猴科技成立于2015年,公司位于海南国际旅游岛,产品总部位于深圳南山科技园。据公司官网显示,公司累计投入资金3000多万元,目前拥有大圣文化系列完整的自主知识产权(大圣魔脑品牌+大圣IP+大圣语音库+大圣语义)。
3、分音塔——准儿翻译机
准儿翻译机由分音塔科技在今年5月于京东上线众筹的一款带屏幕的翻译机,众筹价格约为699-799元。跟其他翻译机一样,准儿翻译机需要用户摁下摁钮进行讲话,然后再由机器进行翻译,你说的话与翻译出来的句子都会被显示在屏幕上。目前准儿翻译机支持中文、英文、日文、韩文、泰文等语种的互译,不需要连接手机,但仍旧需要依靠网络连接。
分音塔科技成立于2016年7月15日,两位创始人CEO关磊与CTO张明都为清华大学的硕士。公司于2017年5月宣布完成千万人民币的天使轮融资,由东方国狮领投。目前准儿翻译机的京东众筹已经完成,根据众筹页面显示,有5086名用户支持了这项众筹计划。
4、Logbar——ili(咿哩)翻译机
与它的一众同类产品相比,由日本Logbar公司打造的ili(咿哩)翻译机可以说是其中最早宣布产品,却又相对功能最少的一个。早在2016年1月,Logbar就在当年的CES上推出了这款ili翻译机,但一直到今年的5月,公司才宣布第一批产品开放预售,售价189美元。目前第一批ili翻译器已经全部售完,预计10月发货。
每个ili翻译机都被编程为只能将一种特定语言转换为另一种语言,比如当一台ili翻译机被设定为只能将英语转换为日语后,就不能进行其他语言的转换。而且它现在只能支持单向对话,即一台ili被设定为英文转日语后,是不能进行日语转英文这种操作的……
目前,ili支持英文、西班牙语、普通话、日语的翻译。但是由于这台翻译机不用联网,因此其词汇仅限于旅行者可能使用的单词和短语,例如关于交通,购物或餐饮的咨询。
三、统计机器翻译+人工神经网络翻译
机器翻译的历史最早可以追溯到几十年前。1954年,美国乔治敦大学(Georgetown University)与IBM公司联合使用IBM-701计算机首次完成了英俄机器翻译试验,拉开了机器翻译研究的序幕,几十年间演进出了众多不同的翻译方法。
随着互联网的诞生与兴起,新世纪以来,人类所产生的语言文字数据量激增,统计方法因此得到充分应用。谷歌、百度、微软等互联网公司纷纷成立机器翻译研究组,研发了基于互联网大数据的机器翻译系统,从而使机器翻译真正走向实用。
自2013年已以来,随着深度学习在图像、语音等方面的突破性进展,基于人工神经网络的机器翻译( Neural Machine Translation )也在逐渐兴起,翻译效果变得越来越好。
简而言之,统计机器翻译让机器学着如何翻译短语或单词词组,例如,一个组合可以是“我的蓝色车”=>“my blue car”或“blue car”=>“蓝色车”。每个组合获得一个评分,用来评价翻译正确的程度(被用户使用)。电脑将会尝试组合不同的词组组合来产生句子的翻译,以达到最大化的翻译流利程度。这些组合的合集类似于人们在旅游中使用的《100句带你游遍美国》,但传统的翻译系统具有数以亿计的翻译组合规则。
基于人工神经网络的机器翻译更像一个黑匣子。大多数这些翻译系统使用“编码器-解码器”模型。“编码器”将每个原文单词转换为数字向量序列,“解码器”通过从每个向量中挑选信息来生成一个译文单词。“注意模型(attention model)”对每个向量进行加权,以决定原文句子的哪些编码部分有助于产生下一个翻译的单词。与深度学习的其他应用一样,我们并不知道机器是依靠什么标准判断的,然而在大多数情况下,基于人工神经网络的机器翻译更流畅。
目前,许多企业使用的都是人工神经网络机器翻译+统计机器翻译等综合技术进行翻译。
结语:小红海?伪需求?
随着经济发展与国民生活水平的提升,越来越多的民众开始选择出国旅行作为休闲娱乐方式,而语言沟通障碍作为一个用户痛点,正越来越多地被人察觉。而上文提到的几乎所有翻译机/翻译耳机,瞄准的几乎都是旅游这种精准率低、容错率高的用户需求——至于商务会谈的同声传译,暂时还是无法由机器替代的。
旅游翻译的需求固然存在,但翻译机的需求,我们可能要打上一个问号。一方面,在智能手机全民普及、所有需求可以被App 满足的当下,一个功能单一的硬件产品是否有市场?这些翻译硬件的效果跟我们熟悉的谷歌翻译App、百度翻译App等比较起来效果如何?而且,目前大部分产品还是停留在摁一下,说一句,翻一句的方式,不能提供同声传译,这与使用App翻译非常相似(文中提到的所有企业几乎都提供免费的翻译App)。
另一方面,如果这个翻译机需要依靠网络,那么现有网络水平是否能够保证偏远地区的网络通畅?而如果这个翻译机不需要依靠网络,那么翻译效果、翻译的准确程度是否能够得到保障?企业在宣传过程中多少功能能够实现?……这些问题都有待时间来验证。
在此之前,还是先把英语学好吧。