Google 翻译人工智慧大跃进,全世界语言统一的日子近了?
巴别塔,出现在旧约全书中的一个故事,说的是人们之所以产生不同语言的由来。
在这个故事中,人们一开始只有一种语言,而且团结无比,在齐心协力的氛围下打算打造一座「通往天上的高塔」。这个举动吓坏上帝了,「怎么可以随便搭梯子来我家呢?」,便下凡把人类的语言打乱,让大家再也无法明白对方的意思,高塔工程也无限期延宕。
从此之后,找寻、发明一种人类「共通的语言」,像是一个大秘宝,全世界都尝试追求却遥不可及。
而 Google 现在正在前往巴别塔的路上。
挑战:用人话讲解 Google 翻译到底厉害在哪?
Google 团队在 2016 年底,悄悄释出了一篇有关 Google 翻译的论文,并没有引起过大的迴响。我们也有转载过相关的文章《Google 翻译又变态了,这次连没看过的语言也能翻译》、《不用学英文了?Google 翻译导入类神经机器学习,Google 小姐变聪明啦》。尽管大致上解释了 Google 在翻译领域的跃进,讲的却好像是克林贡语,让许多没有修过人工智慧课程的读者一头雾水,只能抱着一种「快点头,不然别人以为我看不懂」的心态。
今天我们就要试着挑战用人话来讲解 Google 翻译到底哪里进步又厉害在哪里!
过去的 Google 翻译
在 2016 年年底以前的 Google 翻译,可以把它简单想像成一间间正方形的图书馆,有韩文图书馆、日文图书馆、中文图书馆、英文图书馆 …… 在每一间图书馆的墙上有两个窗口,一个叫做输入;另一个则为输出。
而图书馆中有一个金髮双马尾的图书馆馆员,示意图如下:
假设金髮双马尾的图书馆管理员是负责日文图书馆,而你在输入的窗口交给他一张写着中文「爸爸」的纸条,该名图书馆管理员则会在偌大的图书馆中找寻相对应「爸爸」的日文单字。
一个字对应一个字;一个片语对应一个片语。超出这个范畴,抱歉,那图书馆管理员就会给你一些奇怪的答案。在这个机制中, 金髮双马尾的图书馆管理员可以不懂日文,也不懂中文,反正只要在图书馆里面找到对应的字元就可以了 。
现在的 Google 翻译
在理解现在的 Google 翻译之前,不妨想像图书馆管理员突然有了智商。
在输入与输出的窗口间,Google 接上了一些神经元。这些神经元就像人脑一样,不只能进行单向的查询,更能够双向的侦错与记忆。
用个贴近的例子来理解看看,我们小时候学到了「狗」这个词汇与概念,之后週末回阿公家学到了「告(台语的狗)」这个全新语言的词汇。在我们小小脑海中,会自动将两者联结起来,当我们听到「告」,会自动出现「狗」这个概念。过了不久我们上了小学,新学到了「dog」,同样的我们脑中出现的是「狗」这个概念。这代表我们只要学一次「狗」,我们后续所学的第二、第三外语,甚至图像,都可以一再唤醒脑中「狗」的概念。
我们的问题在于记不住第二、第三外语,而不是忘记「狗」这个概念。
现在把镜头转到 Google 图书馆管理员,同样的事情如果让 旧有的 图书馆管理员来做,它会推导出以下的内容:「狗」=「告」而且「告」=「dog」,所以「狗」=「dog」。
不过现在,它尝试这样做:「狗」=「i420」、「告」=「i420」、「dog」=「i420」,只要提到「i420」,就能带出「狗」这个概念。
*注意,现实情况并没有这么简单,背后仍有十分复杂的运作。
好,让我们踏入 Google 的思考领域
现在你可以尝试理解下面这张图,蓝色的线为 Google 翻译原本的做法,单字对单字、片语对片语。不过在经过训练与记忆之后,大家可以共享这些资料,即使面对较少对应到的语言也可以顺利翻译。
首先我们进行「英文与韩文」的双向训练与「英文与日文」的双向训练。接着就算我们从未进行过「日文与韩文」的翻译训练,我们仍可靠着前面两者训练过后的中间神经元达到良好的训练结果。
Google 将其称为 Zero-Shot Translation,指的就是完成两种语言的翻译训练后,第三种语言对应前两种不需要再经过学习。
讲这么多,跟巴别塔有什么关系?
上述 Zero-shot 的成功与第二段图书馆管理员的概念,引申出了一个重要的问题,我们有可能打造一种「世界通用语」吗?
世界上的语言被验证出许多共通点,像是许多语言共同拥有如「p、c、k、t」与「s、f」类似的发音。如果 Google 的神经网路可以参透全世界的语言,或者是世界上流行的大部分语言,是否有可能制作出全世界都通用的「通用语」呢?
如上述所说的,我们就以「i420」当作「狗」名称,全世界看到「i420」都知道是「狗」。就目前来说似乎还没有到达这个地步,因为 Google 的神经元并不是真正「创造」一种新的语言,更像是在每个单字上添加了只有自己能看懂的「标籤」。
想要造访上帝之家?我们还有很长一段路要走。
页:
[1]