没有人怀疑Google在AI技术上领先 但它还需要学习苹果做产品的本领
在两天前举行的发布会上,Google 一改以前的技术公司风格发布了 Pixel 手机、DayDream View VR 盒子、Google Home 等多款硬件设备。但发布会上,Google CEO Sundar Pichai 反复提到的一个概念是 Google Assistant 智能语音助手。和苹果的 Siri 一样,Google Assistant 已经嵌入了 Google 的几乎每一款新发布硬件和软件产品。
这种转变的背景是 Google 面临的竞争环境的改变。Google,或者说它的母公司 Alphabet 目前是世界上市值第二高的公司,同时它也是搜索、在线广告、移动设备等诸多领域的领头羊。但去年刚上任 Google CEO 的 Sundar Pichai 面临的问题却是,这家公司虽然在技术上遥遥领先于其他大公司,但当需要把技术应用到产品中时,Google 却拿不出类似于苹果和亚马逊那样的成绩。
在桌面时代靠搜索引擎起家的 Google 在移动互联网成为主流之前靠 Android 系统成功地完成了一次转型,这让 Google 成为了一家“移动优先”的公司。但现在的情况却是,互联网不仅仅是从桌面转移到移动设备上,而是转移到多种屏幕上,甚至是没有屏幕的设备都开始接入互联网。对这个趋势反应最灵敏的是亚马逊,这家公司在 2014 年推出了没有屏幕的智能语音音箱 Echo。当时很多人都认为 Amazon Echo 只是一个“鸡肋”产品,因为看起来它的应用范围实在是太小了。但现在,Echo 和它背后的智能语音系统 Alexa 已经成了大公司们争相模仿的对象,因为 Alexa 成为了很多家庭的智能家居的控制者。
于亚马逊相比,Google 早就在语音识别、自然语言处理和机器学习等技术领域取得了领先地位。但 Google 唯一没有做的就是像亚马逊那样早早地就把这些技术做成产品,让它们去占领消费者的家庭。
或许是已经准备充分,或许是看到了对手们咄咄逼人的攻势,Google 现在决定利用自己的优势,并将其利用在产品上,包括软件和硬件。而这个优势就是人工智能。
在今年 4 月发布的 Google 公司内部信里,Pichai 说 Google 将由一家“移动优先”(mobile-first)的公司转变为一家“人工智能优先”(AI-first)的公司。“我们正在有意地把它应用于我们所有的产品,无论是搜索、广告、YouTube 还是 Google Play。我们还处于早期阶段,但你将会看到我们在所有这些领域以系统性的方式运用机器学习。”Pichai 在 2015 年的一次电话会议上说。
Sundar Pichai
和 10 年前的 mobile-first 一样,Google 在人工智能领域的杀手锏也是开源,这一次 Google 开源的同样是和 Android 地位相当的机器学习平台 TensorFlow。TensorFlow 的魅力在于,它不仅在建立和训练神经网络的速度上比以前快了 5 倍,还可以支持移动设备、桌面、CPU、GPU和服务器等多种平台。
开源的 TensorFlow 提供为开发者提供了完整的开发指南和文档,以及丰富的 API 接口,目前已经有 50 多款 Google 产品正在使用这个系统。
最先受惠于机器学习系统的 Google 产品是 Gmail,该系统已经让 Gmail 的垃圾邮件识别准确率达到了 99%。因为识别垃圾邮件本身就是一个典型的机器学习应用场景——分析越多垃圾邮件时,这些数据就会越来越增加机器学习系统的识别准确率,这是一个循环渐进的过程。
但现在 TensorFlow 在电子邮箱里能做的已经远不止识别垃圾邮件了。在 Google 推出的面向企业用户的 Inbox 邮箱里,邮件会被自动归类为重要、行程、财务、社交等标签,而完成这一归类的就是 TensorFlow 的机器学习系统。这和识别垃圾邮件的原理一样,正确归类越多邮件,系统的归类准确率就越高,而 Gmail 和 Inbox 的用户已经超过了 10 亿,这给系统带来了海量的数据。
Inbox 还有一个“智能回复”的功能,它能让系统阅读你的邮件,并为你自动判断可能会回复的内容,你可以选择回复直接发送给对方。这个系统本质上是一个递归神经网络,它能将你做出的选择传递回服务器,当然没有人能够阅读到这些内容。利用这些数据,系统就会慢慢“学会”如何更加智能地回复邮件。
这一切都发生在 Google 总部园区的一座不起眼的两层小楼里,在这里一个名为“Google Brain”(Google 大脑)的团队正在竭尽全力将 Google 在人工智能技术上的积累转化为可用的产品。
这个团队成立于 2012 年,当时它的主要目标是进行一个深度学习和神经网络的研究实验。现在这个实验已经完成,但这个团队保留了下来,并在 TensorFlow 创始人 Jeff Dean 的领导下在多个领域改善了 Google 产品的用户体验。
Jeff Dean 曾透露,Google 目前已经有 100 个产品团队正在使用机器学习技术,其中包括搜索、Google Photos、Google Adwords 等。当然,其中最重要的就是这一次 Google 发布会的主角 Google Assistant 智能语音助手。Dean 说它旨在“开启一个更自然、更智能的人机交互模式,基于日常语言的使用。”
现在 Google Assistant 已经出现在了 Google 的多款硬件设备和软件产品中,并且很有可能被开放给第三方开发者,这让 Google 在语音助手领域可以与亚马逊的 Alexa、苹果的 Siri 和 微软的 Cortana 展开正面竞争了。
我们从昨天 Google 发布的新产品中就可以看到 Google 的这一野心。例如 Google Pixel 手机的最大卖点就是搭载了 Google Assistant,它不仅让 Pixel 手机实现了像 Siri 一样的智能语音回复和任务处理,还在翻译、图像识别上较以前的版本有了极大的提升。而智能音箱 Google Home 则几乎是将 Google Assistant 变成了一个实体设备,你可以让它播放音乐、查询天气和安排日程。
在软件上,Google 着重推出的聊天应用 Allo 同样内嵌了 Google Assistant,这让 Allo 能够实现智能回复、图像识别等功能。虽然 Google 的 Gmail 和 Inbox 拥有 10 亿用户,但电子邮箱对于年轻人来说实在是太古老了,因此 Allo 也成为了 Google 实现社交梦想的新一次尝试。
但 Allo 的智能回复功能使用的机器学习技术需要将用户发送的信息发送回 Google 的服务器上进行算法分析,并且 Google 会将这些信息存储一段时间。这一点遭到了爱德华·斯诺登的猛烈批评,他认为 Google 存储这些信息会导致用户隐私泄露。
在做社交产品时,苹果也遇到了类似的隐私问题,但苹果的做法更加尊重用户隐私,那就是采取端对端的信息传输和差分隐私技术(Differential Privacy)。这项技术会将用户的数据切割成数个片段,并加入数学噪音隐藏用户的个人信息,然后这些加密的数据就会被上传到苹果的服务器上用于训练神经网络。这也能在用户在使用一些本地知识库中不存在的新词汇时,让系统更快地理解其意思,从而很好地提升了人机交互的体验。
能够如此完美地兼顾机器学习对数据的需求和用户隐私,是因为苹果多年来在实际产品中得到的经验。虽然不能说 Google 有多么不尊重用户隐私,但斯诺登的批评也不是没有道理的。或许是 Google 内部的工程师占据了主导地位,从而忽视了用户对隐私的担忧。但在急于将人工智能推向用户的过程中,Google 还需要像它的同行们学习很多。