Siri的故事及比iPhone更惹眼的原因
“我只是一个卑微的个人助手”,Siri略带笑声应答。
虽然Siri自嘲为卑微的个人助手,但这次会议却是Siri的第二次公开亮相。2010年早期,当这款虚拟助手首次登台亮相时,还是一款由24个人组成的初创项目团队打造第三方iPhone应用程序,并且在后来被苹果收编。
在当时,Siri更像是一个狂妄自大的语音助手,并且包含很多个性化功能特征。研发团队对这款语音助手的优化工作多数情况下表现的就像小说作者突然灵光一现。Siri联合创始人Dag Kittlaus和设计专家Harry Saddler细心对Siri进行调教,并且为其准备了众多的背景知识。“她表现的‘超凡脱俗’、‘通宵一切’并且反应‘机智灵敏’”,Dag Kittlaus如是评价。
在被问及健身房信息时,Siri会用一种略带调侃的语气回复,“唉,你好像确实有点肌无力啊。”,而被问及“哈尔遇到了什么状况?”时,Siri则会索引Stanley Kubrick 1968年出演的惊悚片“2001:太空漫游”的信息,并且用一种愠怒的态度回应,“我不想说这个话题”。在那个时候,Siri的词库中还会有很多不文明词汇。
这些不和谐词汇在Siri团队被苹果收购之后,也被相应的剔除,即便后续也加入了一些更为新颖的功能特征,但是这款语音助手的天赋却得到了极大的限制。2011年10月份,时隔这家初创团队被1.5亿-2.5亿美金收购的报道传出的16个月之后,苹果正式以官方的身份介绍了Siri这款产品,并且为其加入了更多的语言支持。现在,Siri服务着数以百万计的用户,并且被注入了很多国际化的特征。现在的Siri能够通过语音的方式播报答案,并且被深度整合至iOS操作系统当中,能够和苹果自有的数十款应用程序协同使用,处理一些类似于会议安排、邮件回复或者查看天气等基础任务。而在以前,Siri只能通过文本的形式与用户完成人机交互。
Siri早期版本中的很多天赋如今在苹果的版本中已经难以找到,毕竟最原始的Siri应用已经不复存在,但在受其影响的美国历史上最大的人造智能工程:美国国防部资助的虚拟语音助手项目中可以找到一些线索和答案。
2010年,Siri首次登台亮相时具备与包括Yelp、StubHub以及Wolfram Alpha等在内的42项不同的互联网服务连接的能力,并且从这些信息源处索整合出最详尽的答案,能够帮助用户购票、能够召车,不需要用户另行打开其他应用程序、注册其他单独的服务或者提供电话信息,甚至能够识别出用户的好恶,并且根据用户的个性匹配对应的服务。
在2010年的一次科技会议上,Siri联合创始人Tom Gruber演示了Siri的研究成果:告诉语音助手“我想去办公室附近的一个浪漫的意大利餐厅”,Siri就会从Citysearch、Gayot、Yelp、Yahoo! Local、AllMenus.com、GoogleMaps、BooRah以及OpenTable中天衣无缝的合并出最优结果,并展示出来。
和其创始人设想的一样,Siri被定义为一个“处理引擎”(do engine),比如允许用户通过互联网来举办会议。而在当时,搜索引擎只能提供呆板的连接,而处理引擎却可以进行一些对话,然后创建一些实际的动作行为。打个比方,当你喝醉酒之后,谷歌搜索可以为你提供确切的回家路线,而处理引擎却可以为你提供切实的召车服务。这家初创公司的初始目的本身就不是搭建一个更好用的搜索引擎,而是建立一个全新的互联网访问模型,一套能够满足用户切实需求的人造智能平台,远非单纯的为用户提供数据信息,最终仍旧依赖个人决断旧有思维模式。如果说搜索引擎定义了web 2.0时代,那么Siri的联合创始人的目标就是定义web 3.0时代。
处理引擎的设计初衷就是方便参与用户日常的生活,建立一套想用户之所想的任务处理规则,并且在用户提问之前就能够给出切实的答案。尽管这种设想和初衷离最终的实现还有很长的距离,但是却为语音助手服务提供了一套全新的解决方案:Siri助手能够在航班延误时赶在用户沮丧之前,抢先拿到备用航班、火车中转以及租车等解决方案。
最初版本的Siri给当今的Siri的未来,以及如何进入到大众电子消费者的生活描绘了一幅非常完美的蓝图,其根本目的在于建立一套人类能力增强以及潜在并且不可或缺的助手模型,能够避免人脑思维的局限性,并且将用户从琐碎繁杂的日常事务中释放出来。
Siri的造梦者们清楚明了的知道苹果当前版本语音助手并没有完全发挥其潜能,“Siri的创世团队看到了未来、定义了未来并且顺利的迈开了通往未来技术的第一步”,最初投资Siri项目之一的风险投资公司摩根塔勒合伙人Gary Morgenthaler如是说到。“被收购之后(苹果)Siri缓慢的商业化进程让我们这些创始团队感到非常的失望。”
苹果目前在使用这项技术方面面临的巨大的压力,尤其是很多竞争对手开始在尝试实现Siri创始团队的想法,并且推出新一代的语音助手服务。Siri的履历折射出了虚拟助手的完美未来,虽然当前苹果Siri助手存在很多缺陷,但未来却将会成为Siri历史中的一个注释。
Dag Kittlaus 认为,“一个更为智慧、绅士的哈尔正在赶往通向主流用户的路上。Siri不过只是最初的弄潮儿,只不过后来的发展并没有沿袭当初的设想。”
NERD CITY(呆子城市)
哈尔的银幕首演35年之后,在美国国防部将一些科幻小说中的元素搬至现实生活中,并且赋予一些超乎寻常人理解能力的特性之后,其地位已经远超卢卡斯或者斯皮尔伯格。
2003年,美国国防部斥重资强化美国国防先进研究项目局,并且由斯坦福国际研究所牵头,组建一个5年期的500人规模团队,打造虚拟助手服务,寄希望通过软件的形式帮助军事指挥官解决信息负载和办公室杂务等问题。尽管这并不是项目任务,而是一项援助性活动,但是这项助手项目(CALO)却给Siri带来了灵感。
美国国防部在该项目中总共投入了1.5亿美金,联合了数百名顶尖的人工智能专家,就为了一项多数联合实验室都只能梦想的项目:让计算机具备野外生存的能力。在Nerd City(取自斯坦福国际研究所研究院的绰号),军队工程师被授命研发一项基于PC并且能够观察人类行为的智能助手项目,所有的人员配置、项目以及话题都和这个智能助手息息相关。CALO项目首席研究员David Israel认为,“从任何角度来说,这都是人工智能历史上最为壮观的项目”。
至少对于一些人而言,联邦政府在对待一个类似9岁小朋友的科学幻想方面表现的尤为严肃、认真。
“CALO项目归集在一起的时候,很多人会觉得这种人工智能不过是在浪费时间,尤其是经历了无数次的失败之后,人们对这类项目的质疑纷至沓来。”,斯坦福大学副教授、科技预言家Pail Saffo说。
不管反对者如何质疑,CALO却实实在在的证明了科学的胜利,并在几十年之后实现了项目重组,将当初人们认为极为复杂的合作组成了一个独立的人工智能学科。
与此同时,CALO也反映了机器能够通过其适应性的设定来完成实时信息的捕捉,就像人类一样。此前,人工智能软件必须通过外部的设定才能使用,意味着机器的学习算法需要注入大量的数据,然后才会根据这些数据来判断如何进行处理。而现在,CALO项目摈弃了这种方式,让机器能够自身收集的信息,更加灵活的进行任务处理。
斯坦福实验室在将未来带到现在的活动中完成了一次伟大的创举。1946年,斯坦福大学受托展开一项“对社会益处”(the good of society)的研究,并建立了该实验室。1976年斯坦福实验室正式独立运营,并且持续至今。该实验室主要进行一些由政府部门和企业资助的研究项目,然后将这些技术提供给一些有想法的初创企业。包括喷墨打印机、LCD液晶显示屏这些科技成果都出自斯坦福实验室。
Menlo Park 实验室同样凭借其研究员在计算领域声名远扬,其中硅谷传奇中出现的Doug Engelbart正是20世纪60年代计算机鼠标产品的先驱者,这名传奇大师还预见了当今社会用户习以为常的设备。
同样是来自Menlo Park 实验室的工程师Adam Cheyer,最终推出了Siri的早期模型。而在谈及Doug Engelbart时,Adam Cheyer认为这位大师不仅仅因为独创性而出名,更因为其“以人为本”的科技理念而德高望重。
Doug Engelbart认为机器应当用来提升人类的智利和能力,并非试图取代人类活动,而是尝试着通过设备、硬件和软件让当前的人类活动更加高效。
当很多人将目光聚焦在任务列表上的琐碎杂物时,Adam Cheyer却敏锐的捕捉到了虚拟助手的机遇。90年代早期Adam Cheyer就在计算机硕士研究项目中建立了小型军事助手原型。而这款原型设备当时被命名为Cheyer的厨房帮手,能够跟踪冰箱中食物的容量,并且在容量不足的情况下有序的发布到互联网上。如今,这个概念刚刚出现在CES2013展会上的三星智能冰箱之上。
在斯坦福实验室,Adam Cheyer负责组装来自CALO项目总共27个团队的研发部件,从而形成助手整体,并且每年都会对这些助手所掌握的信息进行年度测试。虽然这款研究级别的虚拟助手在被安装至办公室PC时仍然存在一些问题,但是已经可以完美的完成一些一度只有人类助理才能够完成的工作任务。
如果需要临时取消会议,CALO可以了解单个项目中每个人所扮演的角色,并且能够辨别是否取消会议,在有需要的情况下,甚至可以重新安排会议,发放新的会议邀请以及确定会议室。如果会议如期举行,CALO能够快速的整理会议所需的文件和邮件,并且会聆听整个会议,之后会快速打印出会议纪要,并对发言情况进行标注。另外,CALO还能够将会议记录和发言编订成册,自动化分拣报告以及其他日常任务。
在对CALO进行训练的同时,Adam Cheyer还会抽出时间来协助Vanguard项目,并且顺利于2003年上市,致力于帮助德意志电信、摩托罗拉来调查、分析一些新产品如智能手机的前景。Vanguard项目后期也推出了自己的助手原型设备,虽然功能方面比CALO有限,但是相对更加灵活。
这款原型后来被时任摩托罗拉总经理的Dag Kittlaus相中,而他就是Siri的联合创始人之一。
Dag Kittlaus是一个土生土长的挪威人,拥有一副永远长不大的娃娃脸,而且极富冒险主义精神,热衷于参加跳伞这类极限运动,也是合气道黑带选手,还是一个科幻迷,尤其钟爱为《2001:太空漫游》执笔的作者Arthur C. Clarke的作品。
Dag Kittlaus试图说服摩托罗拉收购Vanguard科技失败之后,于2007年从摩托罗拉离职,并以常驻企业家的身份出现在斯坦福实验室。随后不久Dag Kittlaus就和Adam Cheyer以及其他几个同事远赴加利福尼亚,尝试从CALO和Vanguard项目中找出优质的点子来组建一家初创公司,进而促成了Siri这个项目。
Siri诞生于旧金山一座宁静的城镇半月湾的一家名为Cypress的酒店。就像CALO和Doug Engelbart的以人为本的理念一样,Siri的最大特点就是能够将人类工作的压力降到最低水平。而这个助手项目的绰号当时被取名为哈尔(HAL),口号则是“HAL’s back -- but this time he’s good”。
未完成的革命
虚拟助手早就证明了硅谷梦想家们塞壬之歌式的理念:打造一款更加智能、人性化的哈尔机器人。
1994年,野火通信推出了一款基于电话的助手产品“Wildfire”,能够处理短信息、打电话以及检索语音邮件,获得了业界的一致好评,但是多数叫好不叫座,即便是其活泼的表现非常让人着迷。几年之后,微软Office助手Clippy:一个让办公室无处不充满着懊恼的回形针助手诞生。最终,Clippy被时代杂志评为50大失败创新之一。1998年,General Magic的承诺Portico服务将成为一款具备连接互联网和手机的能力的语音助手服务,可用于阅读邮件、发送信息以及一些其他的任务。悲催的是,4年之后这家公司终止了该项目的研发,并且宣布破产倒闭。
如果要找一个对虚拟助手来说既是正确的时间,也是正确的地点,那这毫无疑问会是2007年的秋天。这一年,iPhone带着更快的无线连接速度、更好的语音识别以及优秀的云计算等诸多特性公开亮相,大量的web服务蔓延至iOS平台,为语音助手提供了超大的舞台。
在去月半湾之前,这批斯坦福实验室成员亲历了iPhone手机的发布,并认为在未来会形成一个由iPhone主导的人际网络,而且消费者对在小尺寸触控屏上告诉语音助手应该做哪些事情的这种依赖性会与日俱增。因此,以iPhone应用形式出现的语音控制助手服务毫无疑问是一种完美的解决方案。
这群有抱负的企业家,还有一个优势就在于能够近距离的接触到CALO项目的核心技术。基于1980年美国国会公布的一项法案,斯坦福实验室应免费向企业提供这些技术,而可以从政府获得专项资金支持。做为回报,初创公司会对斯坦福实验室提供基于CALO项目的核心软件授权。
虽然Adam Cheyer并不确信CALO的研究成果能够带来切实的商业利润,并且也不太愿意离开斯坦福实验室,不过Dag Kittlaus最终说服了这位“创新灵魂伴侣”共同创业,并将公司取名为Siri,Dag Kittlaus担任首席执行官,联合创始人Gruber担任首席技术官,Adam Cheyer则任职工程高级副总。
Siri的三位联合创始人要求每一个潜在的应聘者阅读麻省理工学院教授Michael Dertouzos撰写的《未完成的革命》一书,主张“以人为中心的计算”和“服务于用户,而不是用户服务”的设备理念。如果应聘者不同意Michael Dertouzos的观点,那么就和Siri的公司文化相违背,被认为不适合这里的工作。