专栏首页>阑夕
静候“对话即交互”时代
2016-11-09 14:28:54作者:阑夕 来源:中国经营网

  不会再有多少人怀疑,未来的「搜索」将以语音形式交互,就像微软和Google作为软件公司接管硬件厂商开拓的头部利润那样,服务的生命周期及其连续性永远高于商品。

  智能手机的生产价值,与其说是在于移动互联网,不如说是象征制造工业的晴雨表,这很容易解释为何美国的科技巨头能够容忍涉足手机行业的挫败,却在底层应用层面寸土必争,「FAGA」无一例外,均在不计成本的倾力研发语音产品及其背后的人工智能。

  对于消费级硬件统率市场能力的高估,也就意味着对于用户动用选择权的低估,Youtube并不需要预装在PC和手机里才能获得流量,连微软捆绑在操作系统里原装浏览器亦难以守护固有的江山,这种判断和逻辑即使在某些国家遭到了短暂的失灵,也不构成否认其存在的任何依据。

  换句话说,人机交互要比购买行为,更加逼近信息入口的阀门。

  KPCB的明星分析师玛丽·米克尔在其2016年互联网趋势报告中将语音定义为新一代的「计算界面平台」,它是从1832年打孔卡片制表机诞生以来,人机交互行业经历三个触控式阶段之后,重新被发明的一次机会。

  有趣的是,讯飞、搜狗以及Google、微软这些在语音技术领域投入巨大的公司,无论怎样宣传,目前都未曾把「识别准确率超过97%」这个数据再向上提。

  这也是业内的一个共识,一旦语音识别的准确率达到99%,那将直接进入产业爆发的黎明,带动物理世界的颠覆和重构。

  这和应试提分有着相似的原理,从60分提高到95分的难度,要远远低于从95分提高到99分的难度。

  受益于罗永浩在锤子科技的新品发布会上对讯飞输入法长达二十分钟的「口播」,其应用在App Store一跃登上免费榜Top 10(最高第2名),要知道,在此之前,讯飞输入法从来没有进入Top 100。

  另一方面,独立应用的下载爆发,又只是堪比海啸来临之前的一朵浪花,在嵌入式的支持体系下,语音技术是标准的「赋能」产品,它的成就取决于能够横向的跨过多少距离,如同Android之于移动生态的地位。

  技术能力就相当于数字时代的能源,这也是为什么「转型人工智能」逐渐成为硅谷的一种风尚。

  如果将语音交互拆解为前端的精确识别和后端的智能学习两个组织,目前的绝大多数公司都强于前者而弱于后者,因为二者的工作量级不啻天渊之别。

  以「清华系」的王小川为例,搜狗公司实际上是在2012年,就已立项人工智能,并在输入法产品中不断迭代,语音功能亦是拥趸广泛(日均输入1.9亿次),成为中国最大的语音请求应用,但是论及全球范畴内的行业深度,还是难以自夸。

  所以搜狗在今年春天向清华大学捐赠了1.8亿人民币、宣布联合成立智能计算研究室的新闻,一度引起热议。

  因为这种企业投资支持学术的模式,在中国并不常见,反而是欧美的熟悉套路。在美国,未来科学——包括语音处理、深度学习、神经网络等泛人工智能项目——的重量级人物几乎是清一色的学术背景,他们的科研经费大多来自企业及社会献金,而回报这种「哺育」的最好方式,就是专注于学科拿出成果,再由商业公司进行转化。

  当然,最近几年,越来越多的学术人才直接被企业撬走,也是相当有趣的情景,比如人工智能行业的「天梯3000分局」,四个人里有三个(Yann LeCun、Geoffrey Hinton、Andrew Ng)分别投身于Google、Facebook和百度,只有一个(Yoshua Bengio)仍然留在大学里。

  王小川在清华读书的时候,是被正在为Chinaren寻求人力资源的陈一舟通过「踹开宿舍门开出八千块实习工资」的豪气打动,从而进入了互联网行业,这种草莽而生动的故事,在今天很难重演了。

*文章为作者独立观点,不代表中国经营网立场。

阑夕

热文排行
就是不乐意说话,使用叫车服务也是一样

在纽约和旧金山这种流动人口较为密集的繁忙城市,Uber崇尚的「简洁无声」似乎更加受到欢迎,而在宾州或是马里兰州这种「乡土...[详情]

几点看法:关于中文互联网的信息污染
腾讯QQ:不仅要好看,更要好玩
巨头的基因,永远不安分