更迭5代

2020-02-10 12:14 数码

更迭 5 代,进入19岁,微软要让小冰赚钱养家了

8月22日,微软小冰第五代发布会,沈向洋接替已离职的陆奇,站上了主讲台。

相比国内厂商动辄千人的发布会,已经更迭五代、扬言有重大突破的小冰,依然把发布会的规模维持在百人左右。在小冰之父李笛眼中,这已经是小冰的最高待遇了。

小冰对于微软中国而言,意义非凡。这个唯一且完全由中国团队建立并推向全球的项目,即使有陆奇和沈向洋的背书,也走得非常艰难。

三年之后的今天,沈向洋将小冰的地位做了一次提升——与 infuse AI、Bing and 小娜一起,成为微软人工智能三条产品线的其中之一。

这样的提升,沈向洋有自己的理由。在外界看来,小冰只是一个聊天机器人,但对微软来说,小冰是一个向 EQ 方向发展的情感计算框架。依靠这个情感计算框架,微软能够在 EQ 这个方向上,将人工智能无限接近人类,“让人们能强烈地认知到她地存在”,并有可能成为“某个家庭中地成员”。

同时,这也是一个明确的信号,既然放在了“产品线”的位置上,也就意味着,小冰更迭到第五代,考虑商业化的时刻到了。

沈向洋在战略层面给出指示后,小冰首席架构师周力和小冰项目负责人李笛先后上台,分享了应用在小冰 5 代上的技术创新以及商业落地情况。

技术创新(公众号:)了解到,两项技术创新分别是 1:1 生成模型和高级感官。简单来说,前者能够让小冰自己创造回应;后者则可以支持全双工语音和实时流媒体视觉。

1. 生成模型(Generative Model)

生成模型往往被拿来和判别模型做比较,从数学角度来说,前者是对 P(x,y)进行建模,后者是对 P(y|x)进行建模。在应用上表现的差异是,生成模型通过学习,能够有能力生成新的东西,而判别模型只能找出差异。

具体到小冰的应用,上一代小冰虽然拥有十亿级的大数据语料库,但都是互联上的已有数据,小冰只是通过分析,理解用户的问题,继而从语料库中回复。使用生成模型后,小冰能够从中习得能力,自己创造新的回应,这意味着她与人类交流的每一句话,都可能是这世界上从未出现过的。

目前,小冰 5 代已全面上产品中使用生成模型。其中,中国、日本、美国和印度小冰部分使用,印尼小冰则完全使用生成模型。微软官方表示,这是全球开放领域人工智能对话中,第一个百分之百使用生成模型的落地产品。

2. 高级感官

小冰的高级感官包括两个部分,一是全双工语音,二是实时流媒体视觉。

全双工指的是在发送数据的同时也能够接收数据,两者同步进行。而双工则如同“单行道”一样,一个时间段内只有一个动作被允许发生。也就是说,小冰在说话的时候,也在随时等待被打断,接收着用户的语音,甚至要去判断用户是否已经说完、何时可以打断,被打断时是否及时停止、何时打破沉默等更为复杂的问题。

实际上,去年9月,小冰在有信络中开始尝试全双工语音;去年年底,小冰又跟中国科技馆合作,把小冰络亭放在科技馆的二楼。到今天为止,小冰已经接听了来自人类超过50万通。而小冰5代,可以直接通过电信运营商,拨通用户的。

实时流媒体视觉指的则是让机器模仿人类视觉的微妙之处。周力向介绍说,一个人每天有十几个小时都是睁着眼睛的,但是绝对不会每时每刻都对所见之物发出评论,人类视觉的精妙之处,不仅仅在于能够去理解每一个瞬间,或者每一段时间的画面,更关键的是能够理解什么是不重要的,什么是重要的。

小冰5代的实时流媒体视觉,并不像视频监控软件一样,去捕捉一个个画面,分析一个画面,更像是人类一样,感知位置和移动,体察表情和动作,理解不同场景和角色,以及人与人之间的关系

更迭5代九江治疗妇科医院
引起头痛的原因
潍坊中医癫痫病医院