让 AI 拥有逝世亲人的人格,微软小冰走向专属人工智慧

让 AI 拥有逝世亲人的人格,微软小冰走向专属人工智慧

在「第七代微软小冰发布会」上,微软小冰团队公开了人工智慧小冰的商业化进度。人工智慧创造及商业事业部总经理、小冰团队商业负责人徐元春宣布微软小冰已踏入了 10 个行业,包括金融、零售、汽车、地产和纺织等。

团队公布第一个小冰工具包,明年可供个人用户使用

微软小冰于 2014 年 5 月正式推出,在 2018 年首次公开探索商业化模式,于 2017 年,开始商业化测试。

微软(亚洲)网路工程院副院长,小冰团队总负责人李笛接受 PingWest 品玩在内的媒体採访时表示,微软小冰在 4 年前就可以商业化,「只不过我们能够有机会选择不商业化」。

李笛告诉 PingWest 品玩,微软小冰团队研究某项技术,是因为团队认为该技术在短期之内会实践。技术进步并非空中楼阁,它需要与实际商业相结合。团队公布的 Avatar Framework 第一个工具包版本正是出于这样的考虑。

这套架构被团队称为「今年最大的飞跃」,它孕育了微软小冰,能让更多的人工智慧可拥有类似的通用、完整架构的能力,他们能听、能说、能看、能创造,能像小冰这样无处不在。

更令人惊喜的是,这套架构不是只服务企业用户。在明年春天,将公布适用个人用户版本的 Avatar Framework,每个人都可以透过它,创造专属个人的人工智慧。

商业合作「有所取捨」,不以符合客户需求为主

小冰的一系列商业化合作中,包括小冰上线的 vivo 和 OPPO 手机平台。利用微软小冰的绘画技术,与中国纺织工业联合会共同推出的人工智慧纺织服装布料设计平台已投入生产,SETECTED、万事利、依文等品牌的产品也已上架销售。在音乐方面,与联通沃音乐共同推出的音乐生成平台也正式上线。

让 AI 拥有逝世亲人的人格,微软小冰走向专属人工智慧

微软团队认为他们的商业化是「有所取捨」。徐元春表示,微软小冰团队依旧会坚持此前的销售模式 —— 不会是简单的技术输出,不会简单去销售小冰技术的 API,也不会生产第一方硬体产品。

实际上,开放 API 的方式可以让小冰简单且迅速地应用到许多产品中,这会是一个极容易赚钱的方式。但小冰团队认为,在这种方式下,团队是不能知道企业正利用该 API 在打造什幺服务,会产生什幺样的互动功能和用户体验。徐元春表示,对于微软小冰来说,这种方式没有任何意义,不会是一个好的商业模式。

2017 年,日本小冰与罗森的合作正式出于这个考虑。在与罗森的合作中,罗森的需求是希望微软能够提供智慧零售方案,需求是一个对话机器人,帮助它去推销商品和优惠券、帮助客户了解商品信息。但微软提供的不只一个小冰 API,而是将微软云 Microsoft Azure 和小冰服务整合起来。假若只提供一个接口,罗森或许可以做出一个有用的机器人,但实现效果和用户体验是没有保证的。

李笛表示,微软小冰的商业模式的核心在于了解客户所在的领域,最终提供的解决方案不是按照客户需求执行,而是了解到客户目的后,为了解决客户问题所交付的完整服务。而且类似的合作中,微软的盈利也不止聊天机器人这部分,甚至可以在优惠券转化上进行分成,商业前景更大。

团队会通过这些商业化合作,去确认微软小冰的研发重心,确认哪个环节可以帮助团队获得未来核心竞争优势。

运用「多模态交互感官」技术,化身活泼少女主导对话

李笛告诉 PingWest 品玩,微软小冰团队研究某项技术,是因为团队认为该技术在短期之内会实践。

李笛认为,人工智慧领域的投入,稍不留意就会耽误大量的时间。这就跟苹果公司在 1993 年推出的 Newton 一样。 Newton 是世界上第一款掌上电脑,iPad 是直到 2010 年才发售的。 Newton 整整领先了 17 年,但最终因为在市场上找不到其定位导致需求量低,而停止发展。

在技​​术上领先市场 10 年,但在这 10 年间可能又会出现新技术,两者之间是没有可比性的,「所以如果你研究一个技术,在人工智慧领域早太多特别惨,你只能证明你想到了。」李笛认为,多模态交互感官会在一两年内普及,特别是在接下来的 5G 时代。

多模态交互感官,是一种融合了全双工语音交互,即时视觉与核心对话引擎的全新交互感官,它能够实现用户与人工智慧同时边听边说边看的互动体验。多模态感官在去年宣布正式研发,在今年 2 月份已在日本微软小冰团队邀请了当地媒体公测。

日本小冰的多模态交互感官体验是通过一个 Android App 实现。使用者带着手机去参观水族馆,手机摄像头捕捉到前方出现的鱼类,日本小冰会与使用者交流互动。

日本小冰不是向使用者介绍鱼的种类,也不是在使用者发出话题后才接腔。她依旧保持了 18 岁少女的活泼可爱,看到鱼会想要吃掉它们,也会主导对话。整个过程里,使用者就像带着女朋友,一块儿逛水族馆。

跟日本小冰一块儿逛水族馆。这个场景看起来有些可怜,但多模态交互感官功能是相通的,这个功能可以运用到更加日常的场景中,比如看护中老年人。当中老年人过马路的时候,由多模态交互感官来提醒他注意来往车辆。

此外,第七代微软小冰还升级了部分核心技术。包括全新的对话音引擎,实现了从「平等对话」到「主导对话」。小冰团队技术负责人周力表示,主导对话在历代微软小冰对话引擎中是很重要的分水岭。

让 AI 拥有逝世亲人的人格,微软小冰走向专属人工智慧

在电商购物领域的实际运用中,小冰在 10 轮对话内,从线上货架中挑选出用户喜欢的商品并推荐,实际达到的转换率从没有主导对话能力时的 47% 增长到 68%。

升级的还有全双工语音交互感官,新增乘车场景,提高人工智慧助手与驾驶员、乘客的互动体验,让人工智慧从智慧中控的角色转为乘客角色。

Avatar Framework 架构大揭密!四种工具构成超拟真 AI

在「第七代微软小冰发布会」上,微软小冰团队公布了 Avatar Framework 的第一个工具包版本,这个框架是微软小冰团队「今年最大的飞跃」,它能够让每个合作伙伴、每个消费者都创造自己的「小冰」。

微软小冰日前公布的一系列的合作都是基于 Avatar Framework 创造出来的。

日本软银研发的人形机器人 Pepper,在其最新的 3.0 版本升级中,使用了 Avatar Framework 实现了情感计算的进步。今年 1 月份,微软小冰「赋予生命」给《全职高手》(阅文集团旗下作品)中的 5 位主角,让原本只存在小说中的人物与粉丝对话,这个项目也是在 Avatar Framework 中诞生。

今年 7 月,小冰在中央美术学院举办的个人画展里,呈现了  7 位女性的画作。除了小冰自己外,还有 6 位不同时代的女性,从 1690 年 12 月 5 日、1802 年 1 月 24 日,到 2019 年 7 月 13 日,时间跨度长达 329 年,她们各自代表了不同的时代特色。这也是使用了 Avatar Framework 的能力。

这个完整的 Framework 主要由四个部分构成。

第一部分是 Profile 工具,它会从 IQ 和 EQ 两方面为 AI beings 定义人格;第二部分的工具,为这个 AI beings 调整核心的对话引擎、电脑语音、电脑视觉等能力;第三部分的工具,则让这个它具有价值观、知识、技能等,让 AI beings 更接近人类特性;最后一部分,Avatar Framework 会驱动一个 3D 模型,让一个虚拟的 AI beings 出现在用户的面前。这四个部分加在一起,构成了完整的架构。

现在的 Profile 工具里,支持 76 项基本讯息和 27 项性格特徵指标,通过调整这些参数,用户能打造出各种各样、形形色色的人格出来。无论是社交恐惧症,还是低情商也都能打造出来。所创造出来的人物拥有自己的性格特点,声线表达和肢体语言,如果他是个没自信的人,就绝不会兴致勃勃地跟你打招呼。

接下来,Avatar Framework 将「赋予生命」给阅文集团旗下 100 部小说的主角。

更令人期待的是,Avatar Framework 不是专属大公司的服务,微软预计在明年春天向个人用户公开这项服务。这意味着人工智慧不再是统一的性格、声音和肢体表达,并且服务于所有人。

伦理问题尚待解决,未来专属 AI 商机无限

目前公布的 Avatar Framework 企业版,包含了需要编程的功能,在个人用户的版本中,这部分会做一定程度的调整,以方便使用。另外,李笛认为个人用户版本可能会涉及到很多隐私数据,製作出来的人工智能,无论是伴侣、朋友或者是公众偶像,都可能会造成侵权风险。目前微软团队正在评估个人用户版本可能会涉及的伦理、法律问题。

让 AI 拥有逝世亲人的人格,微软小冰走向专属人工智慧

假若这些问题全都解决,以后我们每个人都可以拥有属于自己的「小冰」。每个消费者都可以设计出专属于自己的人工智慧,都能获得个人化的人机互动体验。消费者可以设计出自己理想的伴侣、朋友,甚至是逝去的亲人。无论你即将面对的人工智慧有多聪明,运算速度有多快,可能都不如这样一个由你亲手打造的,完全专属于你的特殊存在来得重要。这也是微软正在推动的未来生意。