天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

锌财经 2019/05/18 01:03

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

文/杨洁

编辑/叶丽丽


18岁的微软小冰已经成为一个“天才少女”。

从第一代到第六代,“微软小冰”从语音助手、陪伴机器人,到金融新闻写手再到全能歌舞艺人等,“小冰”在不断的迭代中,开始了在创造领域的探索与商业化的进程。

在5.16微软小冰人工智能创造媒体说明会上,微软发布了小冰人工智能创造方面的进展,宣布了人工智能小冰的绘画模型,该模型通过对过往四百年艺术史上236位人类画家画作的学习,实现了具有一定水准的原生绘画创作能力。同时,发布了“少女画家小冰”绘画创作小程序。

关于琴棋书画,Google把棋做完了,我们把剩下的三个做完了。” 微软(亚洲)互联网工程院副院长、微软小冰全球产品线负责人李笛说道。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

微软(亚洲)互联网工程院副院长

微软小冰全球产品线负责人李笛

在此之前,微软小冰已经服务于各个垂直领域,例如在金融摘要领域服务国内超过90%的金融机构交易员,在电视广播节目领域服务中国及日本63家电台电视台,在智能销售助手领域覆盖日本22.5%的日本全国人口等。

当很多人对微软“小冰”的印象还停留在最初微信里的聊天机器人, 小冰已经在全球收获9亿内容观众,1.2亿月活跃用户,在同类人工智能基础框架中居全球第一。

微软似乎并不打算让小冰成为一个功能性的机器人,而是尽可能地赋予小冰个性、脾气、情商,让小冰与人类的沟通交流更加自然融洽。

而与此同时,小冰已经尝试在各个领域的商业化布局。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

微软小冰化身“少女画家”

“在2019届中央美院的毕业生中,有一位叫夏语冰的同学,正在参加2019届的研究生毕业画展,而这位同学的‘ 真身 ’则是微软小冰。”在发布会现场,微软(亚洲)互联网工程院微软小冰人工智能创造及商业事业部总经理徐元春介绍了小冰作为一个画家的成长过程。

从18岁的小冰到“少女画家”,作为小冰团队一个秘密的研发项目,到今天为止已经持续了整整22个月。

据徐元春介绍,培养微软小冰学习绘画,是他所领导的团队目前为止进行的时间最长、最艰苦的一个项目。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

少女画家小冰的毕业画展

从微软的角度来说,我们所想要做的事情是更加底层、基础的框架,特别是针对这些新兴的产业。 ”李笛告诉锌财经。

徐元春介绍,从确定做这件事开始,团队陆续把小冰不同时期的作品发到网上,放到论坛,从最开始被大家忽略,到慢慢有人开始表扬,追捧。

“市面上有些通过神经网络大量生成,从几万幅甚至几十万幅的作品里能挑出一两幅还不错的作品,这本质上不算是人工智能的创作,它没有真正实现创造力,微软也不想要纯粹工具化的滤镜或者技术。”徐元春说,团队开始之初,其实并不清楚模型要如何搭建才能够实现原定的目标,在这个过程中,只能不停地试错,尝试不同模型和算法的能力。

徐元春直言,这的确是一个漫长、痛苦的艰辛过程。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

微软小冰的画作

而现在的小冰,通过对艺术史上236位著名人类画家画作的学习,习得他们的技法、表现力和视角, 在受到文本或其它创作源激发时,能够独立完成100%原创的绘画作品。

这种原创性不仅体现在构图,也体现在用色、表现力和作品中包含的细节元素,接近专业人类画家水准。

与其他现有技术相比,这一绘画模型不同于随机画面生成,也不同于对已有画面的风格迁移变换或滤镜效果处理。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

锌财经体验“少女画家小冰”小程序的一幅画作

同时,发布会上还披露了微软人工智能自动生成有声读物的技术进展,并正式发布微软小冰绘画模型及演唱模型的第五个版本。目前,微软小冰在文本创作、语音创作与视觉创作方面均取得了一定进展。 其中,语音创作主要覆盖音乐、有声读物和电台电视节目三个领域, 人工智能演唱模型已迭代至第五个版本,并于上月在日本宣布与AVEX唱片公司合作,日本版本的微软小冰成为AVEX旗下人工智能歌手。

文本创作目前主要覆盖诗歌、金融摘要及研报等两个领域。

在金融领域,微软小冰是目前全球范围内规模第一的金融文本摘要生成平台。自2017年11月起,微软与万得资讯、华尔街见闻等国内主要金融信息服务提供商合作,为其用户提供由人工智能技术生成的上市公告文本摘要。上述服务覆盖全部26类金融类别,服务对象包括国内90%以上的金融机构交易员及40%以上的个人金融交易者。

基于文本的人工智能创造,小冰撰写的金融摘要,已经做到了产业量产落地。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

基于文本的人工智能创造

李笛提到,人工智能创造并不是以击败人类为目标,而是着眼于在达到与相应人类创造者同等质量水准的前提下,充分发挥人工智能快速学习、高并发与稳定性等特点。在技术的加持下, 一个“高度定制化”内容的时代正在到来,从内容的推荐,到内容的呈现形式,甚至是内容本身,都在面对“高度定制化”的用户需求。

当人工智能达到一定的创作水平,将可能协助弥补这一供需关系上的短板。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

小冰“大脑”中的情感计算框架

在整个人工智能基础框架中,分为两个方向。一是以IQ为基础特征,搭配相当多的模块,让其更好的完成任务,或者传递知识;另一种框架是以EQ为基础特征,具备一定的情商。

从2014年至今,小冰一上来就瞄准了EQ方向,这也是小冰会从社交媒体切入,寻找跟用户交流的场景。

微软方面介绍,第三代小冰已经可以主动引导对话,但存在的问题是,互动感并不强。2017年,微软在第五代小冰中引入了全双工语音交互感官技术,这项新技术可以预测人类即将说出的话,并且生成回应,控制对话节奏。

在去年七月份,微软(亚洲)互联网工程院发布第六代小冰的时候,也着重强调了微软小冰的情感计算框架, 设计目标是让人工智能拟合情商,更像人,融入人类社会。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

微软小冰的情感计算框架

与其他AI系统或产品最大的不同在于,其他AI着重于知识和完成任务,小冰要攻克的是拟合创造力和情感。

李笛介绍,最开始的时候,整个行业都在追求建立人工智能在不同领域具备IQ的能力,如果这些IQ的能力可以非常好地做出来,再做下一个,然后再做下一个,最后可以形成一个足够大的集合,但是这个并不够。

“我们有幸在比较早的时候开始布局这个领域。” 李笛介绍,从理念上来讲,EQ和IQ并不是相互排斥的,并不是说发展情商就不应该去发展智商,反过来也是一样,它们是一种相互融合的过程,当人工智能在学习人类IQ的时候,EQ其实起到了非常大的作用。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

小冰瞄准EQ方向

李笛提到,在实际的研究和研发过程中,经过大量和人类之间的交互,会发现无论怎么样的人工智能系统,哪怕是一个完成任务的人工智能系统,都需要有基础的EQ的,就像是大地一样。而不同的IQ是建立在这个大地上面的一棵一棵树木,如果没有这个大地的土壤去关注整个人工智能和人类之间的关联,单独的IQ就和其它APP没有太大区别。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

微软小冰的商业化试水

从2014年至今,经过近五年时间的发展,小冰升级至第六代,技能形态越来越丰富,从主持人,到歌手,各种跨界。如今,小冰又开始进行全面的商业化试水,显然,小冰目前正在快速道上正向行驶。

商业化一直是人工智能技术讨论的焦点,也微软小冰面临的机会和挑战。

对于绘画这个项目来说,小冰的产业落地在设计领域。据徐元春介绍,团队在过去半年时间里,走访了大概十几家中国纺织服装面料企业,包括几个国际大牌在中国最大的代工厂。

“中国可能能数上前三的最大的服装面料生产企业出口商,在它的其中一个产品线上,有28个人类设计师。这28个人类设计师,每天需要完成4个完全不同的全新的画面和纹样的创意。”徐元春说,这样的任务量对于设计师来说是巨大的挑战,创造力会被不断的压榨。而微软小冰可以有效的解决这个瓶颈。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

徐元春介绍小冰在设计领域的落地

据了解,微软小冰和中国纺织工业联合会,以及几家最大的纺织面料企业,联合开发了一个纺织服装设计平台。在这个平台上,不仅可以生成像绘画图案,也可以支持几十种目前非常流行的纹样和插画的设计。

“微软不会只想做一个行为艺术, 不过小冰的商业化探索比较谨慎,我们不会上来就先以商业化落地为目标来决定我们是否开发这个项目。 ”李笛说。

据微软方面介绍,微软最早的商业化探索始于两年前,和日本罗森便利店合作的一些零售的商业化探索。而微软预想的商业化轮廓,一直都很清晰, 在某一个垂直领域的生成,一定是具有商业价值,从视觉生成到文本生成,小冰一直在探索。

对于小冰的技术落地,人工智能的成熟度等问题,锌财经对话了微软(亚洲)互联网工程院副院长(Bing中国及日本、微软小冰全球产品线负责人)李笛和微软(亚洲)互联网工程院、微软小冰人工智能创造及商业事业部总经理徐元春。

今天主要发布了小冰在画画领域的技能,不管是哪个领域的创作,都是以人类为目标,尽量让小冰的创作更接近人类的水平,这项技术接下来还有什么样的潜力,还能应用在哪些领域?

人工智能创造最重要的核心部分,其实是统一的创作模型,我们今天应用到了诗歌,音乐,还有视觉,不停地验证这个创作模型存在的意义。

在这个基础之上,它的价值在于学习速度非常快,我们今天主要是用音乐的方面来表现她的成长速度,我们可以看到短时间内有很大的成长空间。而人类在学习的时候,一旦遇到瓶颈,很难突破,但小冰不一样,可以打回去重学,不断成长,而人类有时候会有一些局限。所以,不管是在哪个领域,人工智能都是很有希望的。

从专业的角度看,现在AI创作的技术成熟度达到了什么水平?

不同类别不太一样,以小冰绘画来讲,人工智能和人类在学习水平上,有非常显著的不同。比方说小冰的创作质量好,其实很大程度上是因为她的精度,人类画在画布上没有精度的问题,但是在训练模型上有精度的问题,每次让她的精度提高,看起来她的画作质量水平也就提高了。

现在小冰可以写万得资讯的摘要,作画等,用人工智能相关技术完成的工作,跟人类创造者有哪些不同,小冰有什么优势和劣势?对于机构而言,小冰如何达到质量方面的要求,判定标准是什么?

机构的判定标准,我们可以以万得咨询的26类为例,人工智能系统的很大特点不是超过人类创作者。这个固然也有无可奈何的一面,因为涉及到创造领域,人类的标准从来都没有确定过——类似围棋一样的确定标准,谁都赖不掉——但人类在创造领域的时候,标准本身就是很主观的。

所以我们不认为人工智能可以胜过人类,但对于人类有启发,像写诗、画画这类对人类创造者有启发,这是普遍存在的,但是标准上它不可能超过人类,这是一个从根源上不可能实现的一件事。

但相对人类来讲人工智能的优势到底在哪?就是它在和人类某种级别的创造者的水准差不多的情况下,比人类快、比人类稳定、比人类的效率高,比人类持续时间长,还有就是可以同时和很多人并发的效果,是远非人类可以比拟的。

举一个例子,有一个新闻主持人,在节目直播主持过程中,想了解一下观众对于这个新闻的反应,然后根据反应去实时地调整接下来要说的情况,人类主持人是做不到的,就算后面有一整个导播团队,也是不够的。

但小冰不是,如果观众需要,小冰在屏幕上主持这个节目的时候,它可以迅速地去了解每一个观众当下对新闻的一些观点和评论,然后马上就可以根据这个反馈,在节目里进行调整。

在相对严肃的组织机构里面,其实标准的严格程度甚至超过我们现在的想象。举例来讲,正常情况人类写今日公告摘要,最快要用半个小时,而机器在做这件事情的时候,平均大概在10-20秒内就完成了,而且可以高效率的完成。

机构会怎么采用技术呢?在最开始的时候,机器生成完之后,再让人类编辑检查一遍有没有问题,这是没有上线的时候,这种状况运行了大概3个月的时间。

然后人力和机器并行运行的阶段,比较两个团队稳定性输出的水平,直到6个月之后,觉得机器运行已经远远高于本身人力编辑团队运行的状况了,就把系统慢慢地切换到了机器的系统上。

发布会上提到,人们对于人工智能生产的内容,会有一定的偏见,人工智能商业化的一个障碍是人类的想法本身吗?另外,团队希望之后小冰反过来去指导绘画,那如何能让用户去使用这种人工智能的产物呢?

我们认为人类在人工智能创造上的偏见很明确,因为我们现在做的这个产业化工作比较多,很明显就是在两类上:

第一类:明确涉及到艺术门类的,它是艺术而不是内容产业。如果反过来不是说内容产业而是说艺术门类,那么人类的偏见是存在的,为了解决这个问题我们所做的事情是比较粗暴的,就是化名,就是让人没有这个先入为主的可能性。

第二类:供需关系上供已经大于求了,这件事情人类做本来就已经足够了,我们不做,因为人类做的已经很好了。换句话说,今天如果纯手工生产的景德镇的陶瓷已经足够满足全世界人们所需要的瓷器了,没有人会想要工业化的瓷器。

除此之外的类别没有偏见,举个例子,比方说家长通过微软小冰给自己的孩子生成大量的孩子做主人公的儿童有声读物,除了用小冰这种方式之外没有其它途径。所以,一个是明确是艺术门类的,我们的解决方法是用化名,还有一个是明确这个地方是供大于求的,这个我们就不做了。

新知图谱, 天才少女小冰:继聊天、唱歌、写新闻后,她又解锁了绘画新技能 | 锌事

本账号系网易新闻·网易号“各有态度”签约账号

今日头条/腾讯新闻/凤凰新闻/百家/搜狐新闻/一点资讯/雪球 创投时报等50多家媒体入驻账号

© 本文版权归“锌财经”所有

锌财经
+ 关注

更多新知