人工智能真的有创造力吗?
2023/3/11 10:00:00 勿食我黍

    

     作者|罗兰·T. 拉斯特(Roland T. Rust) 美国马里兰大学卓越服务中心创始人和执行董事,罗伯特·H.史密斯商学院市场营销专业讲座教授

     黄明蕙 台湾大学信息管理学系特聘教授,《服务研究期刊》(Journal of Service Research)总主编

     工智能真的有创造力吗?长期以来,创造力一直被视为人类独有的能力。我们讨论过,当前的思维人工智能主要体现在分析层面。虽然人们对直觉人工智能的研究正在取得进展,但这依然是计算机科学领域的一个瓶颈。尽管如此,我们还是看到越来越多由机器创造的音乐和艺术。它们是否具备创意?你喜欢这些作品吗?一件东西是否有创意,能否根据其创造者是机器还是人类来判断?2018 年,《彭博商业周刊》(Bloomberg Businessweek)专门介绍了斯坦福大学研究员罗比·巴拉特(Robbie Barrat)通过人工智能生成的画作,他将数千幅画作示例输入机器,让它们学习如何作画。当期《彭博商业周刊》封面的人工智能画作,看起来像印象派的艺术作品。这是否说明机器也可以具备创造力?这就是本文内容试图回答的问题。

    

     《情感经济: 人工智能、颠覆性变革与人类未来》[美] 罗兰·T. 拉斯特 黄明蕙 著彭相珍 译中译出版社2022年1月

     机器是如何学习的

     我们将思维人工智能,看作一个整体的人工智能阶段。后来,在探讨思维经济的时候,我们借用了 2018年在《服务研究杂志》发表的论文——《服务行业的人工智能》(Artificial Intelligence in Service)中最早提出的概念。在这篇文章中,我们提出了 4 种人工智能水平,包括机器智能、分析智能、直觉智能及情感智能。而思维层面的分析智能和直觉智能的区分,对于回答人工智能是否能够创造以及人工智能如何进行创造的问题来说至关重要,因为直觉智能是人工智能创作的主干技术(情感智能对于艺术的创作也很重要)。直觉智能是介于思维智能和情感智能之间的中间阶段,因为它把机器思维从理性扩展到了有界理性,使机器进行直觉和常识推理成为可能。

     这两个不同的智能水平,恰好对应了机器学习的两种截然不同的方法——映射和推理。虽然现代的人工智能主要是通过映射(即机器学习)获得智能,但映射并不是人工智能学习的唯一方法。我们在前文中已经对此进行了简要论述。在本节中,我们将进一步讨论这两种学习方法,它们如何赋予机器创造性、机器的创造性水平,以及机器进行创造的方法等方面。图 12.1 说明了机器学习的映射和推理方法。这两种方法都可以使用无数种算法及组合,因此我们仅列举一些,以作说明。

    

     映射方法。当前的人工智能学习方法采用了一种映射机制,将机器视为执行特定任务的狭义人工智能。本质上,机器从映射输入对(X,Y)到映射输出对 Y = F(X)进行学习。人们用(X,Y)映射对训练一台机器(即神经网络,或者在深度学习的情况下,训练许多层网络)。如果输入 X,则输出 Y,如果输出不是 Y,则输入不是 X,这就叫训练。训练结束后,当我们给机器一个新的 X 时,它将可以预测 Y。X 可以是任何数据、文本、音频或视频,映射是通过算法实现的。虽然这听起来是个很笨的方法,但如果与超级计算能力结合,这就是帮助当前人工智能实现“春天”(繁荣)的方法,因为它可以将任何类型的(通常是庞大的、非结构化的)数据映射到不同的结果上。但是外行可能不知道,智能机器就是用这种非常简单直接的方式来学习的。这就是我们所说的思维智能在分析层面的应用。

     这种数据映射的学习方法,不需要机器拥有领域知识,不需要机器对问题或环境有深刻的理解,也不需要机器回答问题。因此,我们无法轻易解释机器产生 Y 的“原因”。例如,刘易斯和丹宁认为,网飞的观影推荐网络将客户的全部观影历史、他的评分和其他客户的评分作为 X,并将客户可能喜欢看的新电影作为 Y。我们知道这个客户看电影 Y 的可能性比非Y 的可能性高,但我们不知道客户为什么喜欢 Y,这就产生了我们后面要讨论的“可解释的人工智能”问题。推理方法。这种机器智能方法,使机器具有强大的人工智能(或一般人工智能),并期望机器能够处理各种任务,就像人类具有能够解决常见问题的能力一样。计算机科学家基于这种方法研发的机器,被称为“专家系统”或“知识管理系统”。这样的机器能够积累自己的知识(就像人类从教育中学习,随着受教育年限的增加,而具有更丰富的知识和技能)并用于解决问题。这种方法强调直觉,因为它试图培养机器像人类一样思考。遗憾的是,鉴于计算的“字节”(0 和 1)特性,如果没有超强的计算能力,要想让机器(通过应用知识)进行认知推理的编程太复杂,也不可行。这导致了几次人工智能的“寒冬”,很多人放弃了开发认知机器。推理方法成功应用的前提是直觉层面的思维智能。在人类的学习语言中,我们把这种推理方法称为“理解”问题并找出答案。

     随着新的、多样化的人工智能不断发展、计算能力不断提高,以及计算成本降低,人工智能的能力范围正在向目前的机器可能不具备的多种人类能力靠近。例如,奇点网络(SingularityNET)建立了一个去中心化的全球人工智能网络,旨在通过将互补的狭义人工智能集合在一起,促进通用人工智能的发展。微软最近宣布,将与 OpenAI 合作开发通用人工智能。2011 年,IBM 宣布其人工智能系统沃森在更流利地与人类进行辩论方面,取得了突破性进展。2018 年,“辩论者项目”(Project Debater)推进了沃森的自然语言处理能力,使其能够识别和理解俗语与习惯用语。例如,它可以理解“自找麻烦 / 打开一罐虫子”(open a can of worms)并不意味着某人真的在打开一罐虫子。

     数据图谱能否具备创意

     既然直觉智能还没有诞生,那么数据图谱能不能具备创意呢?我们用两个真实的例子来探讨可能的答案。英国人艾德·牛顿·雷克斯(Ed Newton-Rex)是一名音乐专业的学生,他后来对人工智能产生了兴趣。他创建了一个名为 Jukedeck 的音乐创作系统,该系统已经写了超过 100万首歌曲。Jukedeck 的大脑(除了发明者之外)运用了一种深度学习神经网络方法,它分析了成千上万的现有歌曲。这使得算法能够“学习”一首歌成功的因素,然后利用这些信息创造新的歌曲。类似的创业公司在全球范围内不断涌现,这也引起了音乐行业的担忧,作曲家担心可能很快就会被淘汰。

     2018 年,雷克萨斯推出了《凭感觉驰骋》(Driven by Intuition)电视广告,该广告的剧本完全由 IBM 沃森创作。这是一种认知技术,力求在机器学习的基础上,拥有直觉智能。人们通常认为,创作一个推广产品的广告是需要创意的。广告公司中的这些提供创意的人所处的职位,甚至被称为创意主管或创意经理,这也说明了创意在广告设计中的核心作用。

     这支 60 秒广告的脚本,是运用机器学习编写的。雷克萨斯将近 15 年的获奖豪华车广告、雷克萨斯的品牌数据和情感数据输入机器。这些数据都是 X,它们具备了一个成功广告应该具备的所有成分。然后机器生成 Y,即剧本。作为一个豪华车广告,这支广告表面上似乎具备了一切应有的特征。然而,这则广告究竟是能卖出雷克萨斯汽车,还是只能吸引眼球、引起轰动?在运用一些战略营销的考虑因素对这则广告进行分析之后,我们得出的结论是:这则广告没有明确想要表达的内容。它的客户细分不够明确,价值主张(定位)也十分模糊,看起来更像是各类豪华车广告的不同片段的集大成者。虽然这则广告很新颖,也引起了广泛的讨论,但它能否被认定为能推动雷克萨斯汽车销售的有效广告,仍是一个值得商榷的问题。

     这个例子说明了什么?机器善于识别碎片信息(如成功广告的元素),并将这些碎片组合在一起。但这些碎片的随机组合是否能构成一个有意义的整体,则是另一个问题。这算不算“创意”?当我们说这个广告可能不太符合战略营销的标准时,就引出了另一个问题,即谁有资格评价这支广告是否有创意?我们将在下一节讨论这个问题。

     什么是人工智能创意

     在回答这个问题之前,我们需要解决两个问题:什么是创意?谁是创意的评价者?我们通常认为,创意就是新东西。但这个简单的定义,并没有揭示创意的全部内容。比如,怎样的新,才算是新,才算是创意?如果新的创意没有得到他人的喜欢和认可,还能算创意吗?另外,回顾历史也让我们意识到,时间的跨度也发挥了一定作用。一件作品,可能在创造的时候无人关注,但在很久之后(大多数情况下,在创作者已经离世之后)会被人追捧。典型的案例,就是被称为有史以来最伟大的艺术家之一——文森特·梵高。虽然他的所有画作,在今天都价值数百万美元,但在他生前却基本无人知晓。

     另外,怎样的新才是新?如何创新才是新?这取决于新想法与现有想法的不同程度。玛格丽特·博登(Margaret Boden)在 1998 年发表的《创造力与人工智能》(Creativity and Artificial Intelligence)一文中,讨论了三种类型的创造力:(1)组合性创意(熟悉的想法的新颖组合);(2)探索性创意(现有概念空间中的新想法);(3)变革性创意(新概念空间中的新想法)。

     组合性创意是最低层次的创意,即通过组合熟悉的创意,产生新的想法。例如,一首新的摇滚乐歌曲,也许会融入其他类型的风格元素。虽然这是一首新歌,有一些新的特点,但听众很容易就能分辨出它是摇滚乐。因此,当约翰尼·卡什(Johnny Cash)在歌曲《火圈》(Ring of Fire)中加入墨西哥乐器时,人们依然能够准确地听出这首歌的乡村风格。

     探索性创意比组合性创意的新颖程度更高。因为这里的新想法,是在现有的概念空间中产生的。例如,作曲家鲍勃·迪伦(Bob Dylan)将伍迪·格斯里(Woody Guthrie)的抗议歌曲与摇滚乐融合在一起,创造了一种既有节奏感又有歌词复杂性的新音乐形式。他的音乐对 20 世纪 60 年代最伟大的音乐家,包括吉米·亨德里克斯(Jimi Hendrix)和甲壳虫乐队(Beatles)都产生了巨大的影响,并最终凭借独特的音乐风格与贡献,获得了诺贝尔文学奖。变革性创意是创意的最高境界。在这种创意中,新的想法是作为一种新的概念空间产生的。例如,在 20 世纪 70 年代,德国发电站乐队(Kraftwerk),只带着合成器和鼓机出现在舞台上,其中一些鼓机还是他们自己发明的。这是与过去音乐形式的彻底决裂,因为它既涉及新的乐器,又涉及新的歌曲类型,而这种新的歌曲类型,又演变成现代电子音乐(甚至是嘻哈音乐)。目前,利用机器学习,人工智能可以轻松地实现组合性创意。本章开篇引用的《彭博商业周刊》关于人工智能生成的印象派风格绘画就是这样一个例子。只要给机器输入印象派绘画的色调,机器就能够根据这些现有绘画中的创意,组合出一幅新的绘画。人工智能还被用来创作许多不同的电子舞曲组合。雷克萨斯汽车广告,也属于这一类组合性创意。根据从过去 15 年的获奖广告中提取的数据以及品牌的其他类型的数据,人工智能就可以生成一个新的广告现在的问题是,给机器输入大量的印象派画作,机器能不能在探索性和跨形态的层面,生成新的画作?这意味着,新的绘画不应该只是现有印象派绘画的混搭,而应该是一种新的印象派绘画风格(比如作为探索性创意的后印象派),甚至是一种新的风格,比如表现主义呈现,这才能称得上变革性创意。如果我们给机器投喂各种风格的画作,那么它们可能会因为概念空间的边界模糊(或扩大),而制作出一些探索性的画作。这就把我们引向了下一个问题:谁有资格评价机器输出的创造力达到了哪个层次?

     谁来评价创意?换句话说,谁的视角和品位才算数?新颖的想法不等于创造性的想法。虽然依然存在许多疏漏,但这并不意味着我们不能客观地评价创意。音乐系统 Jukedeck的例子表明,根据现有的成功歌曲人工智能进行深度学习系统的训练,人工智能就可以获得足够的能力,评估新歌曲是否具有相同的成功特征,甚至生成具有这些特征的新歌曲。哪怕是运筹学研究人员,也在寻找新的数学方法来描述音乐形式和关系,并再次使用这些模型来生成新的音乐。但我们怎么知道人类,是否会对人工智能生成的东西感到满意呢?

     要想称得上创造性的想法,这些想法就需要得到人们的赞赏。梅里亚姆·韦伯斯特词典,将创意定义为“具有创造性的品质”(当然,这是一个循环的定义)。它的同义词包括聪明、想象力、创新性和原创性。这个定义表明,创意不仅仅是新的东西,还要求新的想法得到人们的欣赏。例如,听计算机生成的音乐,并不总是一种享受,即使(尤其是)它是新的和非传统的音乐时。一个新的想法是否会被欣赏,是因人而异、因文化而异的。以雷克萨斯汽车广告为例,虽然机器从输入的数据中学习并生成了广告脚本,随后由获得奥斯卡获奖导演的凯文·麦克唐纳(Kevin McDonald)进行了审核,很显然,他认为这个广告是可行的,但从战略营销的角度来看,我们依然不太相信这支广告的效用。这个广告所引发的争论也显示出不同的人对这个广告有着不同的评价。我们都知道,情人眼里出西施,也就是说,对创意的评价,是在一个文化上得到认可的概念空间里,基于各不相同的个人品位而作出的。因此,如何评价人工智能创意,将是一个比新颖性更难的问题。

     创意的评价,涉及对创意的主观感受,涉及非常主观的喜欢或不喜欢,而不是客观的正确或错误。这就要求情感智能,这也是为什么人工智能的创意,需要机器的直觉智能,因为直觉智能是介于思维智能和情感智能之间的过渡智能水平。

     直觉人工智能

     我们已经讨论过,常识和直觉是机器更难学会的东西,尤其是在使用数据映射方法学习的基础上。我们在本章的前面也提到,包括微软和 IBM 在内的许多科技巨头,都在竞相研发能够理解常识和直觉的通用人工智能。一个有趣的、重要的、相关的问题是:鉴于“黑盒子”式数据映射学习已经成为主流,计算机科学家们正在努力追求“可解释的人工智能”,以期开发出透明的机器,这意味着人类可以理解机器如何产生输出,以及输出的意义。然而,如果常识和直觉,很难在逻辑上解释(因为它们是作为给定的学习),那么我们如何让机器理解和解释直觉呢?例如,当我们说一个女孩“被击倒 / 绝代佳人(knockout)”,我们并不是真的要把她打倒,而只是想表达她非常漂亮。目前的映射学习,很难识别这样的口语和习语(非母语者也很难理解)。对人类来说,直觉往往是无法解释的,那我们怎么可能让机器理解和解释直觉呢?

     这反映出目前对可解释人工智能的呼吁,应该重新考虑“需要解释什么”的问题,尤其是对直觉相关的问题。我们的目标是开发能够考虑到那些超出规则之外的映射算法和模型,比如是情境感知的人工智能?还是指将常识和直觉解释为机器输出(比如机器如何生成一幅画、音乐或创新)?

     机器如何才能具有创造力(机器创新)

     前面的内容将机器作为创意实体进行探讨,也就是说,机器能否自主发挥创意,比如作曲或画画。但机器可以在创意中扮演另一个角色,即作为创意工具,与人类创作者合作。在这个意义上,机器被当作一种新的发明方法。在这种方法中,创造(或商业世界及经济领域更常见的“创新”)成为机器和人类的共同工作,机器负责分析和认知的任务,人类负责直觉和情感的部分。例如,我们看到“情绪摇滚”音乐在流行领域的兴起,因为音乐的认知部分越来越多地由鼓机、合成器和计算机来承担。在这种情况下,我们依然认为创意主要是人类的领域,因为它具有文化和社会的内涵,而思考型人工智能主要作为人类创意的灵感来源。

     我们认为机器作为人类创意灵感来源的作用,对创新有重要影响。本文的作者之一,在目前的一个项目中,就应用了这种方法。应用人工智能的目标,是确定服务研究的重点。这个项目大约每五年做一次,研究结果分别于 2010 年和 2015年发表在《服务研究杂志》上。2015 年的论文被大量引用,也说明人们知道服务研究的优先事项是什么的强烈需求。传统的获取优先级的方法,是在全球范围内进行多轮的服务专家访谈和调查。这是一种劳动密集型的方法,并且需要依赖于数量有限的服务专家的意见。

     在 2020 年的项目中,我们决定用机器学习来帮忙。我们在网络上收集了数千篇关于全球服务和技术问题及趋势的文章,并利用话题建模和情感分析,从文章中找出有意义的话题及其情感(这些话题的积极性和消极性如何),从中确定了服务研究的优先级列表。其中,我们最喜欢的一个优先级是“资本主义的未来”,它反映了全球金融市场增长和债务的趋势,以及可持续的服务投资和治理。关于这一优先级的情绪相当积极,说明人们对资本主义的未来抱有乐观态度。

     利用这个研究方法,我们研究的文章范围不再局限于几个专家访谈或调查,而是通过无监督的机器学习,从海量的数据中发掘主题,这意味着我们并没有给机器提供一组预定义的主题。这个项目最终研究的各项主题,以往不太容易被研究人员预见,因为这样的彻底调查需要检索和阅读成千上万的文档。而人类专家在对主题的最终解读中应用了人类基于知识的洞察力,完美地总结了该项目的研究成果。这种人工智能与人类智能合作的最终结果,超过了机器或人类单独作战的能力,说明了人工智能如何作为团队的一部分发挥作用。

     这个例子,充分展示了机器可以被用于创新,扩大了人类想象力的范围。许多商业人工智能应用,都使用类似的方法来促进研发(R&D)。例如,制药公司使用预测分析和自然语言处理(NLP),推动药物的研发,并跟踪其治疗疾病的有效性。

     人工智能可否具备创造力

     基于上面我们讨论过的两个考虑因素,即什么会被视为创意,以及如何判断它是否可被视为创意,很多人认为创造力是人类独有的。在这些基础上,很多思想家得出结论:创造力是人类特有的能力。例如,博登说:“创造力是人类智慧的基本特征,也是对人工智能的挑战”。回到本章开篇提出的问题,关于人工智能是否具备创造力,我们的回答是:这取决于机器在创造过程中发挥的作用。如果将机器作为创造性的实体,那么答案是肯定的,但机器创造的时代尚未到来,因为具有创造力的先决条件,是具备思维和情感两种智能,并创造人类喜欢的东西。机器目前最多只能做到直觉智能(且当前的水平有限),尚未具备情感智能。但毫无疑问,随着计算能力的进步,机器的计算能力会变得越发强大。但机器是否会产生或发展情感能力,仍然是一个没有定论的问题。

     如果机器作为创造的工具,那么答案是绝对肯定的。机器可以辅助人类进行创造。机器在这方面具备巨大的潜力,并且已经得以广泛的实现。通过强大的数据映射,机器能够辅助人类的创意,并创造出似乎能够通过图灵测试的创意作品。这就意味着,这些由机器产生的创意,看起来像人类的发明(如本季新设计的服装),被人类(如设计师)认可,得到人类(如消费者)的喜欢。以这种方式机器增强了人类的创意能力。

     需要注意的是,虽然机器大多还没有达到自主创新的水平,但人类已经无法阻止机器向具备人工智能创造力的方向持续进步。我们已经看到,人工智能可以编制音乐、创造艺术和写故事。正如博登所断言的那样,尽管创造力对人工智能来说是个挑战,但要想达到像人类一样的智能,人工智能就必须对创造力进行建模。

     我们同意这个观点,我们的多元人工智能观点,也反映了这一点。因此,我们的论断是,这不是机器能否具有创造力的问题,而是机器如何具备创造力的问题。机器应该通过模仿人类的认知推理,还是通过数据映射来具备创造力?

     如果我们将这两种学习方法纳入考虑范围,直觉人工智能就为机器提供了一个具备创造力的机会。直觉人工智能不是基于数据输入的理性认知机器,而是需要能够跳出思维定式,也就是说,单靠其中一种学习方法可能不够。认知推理的方法,对于创意来说可能过于理性。我们通常不会因为艺术家的科学思维能力,而认为他们是有创造力的,即使魅力四射的女演员海蒂·拉玛(Hedy Lamarr)的发明是现代 Wi-Fi 和蓝牙的技术基础,皇后乐队的吉他手布莱恩·梅(Brian May)拥有天体物理学博士学位。另外,数据图谱的方法可能过于机械化,无法发挥真正的创造力。如上所述,这种类型的创意通常停留在组合创意层面。

     总而言之,我们可以期待的人工智能创意主要有两种类型:(1)与人类合作,由人类的直觉辅助,产生一些看起来像人类发明的东西,并受到人类的喜欢;(2)以机器的方式,产生一些真正独特的东西,也许会将机器学习的两种方式结合起来进行。我们已经看到前一种人工创意在快速推进,随着人工智能的进一步发展,我们认为,最终可能会看到后一种人工创意的到来。

     —End—

     本文编选自《情感经济: 人工智能、颠覆性变革与人类未来》,注释从略,题目为编者所加。特别推荐购买此书阅读。该文由出版机构提供,只做推荐作者相关研究的内容参考,不得用于商业用途,版权归原出版机构所有。欲转载,务必留言说明。何商业运营公众号如转载此篇,请务必向原出版机构申请许可!

     点击下列标题,延伸阅读

     许成钢 | 人工智能:又一场创造性破坏的产业革命

     人们希望将一切事物都“数字化”,却不得不面对焦土般的“末日白板”

     人工智能是否将成为人类的末日?关于AI的五个生存威胁|托比·沃尔什

     ----------------------------------

     混乱时代 阅读常识

     欢迎读者点击关注,出版机构、媒体合作可留言?

     ? 点击阅读原文查看更多好书

    源网页  http://weixin.100md.com
返回 勿食我黍 返回首页 返回百拇医药