社科网首页|客户端|官方微博|报刊投稿|邮箱 中国社会科学网
新兴领域

【李丰】人工智能与艺术创作——人工智能能够取代艺术家吗?

 

2016年开始, AlphaGo为代表的人工智能 (Artificial Intelligence, 简称AI) 大出风头, 并成为学界和业界持续讨论的热点。人工智能本来并不是新话题, 这次大放异彩是因为深度学习卷积神经网络算法实现了商业级突破, 从而打开了一片广阔领域。这个突破被认为是一个科技革命级别的进展, 因为这种策略的成功并不限于围棋领域, 而可以在多个领域实现同样级别的进展并产生颠覆性影响。这其中也包括艺术领域。譬如, 20158月德国西奥综合神经科学研究所在arXiv.org展示了研究成果, 让基于深度学习算法的AI通过对梵高作品的“训练学习”而掌握了绘出梵高作品的能力, 即能根据输入的实景照片“绘出”一张具有梵高典型风格的画作, 以至不知情的观众可能将之认作梵高未被发现的作品。12016, 微软公司开展了一个类似项目“下一个伦勃朗”, 即试图“教授”一个AI“学会”伦勃朗的绘画选题与技巧, 最终成果是由AI生成了一幅伦勃朗式男子肖像画并通过3D打印出来。可以说, 把这幅作品挂到伦勃朗博物馆里也毫无异样。2而在20181023日佳士得Prints&Multiples拍卖会上, 一幅被叫做Edmond Belamy肖像的AI作品还将以七千到一万美元的价格起拍。3

已经和将要进行的类似尝试还有很多。这就带来了一个问题, AI最终有没有可能像它在围棋领域碾压人类棋手一样, 最终超越并完全取代人类艺术家?有些人乐观地认为随着深度学习算法的潜力被挖掘出来, 这是迟早的事情, 或者说人工智能在任何领域超越人类都只是时间问题, 艺术AI超越人类艺术家只是其中的子问题。也有人认为这并不会成为现实, 因为围棋与艺术创作属于不同的领域, 而人工智能按现有算法, 无法具有真正的创新能力。当然, 更多人持一种观望态度, 对此不置可否, 我们在这个问题上的直觉也的确是很模糊的。

本文的目标正在于澄清这个问题。

一、艺术概念的创造性要件

对于艺术家来说, 艺术作品可分为“创作”和“习作”。“习作”指为了实现特定训练效果而做的针对性练习, 临摹或模仿别人的作品也没有问题, 并不必然要求作者独特或完整的表达;而一件作品能被称为“创作”最重要的特征就是, 这件作品或是主题观念, 或是表现手法, 至少在一个方面是崭新和独特的。这有时依赖于艺术家对私人经验的深度挖掘, 有时来自于艺术家单纯寻求与他人或既有作品的差异。总之, 只有具有了某些创造性因素, 才称得上“创作”。

所谓“创造”, 按其本意, 意味着从无到有, 不依赖任何前因而凭空产生出了超越既有经验的新因素。新创造物与既有物应有着本质差异, 因此无法被归入之前的类别之中。“创造”曾被认为是上帝的特权, 随着人文思潮兴起, 人的创造能力得到了确认和强调。在艺术史上与此对应的是, 文艺复兴前所盛行的是写实倾向的宗教画, 艺术被定位于忠实地反映自然或为宗教教化服务, 并默认了对人创造性的压制;而文艺复兴之后的艺术史历程可以看成是对人的创造能力不断肯定和解放的过程。在现代派之后的当代艺术更明确把“创新”和“突破”作为核心目标和取向。

这要求艺术家总要在既有艺术经验范围之外提供一些“彻底的新东西”出来。所谓“彻底的新东西”, 意味着其不能被既有的创作原则所统摄, 甚至是对传统的彻底决裂。这些新经验扩充了人类直感经验范围, 同时这个扩大了的范围又成为了新的超越和突破的对象。这是对艺术概念, 尤其是当代艺术概念最纯粹和最狭义的理解, 否定这一点就完全无法整体把握当代艺术脉络。也正因为当代艺术创作的目标就是定位于打破固有和习惯性的理解方式, 当代艺术品常表现得“令人费解”, 但这正是凸显其创新本质的内在要求。

如果一件作品完全落在了某个传统之内, 或本身就是一种重复和模仿, 那么就丧失了被载入艺术史的资格。这本身也是艺术史生成的基本逻辑, 积极介入传统可以让艺术家更容易被理解和接受, 但艺术家对艺术史的否定性“借鉴”和重新定义使其能够被载入艺术史。即使在前现代, 艺术史的形成逻辑也绝不是单纯地记录, 巨大数量的艺术家群体中技法足够精湛的艺术家并非少数, 但能被载入艺术史的终究寥寥无几。这纯粹是因为外在偶然原因吗?即使在写实主义的大框架内部, 能被载入史册的艺术家也一定是在技法或效果呈现上有所创新或具有独特性。所以, 艺术, 尤其是当代艺术的核心精神之一就在于突破和超越既有经验, 而不是重复、模仿或仅仅技法上的纯熟。框定了我们所讨论的艺术创作的基本含义之后, 我们再来看另一个主题, 深度学习人工智能。

二、深度学习的基本原理

“智能”可泛化为一种信息处理系统。人类接受外在刺激并做出反馈, 以实现具有明确目的性的复杂功能, 因而被认为是具有智能的。人工智能则意味着这样一种信息处理系统是由人工设计和制造的。而本文谈及人工智能的含义比字面意思要更加狭窄, 即特指以AlphaGo为代表的基于深度学习卷积神经网络算法的人工智能。

经典的人工智能算法可以被看成是建立在“归纳建模”思路上, 即模型来自于对规律或规则的归纳, 建模即在描述被描述对象的规则或本质, 所以模型中的每个变量和函数都具有特定的规律或规则意义。这是我们熟悉并能够直观到的建模方式。譬如战胜卡斯帕罗夫的“深蓝”电脑程序就是技术人员根据几个国际象棋大师顾问的总结意见设计的。所以其基本设计思路是借助模型进行穷举, 即利用计算机的计算力优势遍历一步棋后的所有可能性 (事实上深蓝的算法有“剪枝”优化, 并非“所有”可能) 。对于设计人员而言, 深蓝电脑是一个透明的“白箱”, 深蓝电脑的对弈策略不会超出设计人员的理解, 只是利用了计算机计算速度更快的优势而已。这跟用计算器计算多位数乘除的运算比人心算的速度更快并没有本质区别。这很直观也很容易理解, 所以我们也很清楚深蓝的可能性界限所在, 即深蓝的博弈策略本身不会超出编制程序的象棋专家的掌握范围。

而围棋、图像识别、金融交易等领域比国际象棋要复杂得多, 所以无法用归纳建模的方式来处理。也正是思路上的转换, 导致了AlphaGo强大而神秘的力量。深度学习卷积神经网络的核心思路在于建立一个“预测模型:用一个拥有大量参数的万能函数来拟合用户所提供的训练样本。这个数学模型如同一个橡皮泥, 可以通过变换它的参数集被塑造成任何形状。”4数据拟合是一种把现有数据通过数学方法来代入一条数式的表示方式。现实应用中, 我们常会获得一些离散数据但又希望得到一个连续的函数或更密集的离散方程与这些离散数据相吻合, 这也就是拟合的过程。“利用用户提供的训练样本对模型进行训练的目的, 就是选择最优的参数集, 使模型能够很好地拟合训练样本集的空间分布。通过训练得到的预测模型, 实际上把训练样本集的空间分布提取出来并编码到其庞大的参数集中。利用这个训练好的预测模型, 我们就能够预测新的未知样本x的标签或属性。”5

围棋的“取胜规则”比围棋规则本身复杂得多, 人类棋手无法用归纳方式完成。AlphaGo“利用深度卷积神经网络这个万能函数, 通过学习来拟合两千多年来人类所积累的全部经验及制胜模式, 并将其编码到神经网络的庞大参数集中。对于当前棋局的任何一个可能的落子, 训练好的神经网络都能够预测出它的优劣, 并通过有限数量的模拟搜索, 计算出最终的获胜概率……由于AlphaGo对每个落子以及最终胜率的预测, 是建立在围棋界两千多年来所形成的完整知识库之上的, 它的预测比人类最优秀的棋手更准确。”6可见, AlphaGo所找到的围棋取胜规则一定超出了人类理解, 因为预测建模是在用拟合方式刻画离散样本间的外在联系, 因此“万能函数的参数一般不具备任何物理意义, 模型本身往往只能用来模拟或预测某个特定事物或现象, 并不能揭示被描述事物或现象的本质及内在规律。”7所以即使是AlphaGo设计者也不可能直观把握到。对于设计者来说, AlphaGo一旦开始了训练和学习, 它就变成了一个以最终取胜为导向的“黑箱”。设计者只能根据AI系统输出的外在结果来检验其运作有效性。所以AlphaGo给我们一种强大又神秘的印象, 乃至让我们对AI的能力做出过多想象。

熟悉深度神经网络的基本原理, 了解AlphaGo的强大能力是如何获得的对于处理我们的主题非常重要, 因为这既框定了我们的讨论对象, 也为问题本身提供了解答思路。我们可以看到, 深度学习算法有两个关键步骤:

1. 通过“训练”得到拟合了足够多样本的参数集和万能函数, 即一个“预测模型”。

AlphaGo就拟合了两千年来人类积累的全部经验及制胜模式, 并通过不同版本的自我对弈生成了3000多万个对局, 并编码为庞大的参数集。

2. 根据这个预测模型来处理和评价任何新样本, 或在诸多新样本中选出与已有模型拟合度最高的那一个。

在对弈中, AlphaGo就是借之前得到的预测模型评估每一个可能落子点所带来的获胜概率, 并总是选择胜率最大的那一步棋来走, 以此发挥出计算机 (远超任何人类棋手) 的稳定性优势取得最终胜利。

在这样一种策略中, 隐含着一个重要预设, 即新样本与旧样本被看成是同类的事物。因为只有这样, 才有理由将根据旧样本得到的模型应用于新样本。这个预设在我们处理下棋、人脸识别、金融乃至政治决策之类的情形时是没有问题的, 因为在这些领域, 我们遇到的几乎全是重复性经验, “日光之下, 并无新事”。我们默认围棋的取胜规则、人脸的特征或群体人性是不会变化的, 所以只要样本数量足够大, 取样方式和算法设计足够合理, 那么就可以针对这些复杂领域的问题建立起有效的模型来, 进而处理在时间上属于新情况, 但本质上并不会脱出既有样本范围的新对象或新样本。

三、原则上的不相容性

至此, 我们可以把以AlphaGo为代表的人工智能突破的基本原理概括为:利用深度学习算法和计算机的算力优势处理数量巨大且纷乱复杂的历史样本, 从中得到一个预测模型, 并以此处理与历史样本同质或相似的新样本。但这种策略在前述诸领域的有效性恰恰导致了这种策略在艺术领域里的注定失效。而且这种失效是概念上的, 内在于深度学习原理和艺术概念本身, 不可能随着深度学习算法的改进而解决。

按我们上面的分析, 艺术概念本身蕴含着对既有艺术经验的突破, 创作总意味着扩展了既有艺术作品的范围, 换句话说, 一个艺术创作新样本只有不能被深度学习算法根据艺术史经验建立起来的万能函数所完全拟合, 才算得上“艺术创作”。深度学习算法本质上是经验回溯式的, 既没有脱离既有经验的取向, 也没有脱离既有经验的可能。而艺术家对经验的利用方式不同于AlphaGo, 后者是对既有经验的模仿与拟合, 而艺术家会在借鉴之外最终谋求对经验的否定和差异化。深度学习的运作机制与当代艺术的本质旨趣在根本上是逆向而行的。艺术家与“时尚引领者”之间一个共同点是二者都始终保持一种不断突破当下的态度。如同“对时尚的紧追”总意味着已经落后于时尚, 深度学习对既有艺术经验的充分模仿也意味着如此产生的作品注定失去了艺术性。换句话说, 卷积神经网络在技术上越成功, 在艺术上也就越失败。所以, 文章开头提到的AI作品就首次以AI作为创作手段来说是艺术性很高的, 但就AI产生的画面本身而言, 已然不能算作真正的艺术创作。

但既然“创新”首先是一种否定性含义———与既有经验存在着差异, 那么似乎只要避免了重复就可以算作“新”, 而“随机性”就有机会满足这个弱化了的否定性要求。如果一个艺术AI在创作时加进随机参数, 似乎就有可能得到超出既有经验范围的艺术作品。单纯从第三人称视角判断, 我们不能否认这种可能。可以想象, 艺术AI给出的一件作品很可能被认为比一些普通艺术作品更加出色, 或像文章开头提到的AI作品那样, 至少不亚于普通人类艺术家作品。

这就涉及到艺术概念的意向性要件, 即艺术行为总是一种意向行为, 艺术品总是作为意向对象而存在。所以, 仅仅根据第三人称经验并不能判定一个物件是不是艺术品。有些奇石“鬼斧神工”、“巧夺天工”, 有足够的审美价值, 但本身却不是艺术品;假设因为偶然原因, 一群蚂蚁组成了达芬奇素描的图案, 也不能被认作一件艺术品。而意向性对于艺术品的认定却可能是决定性的, 如丹托在《寻常物的嬗变》中举的例子, 同样一块红色画布, 因为意向结构的差异, 却既可能是一件极简主义作品, 也可能是一块刚涂完底色的未完成画作, 或仅是一块红色布料。8所以艺术品的认定是超越于第三人称视角下的表面经验的, 而取决于特定的艺术意向性。

那么, 即使艺术AI能够产生在第三人称经验上与人类作品无法区分的作品, 但因为AI并不具有真正的意向能力, 所以AI是不能进行真正的艺术创作的。AI利用随机性算法产生的“作品”本身并不具有艺术品地位, 而是像自然界的奇石一样, 有待具有艺术意向能力的意识主体的拣选。当且仅当一个艺术家用艺术发现的眼光将一个“现成物”———一块奇石、一个小便池或一件AI产生的作品———拣选出来并命名为艺术品时, 这个物件才有了艺术表达的含义。相比之下, AI本身却没有做出这种判断的能力和资格, 所以基于深度学习算法的AI无论什么时候都不可能进行真正的艺术“创作”。

四、不同形而上学来源与心灵哲学预设

人工智能的作品与人类艺术家的作品可以高度相似, 以至于可以像“下一个伦勃朗”的成果那样, 在经验上无从区分。但按我们在上一节的论证, 深度学习式人工智能的作品永远无法成为真正的“创作”, 因为这种AI在原则上无法真正地“无中生有”。根据深度学习算法所产生的作品, 即使对固有经验进行变形和重组, 其形而上学来源依然是被给予的训练样本。而如果人类能够进行真正的艺术创作, 即在既有经验之外生成新的经验, 那么人类一定具有能够“无中生有”的形而上学来源, 一项突破有限性而向无限性开放的能力基础。这也要求我们给出一个关于真正的“创新”何以可能的形而上学的解释。

我们把这个来源归于人类的自由意志, 即能够不依赖于前因而行动的动因体 (agent) 。无论在常识视角还是学术视角, 自由意志都是最基础的概念之一。其本意非常明确, 虽然对其进一步的解释富有争议性。按照本意, “自由意志”在概念上蕴含了无限性和开放性, 能够超出既有经验范围而凭空产生新元素, 构成了创造性的根本来源。如果“艺术创造”真如我们所理解的这样, 那么我们就必须将其归根溯源到艺术家拥有的自由意志上去, 即“创作”最终的形而上学来源。

但“无中生有”过程在自由意志中的具体发生机制是什么?我们在此悬置这个问题, 但这并不会影响到我们的结论。对于我们来说, 这的确是神秘的, 而这种神秘也可以归到自由意志本身的神秘性中去。在我们这个把经典力学作为理解世界首选理论框架的时代, 这似乎是一个难以理解和接受的说法。与“无中生有”概念同样神秘难解的话题大概是宇宙起源与量子力学不确定性原理了, 这些主题同样充满争议。到这里, 我们似乎触及了某些讨论的边界, 或者面临一些基本问题上的困惑。

但并非所有人都同意将AI作品和人类作品在形而上学来源上做这样的区分, 而这种分歧来源于更深层次上心灵哲学观点的差异。本文在此将基于深度学习算法的AI和被认为拥有自由意志的人类艺术家分列讨论, 也就潜在地否认了这样的AI可以具有人所具有的心灵。换句话说, 只有把深度学习式AI与人类艺术家看作两个范畴的存在而不等同起来, 才有了对二者在艺术创作能力上进行进一步比较的意义和必要。而在特定心灵哲学观点如计算主义看来, 心灵与计算程序之间不存在不可跨越的鸿沟, 心灵具有的任何能力最终可以通过特定的算法实现, 当然包括自由意志以及“无中生有”的创造能力。反之, 对于计算机不能拥有的能力, 人类也不可能独占。事实上, 在计算主义者看来, 我们在前面关于艺术创造的描述本身就非常可疑。

如果计算主义成立, 本文所关心问题的答案也就显而易见。即如果AI与人类智能本质上就是一类东西, 那么关于人工智能AI能不能超越人类艺术家之类的问题压根无须讨论, 答案几乎直接蕴含在计算主义主张里面。无论艺术活动看起来多么玄虚, 也无非是人的意识活动之一, 而意识活动的本质在于计算, 那么拥有更强计算能力的AI在原则上必然会超越人类, 无论是围棋还是艺术活动。AI当然可以成为艺术家, 并且借助计算力的优势赶上并超过人类艺术家也只是个时间问题。

对计算主义的讨论汗牛充栋9, 本文可以看作这些讨论的延伸, 即特定理论在艺术领域带来的特定结果, 亦或艺术领域对这些理论的反馈。在人类艺术家是否存在超越AI的特质这个问题争议的底层分歧在于对人和世界的一些基本问题上的认定差异, 并带来各自的后果。对“无中生有”能力的确认会破坏对世界最简洁的理解方式———经典力学框架的完备性, 并因引入超出这个框架的神秘之物而带来了更多解释负担。而计算主义者的主张首先带来的代价是对“艺术”的虚无和解构, 就像他们宣称或暗示自由意志是“幻觉”一样, 我们的意识世界也是封闭和有限的, 那么“艺术创作”将跟吃饭睡觉等单纯生物活动没有区别, 而并非常识生活世界所理解的作为人类尊严与终极意义的重要来源。

需要补充的是, 我们这里谈论的AI所指代的是运转于图灵机之上的AI程序, 亦即当下提到人工智能时默认的预设, 而没有完全排除其他某种形式的“人工”智能体成为艺术家的可能性。量子力学理论本身容纳了意识所具有的整一性和不确定性特征, 这就给用量子力学框架解释意识和自由意志留出了理论空间。那么我们就有理由期待基于量子力学原理制造的量子计算机有朝一日成为具有自由意志的人工智能体的载体, 而本文讨论涉及的AI并不涉及量子人工智能。

五、AI在艺术领域的应用空间

如果AI不能取代或超越人类艺术家, 那么它们会在艺术领域带来什么样的影响呢?

从文明进程看, 人工智能在现阶段的意义仍在于进一步解放人力, 类似工业革命时蒸汽机解放了人力, 人工智能革命将人从低等脑力劳动中解放了出来, 因此也必将像集装箱的发明取消了码头工人这个职业那样, 取代很多脑力“码头工人”的工作。长期和整体来看, 技术进步总是改善人类整体福利, 并为个体更好实现自身内在价值提供外在条件。

在艺术创作过程中也同样存在着低创意要素的艺术活动。如果人工智能在艺术创作的某个方面能够做得比人工好得多, 那么这部分内容就具有很强的可替代性。比如以美观舒适为目标的设计等重复模仿性工作, 这样的岗位会最先为AI取代。事实上, 这样的事情已经发生, 阿里巴巴公司开发的AI已经在2017年双11期间以每秒8000张的速度设计了4亿张海报;10paintschainer这样的线稿自动AI上色网站也已上线运营多时。11与其说未来AI能够取代很多艺术家, 倒不如说他们现在的“创作活动”本来就不是那么有艺术价值。犹如照相机取消了简单镜面式画家的艺术家身份, AI也注定会让某些艺术家的身份发生贬值。同时, AI的介入并不会损害艺术家主体地位本身, 犹如艺术家借助助手创作并不会否定艺术家的成就一样, AI在此所做的始终是辅助工作, 作品总是有赖于艺术家的创作意图和取舍抉择。

另一方面, AI技术的普及可以让艺术家摆脱低级脑力活动而集中精力于作为核心的创意本身, 从而拓展能力范围, 提升创作效率。甚至, 从一个整体和长期的视角来看, AI介入艺术会加快艺术史的进化速度。每当进入一个新的艺术史范式, AI就可以以已有作品为样本库而将相关的各种可能性迅速挖掘出来, 从而加快艺术范式成熟, 促使艺术家们更早开始新突破, 打开新维度。

六、结论

艺术概念的要件和深度学习人工智能的原理决定了二者的不相容性, 相应地, 人类艺术家和艺术AI的作品有着不同的形而上学来源。如果要否定这一点, 就需要诉诸计算主义, 进而解构掉我们关于艺术的常识性理解。但这里的讨论不会否认AI的辅助价值。无论对于艺术家个体还是群体, AI的介入都会帮助或促使他们聚焦到“创造”本身和实现内在价值上来。

【注释】

1 L.A.Gatys, A.S.Ecker, M.Bethge, A Neural Algorithm of Artistic Style (2015.9) , https://arxiv.org/abs/1508.06576.

2 https://www.nextrembrandt.com/.

3 http://tech.ifeng.com/a/20180827/45141410_0.shtml.

4 龚怡宏:《人工智能是否终将超越人类智能》, 《学术前沿》2016年第4期上, 16页。

5 龚怡宏:《人工智能是否终将超越人类智能》, 《学术前沿》2016年第4期上, 17页。

6 龚怡宏:《人工智能是否终将超越人类智能》, 《学术前沿》2016年第4期上, 20页。

7 龚怡宏:《人工智能是否终将超越人类智能》, 《学术前沿》2016年第4期上, 16页。

8 []阿瑟·丹托著、陈岸瑛译:《寻常物的嬗变---一种关于艺术的哲学》, 南京:江苏人民出版社, 2012, 2页。

9 翟振明教授与笔者曾针对计算主义做出过反驳 (翟振明、李丰:《心智哲学中的整一性投射谬误与物理主义困境》, 《哲学研究》, 2015年第6期。基本思路是指出计算主义预设的定域原则 (Locality Principle) 在原则上无法彻底解释意识的一个内在特征---整一性特征, 因而任何基于定域原则建立起来的意识理论对于意识解释都是非充分的。

10 https://www.sohu.com/a/202528185_161378.

11 https://www.paintschainer.preferred.tech.

(原载《现代哲学》201806期)