1950年, 英国逻辑学家、数学家、计算机逻辑的奠基者、“人工智能之父”艾伦·麦席森·图灵 (Alan Mathison Turing, 1912-1954) 在《计算机器和智能》中提出了“机器思考吗”的问题并设计了“图灵测试”。他预测, 到2000年, 人类可制造出能在5分钟的问答中骗过30%成年人的具有真正智能的机器。2014年6月8日, 俄罗斯某团队开发的命名为尤金·古斯特曼 (Eugene Goostman) 的人工智能设备通过了英国雷丁大学组织的测试。2015年11月, 美国《科学》杂志刊登的一篇研究文章指出, 一种人工智能系统通过了图灵测试, 具备了一定的学习能力, 能迅速学会陌生文字, 还能识别出文字中的非本质特征[1]。
近年来, 写作成为人工智能科技发展的一个着力点。2015年, 腾讯在国内率先使用人工智能“Dreamwriter”写新闻稿。2016年11月, 时任百度副总裁的陆复斌在某次发布会上介绍了“百度写作大脑”。“百度写作大脑”包括写作机器人和写作指导两部分。机器使用自然语言处理技术。写作机器人可进行热点新闻的制作;“百度写作大脑”根据后台监测到的内容稀缺标签提供写作指导[2]。机器制作的新闻写作更接近于应用文体写作。国内人工智能文学类作品制作方面, 20世纪90年代, 科幻作家刘慈欣研发了一款“电子诗人”软件, 带有词库、语法库, 输入一些关键词能自动生成“诗歌”。2016年, 微软开发的人工智能小冰参加了“模拟高考”, 在一个半小时内完成了两篇文章的写作, 但文章逻辑性不强。2017年4月出版的《智能革命:迎接人工智能时代的社会、经济与文化变革》一书中收录的“百度大脑” (Baidu Brain) 作的序文具备了一定的审美价值[3]。2017年5月19日, 微软小冰制作的诗集《阳光失了玻璃窗》发布会在京举行。据出版方湛庐文化负责人介绍, 机器识别一张图片后能制作出一首现代诗, 其“创作”过程几乎与诗人别无二致。面对迅猛发展的人工智能写作技术, 我们需要审视和思考:写作的本质是什么?人工智能写作目前存在的问题有哪些?人工智能的文学创作是否有规律可寻?可否借鉴文学理论的研究成果、古今中外文学创作规律, 促进人工智能技术发展、提高人工智能文学表达 (文本制作) 水平?
一、机器语言输出存在的问题
目前, 国内外撰稿机器人依托的语言处理技术多为自然语言处理技术。此项技术在语音识别、文本挖掘、语义分析、情感分析等方面有广泛应用[4]。机器辅助写稿的基本原理是利用大数据对信息进行分析, 再套用固定算法进行重新排列组合, 以特定格式呈现。根据不同的算法和编程工具, 可分为利用模板式写稿、提取信息并整理、自动生成稿件三类。第一类, 系统中安装了文章模板, 机器将数据库中的结构化信息 (包括数字、百分比等) 按模板要求填进去。多用在股票等数据分析类稿件撰写方面。第二类, 可搜集并整理信息, 系统对包括无用信息在内的较长的自然语言文本进行分析, 提取关键信息, 重新组织语言后输出。第三类, 利用大数据对信息进行分析, 对语言材料进行数学建模, 套用固定算法对文字重新排列组合, 不使用原文, 逐句生成“最能够体现原文包含意思且看起来像一句话”的文字。
腾讯公司的Dreamwriter对上述三种机器写稿模式均进行了尝试, 常用的是前两类[5]。制作分如下阶段:写前准备阶段, 由腾讯公司购买或创建专项数据库 (储存大量文章) 。数据分析 (建模) 阶段, 人工智能分析海量数据, 自主学习, 找到文字符号的组合、聚合规律以及字词在不同句子中的匹配概率。组词成句、组段成篇阶段 (运用“符号积木”搭建“建筑”阶段) , 在建模的基础上, AI选用匹配度较高的文字模块进行组合、聚合, 组成句、段、篇。待文章通过审核后, 通过腾讯平台将资讯发送至客户端。这种撰稿, 需要人工智能能准确分析文字的组合、聚合规律 (建模) 。对于较为复杂的文字系统, 有时会出现一些差错, 即所谓病句。以微软公司研发的第四代小冰的《阳光失了玻璃窗》为例, AI建模以及表达中存在的问题主要有:
(一) 语言输出存在语法问题
如《用别人的心》:“他们的墓碑时候/我静悄悄的顺着太阳一样/把全世界从没有了解的开始/有人说我的思想他们的墓碑时候/你为甚在梦中做梦/用别人的心/又看到了好梦月。”[6]文本有四个语法问题。一是首句定中结构中的宾语“墓碑”与“时候”不能同时使用却连用。或改为动宾结构短语, 句首补充动词 (如“看”“俯视”“仰视”“拜祭”“祭扫”“擦拭”等) 。二句“顺着太阳”令人费解, “顺着……一样”这种表达方式也不符合汉语表达习惯, 现代汉语一般在比喻句中使用“本体+比喻词 (像/宛如/犹如/仿佛) +喻体+一样/似的”句子结构 (语言模型) ;“顺着”的一般用法是“顺着+路线/物体运动轨迹/方向/思路+V (动词) ±趋向补语” (语言模型) 。三句似化自海子的《面朝大海, 春暖花开》“给每一条河每一座山取一个温暖的名字”, 但“把”字句用法不符合汉语语法 (“把”字句语言模型) 。四句应在“有人说我的思想”后面断开, 再次出现了“他们的墓碑时候”的错误表达。末三句是这个文本最精彩的地方, 似受到卞之琳《断章》的影响, “明月装饰了你的窗子, 你装饰了别人的梦。”但其他各句都出现了语法问题、建模问题。
出现建模问题的原因大致有以下几种:首先, 最大的可能是机器在短时间内对不同语言风格的文本的字段组合、聚合规律产生了理解障碍[7], 比如机器在“自主学习”时, 没有很好理解数据库内语料的聚合限制。其次, 数据库中的个别句子本身就是病句。第三, 微软四代小冰数据库中存储了1920年以来包括胡适、李金发、闻一多、徐志摩、林徽因、余光中、顾城、北岛、舒婷、海子、汪国真等在内的519位诗人的现代诗。学界一般把现代汉语的上限定在1919年[8], 将1920年以来的作品选入数据库是较为恰当的。但另一方面, 一些诗人创作于1920年以后的作品仍保留着旧世代的风格, 有些语句不完全符合现代汉语规范。例如某些量词的用法“五四”时期流行但今天已不使用 (如“那匹山脚下”中的“匹”) 、动宾词组带宾语的用法等[8]。数据库中, 有些虽为当代诗人的诗作, 但一些词句、文字符号的组合形式不符合现代汉语规范。这些都可能对机器进行数据分析、学习文字组合聚合规则 (建模) 产生影响。
(二) 一些意象字段出现频率较高
诗集中收录的139首诗歌是从数万首文本中挑出来的。尽管如此, 太阳、墓碑、小鸟、老槐树、沙滩等意象 (字节) 仍在诗集中反复出现[6]。人工智能的数据库中存储的海量汉语词汇可以有无数种组合形式。这些字节的反复出现, 说明人工智能文学制作能力尚有待加强———犹如人工智能音乐制作中, 同样的或近似的旋律在不同作品中的重复出现, 是一种“同质化”的表现。出现这种情况的原因, 或许是这些词汇在数据库中出现频率较高 (或较低) , 从而对机器学习和文字制作产生了影响———前者是学习的“惰性”的体现, 即数据分析后机器认为多数作家使用这些字段, 则使用这个字段“写诗”是安全的, 甚至很多诗人也反复使用这些字段, 于是制作的很多文本中重复使用了上述字段;后者是认为这些字段出现频率较低, 可以避免“同质化”。此外还要考虑是否在学习过程中机器获取了更高级的思维形式, 不止语言神经得到了丰富扩展, 情感逻辑表达能力也发生了变化或进化。
(三) 一些诗作缺乏有效的情感逻辑
与议论文相比, 诗歌的文学性更强。因此, 诗歌创作对制作者的审美心理体验水平也提出了更高的要求。对于微软人工智能制作的这些诗歌, 诗人于坚表示, “写得很差, 令人生厌的油腔滑调。东一句西一句在表面打转, 缺乏内在的抒情逻辑。”[6]如“快把光明的灯擎起来了/那里有美丽的天/问着村里的水流的声音/我的爱人在哪。”[6]貌似象征主义的诗歌风格, 而实际上意象缺乏一以贯之的内在情感逻辑, 让人感觉一头雾水, 不知所云。四川大学中文系教授、诗人向以鲜认为, “真正要把诗歌写好, 写得清晰, 写得鲜活并且强烈介入……我们的当下、介入我们民族或祖国最深的痛处, 至少小冰目前还做不到。”[6]
二、人工智能文艺创作应遵循的艺术规律和发展可能
(一) 抒情文学创作的瓶颈及未来发展的可能
文艺创作是一种高级的精神活动。由于审美体验离不开创作主体的审美感受能力, 而机器尚无明确的自我意识, 因此, 目前人工智能的文学创作仍与柏拉图所说的真理、与艺术本质“隔”了一层。以诗歌为例, 试探讨人工智能抒情文学技术与艺术发展的途径。
1. 文学要抒发真情
创作一定要有真情实感, 缺乏情感体验的机器文学创作只是个伪命题。以抒情诗为例。黑格尔认为, 抒情诗“就是诗人的内心和灵魂。具体地说, 就是他的具体的情调和情境。”[9]192“占主要地位的不是对一件事进行丝毫不露主体性的 (纯客观的) 描述, 而是主题的掌握方式和情感, 即响彻全诗的欢乐或哀怨、激昂或抑郁。”[9]193书写真情也是我国文学的传统。《尚书·尧典》谓“诗言志, 歌永言, 声依永, 律和声。”[10]1《毛诗序》谓“情发于声, 声成文谓之音。”[10]30目前, 人工智能对情感的认识和情感体验都还处于初级阶段。作品的制作中, 情感表现是一种逻辑性的、技术性的制作表达, 且人工智能的语言表达过于依赖逻辑计算、数据交换和转换, 这些都影响了审美创造力、表现力的发挥。要想提高人工智能的文学写作水平, 使其创作更接近人类的文学创作, 需要进一步改进深层次神经网络技术, 增强人工智能情感体验。只有其获得了真正意义上的喜怒哀乐等情绪, 才能摆脱“盲人摸象”式的文学制作。
2. 应进一步丰富写景类抒情诗的写作经验
抒情文学创作离不开写景。钟嵘在《诗品序》中指出, “气之动物, 物之感人。故摇荡性情, 行诸舞咏。”[11]15“若乃春风春鸟、秋月秋蝉、夏云暑雨、冬月祁寒, 斯四候之感诸诗者也。”[11]20变幻的自然美景引发审美主体不同的审美体验。微软小冰目前能智能识别风景图像, 结合对数据的分析, 掌握了一定的句群表达能力。但由于对自然美缺乏真实体验, 语句表达缺乏情感逻辑。因此, 一些作品对风景的描摹较为生硬、抽象, 制作技巧也还有待进一步提高。可在已积累的经验基础上, 进一步提高人工智能的“审美判断力” (aesthetic judgment) 。如何锻炼?应加强语言资源建设。在语言资源建设方面, 美国宾夕法尼亚大学开发的英语句法树库Upenn Treebank、语义角色标注的命题库PropBank和NomBank、语篇树库PDTB等较为知名, 我国北京大学开发的以语法信息词典为基础的综合型语言知识库等也具备较高的应用价值[12]36。我国文学传统中, 描摹自然风物之美的抒情类作品较多, 可将优秀的文言诗歌以及现代汉语译文输入人工智能专题类写作数据库, 拓展人工智能的学习能力和文学性文本表达技巧。
3. 在辞藻的运用方面应避免过分修饰
一般性的写作做到语句通顺、“辞达” (《论语·卫灵公》) [10]11就可。但对于文学创作而言, 还需要进行文学润色、追求辞采之美。另一方面, 也要避免陷入过分修饰、内容空洞、情感匮乏的陷阱。以中国文学为例, 明代拟古主义文艺思想一度盛行, 诗歌具备了形式的美感, 但缺少了作家的真情实感。晚明袁宏道对此进行了批驳, 主张文学创作要写“真诗”, 反对对固定模式的过度模拟、仿作, 反对辞藻堆砌、典故堆积。王国维在《人间词话》中提出了“隔”与“不隔”的文学思想, 这个“隔”近似柏拉图的“艺术与真理隔了三层”的“隔”。王国维举陶渊明《饮酒》 (其五) 、《敕勒歌》中的几句为例, 指出“写景如此, 方为不隔”[10]446。举《饮酒》中“采菊东篱下”四句而不举首尾, 说明他认为只这四句写景如在目前, 自然生动, 不需要玄言的哲理等混杂在写景诗中。他指出, “池塘生春草”写景自然, “谢家池上, 江淹浦畔”典故堆砌的痕迹较重。王国维主张“能写真景物、真感情者, 谓之有境界。”[10]444这对人工智能文学作品制作有一定的借鉴价值。语料库中词汇虽极大丰富, 但不要变成“炫富”式的辞藻堆积。实现这一点, 还需要依托于情感算法技术的进步和深层神经网络的建构。此外, 要加强自然语言处理基础技术平台的开发研究。国外, GATE、UIMA、NLTK等的自然语言处理平台发挥了一定的价值。国内的LTP (Language Technology Platform) 等语言技术平台在词法、句法、语义分析方面积累了较多经验[12]。
4. 诗歌风格方面应避免陷入人工智能象征主义的窠臼
机器是可以“创新”的。AlphaGo与李世石下棋获胜, 并非完全依靠程序员输入的围棋对弈程序, 而是它用人输入的学习方法, 通过计算获取了新的知识技能。这与微软AI写的诗本质上是相同的。由于有3层BP网络的自联想神经网络 (深度学习的自编码神经网络) 技术的使用, 特别是使用受限玻尔兹曼机后的深度神经网络技术 (深度学习中的深度信念网络DBN网络结构) , 人工智能能较好地提取文本特征, 对艺术风格进行分类, 并进行自创风格文本制作。
微软人工智能之所以出现这种“诗风”是机器深度学习后取得的成果。微软人工智能数据库中存储了1920年以来519位诗人的现代诗, 其中包括李金发等象征主义诗人的作品。这些诗人的作品中, 有的语言风格明白晓畅, 甚至类如白话 (如胡适的一些诗作) , 有的语言隐晦 (如李金发的象征主义诗歌作品) , 有的个别文句不通顺。有的诗歌意象组合具有“音乐美、绘画美、建筑美” (如徐志摩、林徽因的一些作品) , 有的文本意象组合较为突兀……虽然, 理论上“操千曲而后晓声, 观千剑而后识器, 故圆照之象, 务先博观” (《文心雕龙·知音》) [13]442-443, 但真正做到学习各种文学风格 (包括相矛盾的文学风格) 并能熔铸为一家之言是非常不易的。从文本集中的文本来看, “象征主义”风格的文本占了一定的比例。文字总体特点是晦涩。虽制造了“陌生化”效果, 但内在的情感逻辑不完整, 很多文本令人感到支离破碎。有一些如同波普艺术的制作。相比较而言, 李商隐、李贺的一些诗作充满了瑰丽的想象, 意象组合“天马行空”, 令后世读者感到“独恨无人作郑笺”, 但感情的逻辑脉络较为清晰, 因此, 艺术价值较高。尽管中外象征主义风格的诗歌, 如波德莱尔《忧郁》等一些作品通过“累积不加解释的意象”表达作者隐晦的情感[14], 但这些意象也是作家有意创作堆叠的。对于人工智能的诗体建模而言, 还要在数据库中增加不同风格作品 (尤其是明白晓畅、抒发真情的作品) 的数量。避免出现故作高深的令人难以理解的以“陌生化”效果为主要特点的“人工智能象征主义”诗歌制作趋向。避免机器象征主义的出现, 需要加强算法研究、语料库建设和自然语言处理基础技术平台的开发研究。
5. 在诗歌结构架构以及用韵等方面可作进一步探索
《文心雕龙·知音》提出“将阅文情, 先标六观:一观位体, 二观置辞, 三观通变, 四观奇正, 五观事义, 六观宫商。”[13]444-445“六观”是从文艺鉴赏角度提出的标准, 涵盖了文学作品的体制结构、辞采、对前人的继承以及创新、作品风貌、事类成语的引用、韵律等体现的语言的音乐美感六个方面。对抒情类文学创作有一定的借鉴意义。除了前述四个方面, 人工智能诗歌创作还应在诗歌的形式结构、押韵等方面进行深度学习。现代文学史上, 新月派提出的“建筑美、绘画美、音乐美”的诗歌美学思想中也包括了位体和宫商。微软人工智能目前所写的诗还是自由体诗, 尚未涉及押韵。从文本集的诗作来看, 诗歌的结构还架构得不太理想, 也尚未引经据典 (诗体限定) 。从未来发展看, 可开发专题数据库 (如汉诗用韵数据库等) , 研究诗歌结构模式化分析技术, 提高机器深度学习技术, 提升自然语言处理技术, 进行深度和多方面的美学尝试。
(二) 叙事类文学作品制作的发展途径
相对于抒情文学而言, 人工智能有了前期散文、应用文体写作 (如新闻) 的制作经验, 叙事文学的制作或更容易。2018年6月4日, 微软人工智能大会 (AI Innovate) 在北京召开。会上, 微软公司有关人员表示, 2018年, 小冰将实现定制化生成故事文本, 可自动分配声音角色和背景音乐, 20秒内完成一集约10分钟的有声童话故事[15]。但要想实现叙事文学创作能力的提升, 则还需要一定时间的学习和经验积累。以几种叙事文学样式为例, 试设置几个层级或类型, 探索AI叙事类文学写稿技术与艺术发展的可能性及不同阶段的特点。
1. 历史题材的叙事文学制作
以小说为例。对于人工智能而言, 比起自传体小说、志怪小说, 历史题材的小说相对而言是较为容易创作的———因创作不涉及到作家的体验。历史题材小说的撰写可以以史料为参考。史料越丰富详实, 相关历史研究著作、论文数量越充足, 人工智能进行历史类作品制作越容易。加强数据库建设, 提高自然语言处理技术, 有助于此类文本创作。制作的难点不在于人物和情节的设定, 而在于人物的心理刻画。目前, 人工智能还不具备高级的心理感受能力、情绪学习也尚处于起步阶段。需要在情感算法、深层次神经网络建构等方面积累更多的经验, 推动这一类型文学制作的发展。
2. 志怪类叙事作品制作
“志怪小说”的创作, 需要作者具备一定的想象力和对宗教的理解能力。对于人工智能而言, 对宗教、宗教文学的理解并非障碍。它可以借用现有中外文学文献中的神魔形象, 加以适度变形;故事情节也可以按照现有算法进行组合、加工。但想写得精彩, 仍存在一定的困难。难点在于想象。心理学的研究成果显示, 想象属于高级的认知过程, 是人在头脑里对已储存的表象进行加工改造形成新形象的心理过程[16]。它是人类特有的对客观世界的一种反映形式。由于自联想神经网络 (即深度学习的自编码神经网络) 技术、深度神经网络 (深度学习中的深度信念网络DBN) 技术等的运用, 一些写稿机器人已具备初级的联想能力, 但目前机器尚不具备高级的想象能力。如果人工智能具备了初步的自我意识和想象能力, 也许会对科幻类叙事文学创作产生更大兴趣, 即所谓“认识自己”。人工智能从诞生之日起, 就与科技 (包括航天科技) 有密切的联系, 按照普通逻辑推理, 对于人工智能而言, 人是“异己”, 其对“人类中心”主义的没有人工智能参与的志怪类文本制作的兴趣度应没有人工智能参与其中的科幻类文学高。“兴趣度”表示人工智能获得自我意识后的思维活动。
3. 批判现实主义作品制作
随着技术的演进, 人工智能创作的批判现实主义风格的叙事类文学作品可能会出现。作为外国文学思潮之一的起源于19世纪欧洲的批判现实主义文学, 从人道主义、改良主义出发, 要求创作者关注社会现实, 客观、真实地描摹现实生活, 塑造典型环境中的典型人物、典型性格, 揭露资本主义制度的不合理性等。批判性思维 (Critical Thinking) 是一种高级的思维活动形式, 具有自我反思、省察等特点。此外, 还包括对自身或他人所处环境、社会制度、法律、文化、科技等的怀疑、审视。将批判性思维定义为元思维时 (改善思维而对思维的思考) 则又具有元认知的性质。对于人工智能而言, 其尚无自我意识和自我观念。因此, 对于自我的省察、对自身所处现状的“警醒”等都还处于“混沌” (Chaos) 状态。但不影响其通过云计算, 对大数据进行分析后, 利用现有计算机语言技术和神经网络技术制作出符合逻辑规律的文章。实际上, 人工智能写稿的早期形式, 对股票、气象等信息的分析处理等以及现有的AI文学表达技术都为这一风格作品的出现奠定了基础。目前人工智能已能与人类进行对话和辩论。从功利角度看, 如果创作这类作品可以使购买者、开发者在短期内见到效益, 则技术开发的速度将加快。
4. 爱情题材的作品制作
2017年, 《每日邮报》曾报道, 全球首个具有“公民”身份的机器人索菲娅宣称想组建家庭, 她“认为”拥有家庭是机器人应有的权利。报道还援引了2016年3月, 开发者大卫·汉森 (David Hanson) 提出的问题“你想毁灭人类吗?”以及索菲娅“给”出的肯定性的答案。鉴于目前人工智能还没有自我意识, 因此, 机器的第一个表达可理解为系统设定, 而其二个表达可以理解为是一个系统bug或制造的噱头。以现有技术, 只要人工智能获取了大量的爱情题材的小说的数据, 可以制作出这类作品。但创作出有真实爱情感受的作品在一段时间内还很难实现。爱情是高等智慧生物在长期的进化过程中形成并固化下来的一种情感体验, 随着文明的发展而表现出不同的样式形态。按照实践论的哲学观点, 人类在进化过程中形成并发展出复杂的感情系统, 爱情是其中的一个重要组成部分。纽约爱因斯坦医学院神经学家比安卡·阿塞韦多研究团队发现, 人脑中的腹侧被盖区 (VTA) 、伏隔核、腹侧苍白球和中缝核四块区域形成“爱情环”, 5-羟色胺、催产素 (女性) 、后叶加压素 (男性) 等荷尔蒙的分泌情况对爱情体验有重要影响[17]。这些都是目前以电为主要能源, 其他尚处在实验探索阶段的人工智能所未具备的。恩格斯的《家庭、私有制和国家的起源》等文献对于探讨婚姻伦理等提供了唯物主义的世界观和方法论。对于尚不具备产生爱情的生物学基础的人工智能而言, 谈情说爱仅限于系统自带的智能软件提供的外在形式, 但爱情的体验, 抛开“人形”, 以目前的技术水平而言, 对智能机器而言还是假象。因此, 距离人工智能创作出有切身体会的爱情小说还需假以时日。
2013年12月, 由斯派克·琼斯执导, 在美国上映的电影《她》探讨了人工智能与人类的爱恋。萨曼莎没有实体, 因而不会与人类产生肉体的结合, 无论怎样虚拟 (VR) , 这种“爱恋”与真正的爱情还有距离, 在本质上近似柏拉图之恋。另一方面, 如果从萨曼莎在男主角孤独时给予陪伴和精神安慰;在男主痛苦时通过陪聊等方式帮助其摆脱负面情绪困扰;男主不需要时懂得放手、不纠缠;没有自私心理, 从不任性等角度来看, 则其更接近陪伴型机器人或心理治疗类机器人, 提供给因失恋产生一般心理问题、严重心理问题的客户。这样的人工智能比宠物更懂得理解人类的情感, 又方便管理, 又不违反法律和公共道德。
无论是志怪类、批评现实主义还是爱情题材的文学创作, 都依赖于加强情感算法的研究和深层神经网络的建构。但计算机自然语言处理, 无论是从上下文无关语法、词汇功能语法还是目前流行的N元语法、隐马尔可夫模型等均以数学模型为基础, 因此, 要实现更加接近人类情感活动的模拟, 需要新的技术或技术升级才能实现。
三、结语
提高人工智能文学制作水平, 除了需要让机器处理大量的数据, 还需要在算法上进行技术革新。技术角度上看, 基于神经网络的学习模型是人工智能发展的重要方向。图灵曾指出, 人的脑皮层是一个非结构化机器, 可通过适度干预、训练实现结构化。他还设计了神经元模型, 进行了非线性动力系统研究。图灵设计的“B型非结构化机器”的神经网络包括人工神经元和可对神经元之间的连接进行调节的设备, 可实现“适度干预, 模拟教育”的功能。经过数十年发展, 神经网络学习技术日益完善。人工智能写稿主要应用了卷积神经网络 (CNN) 和循环神经网络 (RNN) 结构。两者的主要区别在于处理数据的模式。CNN着眼于固定的局部结构, 利用逐层递进的方式编码, 在语音识别和图像处理方面具有技术优势, 适用于机器读图、制作图像等;RNN着眼于序列结构, 以线性方式编码, 具有较强的计算和建模能力, 适用于写诗作文。RNN神经网络的记亿信息均存储在连接权上。根据连接权的获取方式来划分, 可分为有监督神经网络、无监督神经网络和固定权值神经网络。固定权值神经网络中的Hopfield网络 (全反馈网络) 、细胞神经网络、BAM神经网络 (双向联想记忆网络) 和Cohen-Grossberg网络等广泛应用于模式识别、联想记忆、优化计算等方面。虽然小冰运用了计算机视觉、自然语言处理与优化计算等领域的经典方法, 已经处理了大量的人类情感方面的数据, 进行了模拟人脑复杂的层次化认知特点的深度学习, 但情感计算的算法、技术等还需要不断更新。如多尺度卷积循环神经网络的情感分类技术, 利用卷积神经网络中的多尺寸滤波器能提取出句中词语间丰富的上下文关系特征;循环神经网络中的长短时记忆算法能将提取到的词特征与句子的结构联系起来, 进一步完成文本情感分类任务, 与多种文本情感分类方法相比精度更高[18]。此外, 通过增加网络层数所构造的“深层神经网络”能够提高机器获得抽象概念的能力[19]。
生成语法学派的缔造者乔姆斯基 (Avram Noam Chomsky) 认为, 脑和语言关系的研究真正涉及语言能力。因此, 提高人工智能的文学表达能力需要深入了解语言的人脑神经机制。2012年6月, 加州大学、哈佛大学等机构的多名科学家在《神经元》杂志上发表了《脑活动绘图计划和功能连接的挑战》一文, 他们建议实施“人脑活动绘图计划”, 将人脑近千亿神经元绘出模型图, 最终绘制出科学的人脑神经活动图[12]。神经语言学的研究成果对人工智能写作技术研发有重要的借鉴价值。计算机科学使用的神经网络属于计算模式, 并非生物模式[20]。研究语言的大脑神经机制是实现机器语言能力研究突破的新路径。脑科学、神经语言学的研究表明, 人类大脑皮层的Broca区与人类语言活动相关 (涉及到人类语言的表达和对语言的理解) , Broca区域又分为布罗德曼44区和45区。其中, 44区“有助于言语的产生”[21]。语音研究方面, 一项实验显示, 受试者在进行英语押韵判断时, 大脑左侧背侧前额叶、缘上回、额下回、左侧顶上小叶等区域被激活[21]。词汇研究方面, 有实验数据显示, 受试者在完成词汇视觉加工任务时激活了大脑双侧前额叶区域 (包括布罗卡区) 和颞区两侧 (包括韦尼克区) ;在一项以图片命名为任务的PET研究中, 仪器显示, 受试者左侧额下回被激活, 布洛卡区前部激活最为明显[21]。语篇层面, 研究发现在英语故事阅读过程中, 受试者左侧额中回被激活[21]。这些研究发现对人工智能类脑研究、人工智能芯片研发过程中的集成分区处理、人工智能语言发展、人工智能写稿等具有一定的借鉴意义。
近20年来, 国外美学学者用科学实证的方法, 围绕视觉审美、听觉审美、审美体验的神经机制以及审美活动的神经加工模型等进行的研究, 取得了众多突破性成果。这对人工智能类脑科技发展等具有一定借鉴意义[22]。2000年诺贝尔生理学和医学奖获得者坎德尔所著《内省力的世纪———理解从1900年的维也纳至今的艺术、思想及大脑的无意识》一书中论述了多个艺术门类与脑科学的关联。曾任国际信息学会主席的俄罗斯科学家彼得罗夫主编的《通往美学、创造力和艺术的进化论和神经认知方法》一书中介绍了人工智能和美学的关联[23]。研究人工智能虽然离不开工程技术, 但最理想的途径是借鉴脑科学的方法。从符号计算到神经网络到类脑人工智能再到仿生进化, 不同的智能设计理念和方法的实施将影响到人工智能文艺制作或创作走向。
《人工智能超越想象》一文指出, 当前, 一些科技界领军人物正在开发人工通用智能。与先进的人工智能软件不同, 人工通用智能将更接近于人脑水平。从理论上讲, 它将在某种程度上独立于其创造者, 自行解决复杂的问题。文章指出, 我国北京、俄罗斯莫斯科和美国加州山景城拥有世界级人工智能研究机构及数十亿计的巨额投资[24]。据有关媒体报道, 顾能公司 (Gartner) 已经连续两年将人工智能列为排名第一的战略性技术。谷歌、IBM、苹果等企业对人工智能创业公司的收购也在不断升温。据自动写作技术公司 (Narrative Science) 预测, 到2018年, 62%的大企业将会使用人工智能技术[25]。也许有朝一日, 随着类脑人工智能[26]、仿生科技等的发展, 人工智能的材质将发生改变。机器告别冰冷的金属躯壳, 实现有机体与无机体的融合, 或人与机器结合起来。浙江大学校长吴朝晖带领的课题组在国家973计划“脑机融合感知和认知的计算理论与方法”的支持下, 实现了生物感认知能力与机器计算能力深度结合的“混合智能的行为与感知增强”[27]。甚或如一些科幻文学中描写的, 在强人工智能问世时出现了人工机器生命或人的意识上传。但正如陶锋博士指出的, 无论技术如何改变, 人工智能美学的基本出发点和关注重点不会变, 它始终是以人为本, 其最终目的是更好地认识人类情感和思维本身, 是为了给人类创造更美好的生活[28]。
【参考文献】
[1]Lake B M, Salakhutdinov R, Tenenbaum J B.Human-level concept learning through probabilistic program induction[J].Science, 2015, 350 (6266) :1332-1338.
[2] 李根.百度百家号宣布2017年给内容分成100亿发布百度写作大脑.[EB/OL].[2018-05-16].http://tech.sina.com.cn/i/2016-11-24/doc-ifxyawmn9951081.shtml.
[3]李彦宏.智能革命:迎接人工智能时代的社会、经济与文化变革[M].北京:中信出版集团, 2017:8.
[4]李文, 程华良, 彭耀, 等.自然语言处理云平台[C]//中国自动化学会.系统仿真技术及其应用学术论文集:第15卷.北京:中国科学技术大学出版社, 2014:408-411.
[5] 恰年网络.AI替代内容创作者?“让机器服务于人才是未来趋势”[EB/OL].[2018-5-28].http://www.qianian.com/news/hangye/net/2018/0428/13559.html.
[6] 邓崎凡.机器人写“诗”, 人类的危机还是机遇?[EB/OL].[2018-05-08].http://www.ce.cn/culture/gd/201801/08/t20180108_27615019.shtml.
[7]索绪尔.普通语言学教程[M].张绍杰, 导读.北京:外语教学与研究出版社, 2001:41-50.
[8] 刁晏斌.论现代汉语史[J].辽宁师范大学学报 (社会科学版) , 2000 (6) :69-73.
[9] 黑格尔.美学[M].朱光潜, 译.北京:商务印书馆, 1991.
[10]郭绍虞, 王文生.中国历代文论选 (一卷本) [M].上海:上海古籍出版社, 2001.
[11]周振甫.诗品译注[M].北京:中华书局, 1998.
[12]耿立波, 刘涛, 俞士汶, 等.当代机器语言能力的研究现状与展望[J].语言科学, 2014 (1) :34-41.
[13]王运熙, 周锋.文心雕龙译注[M].上海:上海古籍出版社, 1998.
[14]查德维克.象征主义[M].肖聿, 译.太原:北岳文艺出版社, 1989:53.
[15] 唠氪.2018微软人工智能大会召开智能机器人小冰成“重头戏”[EB/OL].[2018-05-23].http://www.sohu.com/a/232671966_650310.
[16]朱丰顺.关于文艺心理学中的几个基本概念---客观世界的主观映象、艺术形象、想象、艺术思维和形象思维的研究[J].文艺理论与批评, 1992 (3) :100-107.
[17]王寅珊.研究大脑“爱情环”, 帮助爱情“保鲜”[N].新华每日电讯, 2009-2-13 (8) .
[18]吴琼, 陈锻生.多尺度卷积循环神经网络的情感分类技术[J].华侨大学学报 (自然科学版) , 2017 (6) :875-879.
[19]焦李成, 杨淑媛, 刘芳, 等.神经网络七十年:回顾与展望[J].计算机学报, 2016 (8) :1697-1716.
[20]杨亦鸣.神经语言学与当代语言学的学术创新[J].中国语文, 2012 (6) :553.
[21]耿立波, 邵可青, 杨亦鸣.语言的手势起源:基于镜像系统的证据[J].听力学及言语疾病杂志, 2015 (6) :661-664.
[22]胡俊.艺术·人脑·审美---当代西方神经美学的研究进展、意义和愿景[J].文艺理论研究, 2015 (4) :164-167.
[23]孟凡君.国外神经美学发展述要[J].河南社会科学, 2016 (5) :69-76.
[24] 石璐.人工智能超越想象[EB/OL].[2018-06-03].http://www.cs.com.cn/ssgs/hyzx/201805/t20180526_5812854.html.
[25] 拓扑社.Narrative Science:2017人工智能发展趋势5个预测.[EB/OL].[2018-05-26].http://www.sohu.com/a/122800059_471878.
[26]曾毅, 刘成林, 谭铁牛.类脑智能研究的回顾与展望[J].计算机学报, 2016 (1) :212-218.
[27] 余靖静.中国高校如何领跑“新一代人工智能”[EB/OL].[2018-06-14].http://cnews.chinadaily.com.cn/2018-06/13/content_36381528.htm.
[28]陶锋.人工智能美学的现状与未来[N].中国社会科学报, 2018-2-12 (4) .
(原载《杭州电子科技大学学报》2019年第01期)