中文

Base on one field Cast our eyes on the whole world

立足一域 放眼全球

点击展开全部

法律宝库

更多 >>

论人工智能绘画中版权侵权的法律规制

发布时间:2022-10-28 来源:版权理论与实务 作者:李宗辉
标签: 人工智能
字号: +-
563

内容摘要

对人工智能绘画中版权侵权行为的判断应坚持“思想与表达二分法”,站在具有一定艺术鉴赏能力之“相关公众”的视角判断作品实质性相似与否,结合合理使用的标准分析是否侵害了改编权,将假冒人类画家署名的行为认定为对署名权的侵害。对人工智能绘画中版权侵权的法律规制要求开发者在算法设定中增强透明性、可解释性和加入防止剽窃他人作品的代码,将版权法的若干规则算法化,并不断更新和完善;要求训练者在监督学习中对数据集进行科学合理的标注,与开发者及时沟通以不断修正强化学习策略,以及训练机器学习海量的相关版权侵权案例;要求使用者善意使用绘画机器,确保绘画素材在版权来源上的合法性,对模仿性画作在公开发表前进行必要的实质性相似性鉴定,及时更新开发者为弥补算法漏洞而进行的智能系统升级。

人工智能参与或独立完成绘画已经成为现代科技与艺术创造相融合的重要表现形式。早在1952年,美国贝尔电话实验室的拉波斯基就用计算机创作完成了《波形》等绘画作品。1973年,哈罗德·科恩发布了可以进行机器作画的电脑程序——Aaron,这是世界上第一个计算机美术创作程序,其所完成的静物画和人像画,被世界各地的美术馆珍藏。2016年,荷兰银行ING联合微软和代尔夫特理工大学完成了名为“下一个伦勃朗”的人工智能项目。2018年10月25日,人工智能创作的《埃德蒙德·贝拉米》肖像画在纽约佳得士拍卖行拍出43.25万美元的高价。

人工智能绘画已经取得了令人瞩目的艺术成就,也在其算法模型的深度学习过程和具体绘画方式中潜藏着版权侵权的风险。针对日益兴起的人工智能绘画,在法律上,人们往往将关注的焦点集中在人工智能画作的可版权性问题,而相对忽视了人工智能在绘画过程中可能发生的版权侵权行为。本文不揣浅陋,拟就此问题做一系统梳理,以期起到抛砖引玉之效。

一、人工智能绘画的原理

作为人类视觉艺术表达的成果,绘画作品并非只是作者个人充满天马行空想象力的产物,而是可以通过理性思维进行规律性认知和程序化实践的。这也就奠定了绘画可以被算法化的基础。究其原因,一方面,绘画的对象,即客观世界存在的各种事物,都以线条、色彩、光影等符号在人类意识中形成对应物,也就是构成意识的基本材料,可以通过计算机代码进行形式化的界定和表征。例如,数字图像是由像素组成的二维符号列阵。其中,每个像素均代表图像在二维图格中的一部分。简单地讲,每一个像素就是一位,代表该处图像的明暗。这种同一场景下的粗糙图像与真实图像的唯一区别就是像素位数的多少:高分辨率图像中使用的像素位数更多,能够更好地呈现原图的明暗与色彩。另一方面,人类观察、识别、摹仿和改造视觉对象的思维和行动过程,即绘画过程,也是可以基于绘画的共性规则进行数学“计算”的。时至今日,基于算法的绘画已经发展出分形艺术、基因艺术、细胞自动机、程序主义和超人类主义等十多种流派。

尽管绘画人工智能的各种具体算法已经层出不穷、数量繁多,但是它们的共通之处是由一个特定的模型对绘画对象进行特征提取、数据处理以及图像生成。

像Aaron那样的早期智能绘画程序,大多是按照符号主义人工智能的理念设计的。符号主义人工智能认为,只要抽象出真实世界中那些对求解问题非常重要的特征,机器就能给出这个抽象世界足够的背景信息,并智能地思考简化了的人工世界中的对象及其关系,从而实现模拟真实世界的目的。Aaron的开发者科恩自己也承认,尽管Aaron可以生成不重复的、原创的甚至具有独特风格的画作,但它还不是创造性的程序。科恩本人作为画家的知识和经验在Aaron的迭代过程中发挥了主导作用。Aaron的运行、知识结构的完善以及画作的生成都发生在科恩预设的规则框架之内,是在规则的导向下进行判断、计算、推理和表征的过程。

近年来的绘画人工智能基本建立在神经网络的基础之上,主要得益于机器学习尤其是深度学习技术的显著进步。深度学习与已有方法最大的差异是能够自动地进行数据特征的学习。学习大量的数据,从中自动地找出数据。在深度学习中采用多层神经网络按层次表达数据特征。以人脸图像为例,“人脸”由“眼睛”“鼻子”等概念构成,“眼睛”“鼻子”进一步由“点”“线”等更低级的概念构成。通过层次表达特征,可以更灵活地表达各种各样的数据。深度学习的模型架构变得更加复杂,计算量和学习时间也有很大的增加。

2014年,伊恩·古德费洛开发了基于深度学习的人工智能绘画模型“生成对抗网络”(Generative Adversarial Network,GAN)。GAN算法包括生成器和鉴别器两部分。生成器学习作画的规则,如“任何人物都有两只眼睛、一个鼻子”。这个过程耗时约两天。然后,人工智能会遵照这些规则创建新的图像。鉴别器的工作则是分析判断哪些是来自数据集的“真实”画像,哪些是来自生成器的“虚假”画像。当生成器顺利“骗”过鉴别器,就算大功告成。法国艺术团体Obvious正是通过向GAN输入了超过1.5万幅14世纪到20世纪的人物画像,供其学习,才最终生成了前述拍得43.25万美元的《埃德蒙德贝拉米》肖像画。2016年,谷歌公司推出了“深度梦境”(Google Deep Dream,GDD)这一人工智能绘画工具,同样是以神经网络算法为基础,以海量数据训练机器识别图像,并由多层神经网络提取和量化特征,最终生成画作。2017年,罗格斯大学艺术与人工智能实验室开发了机器更具自主性的绘画系统“创造对抗网络”(Creative Adversarial Network,CAN)。CAN中包含了一种评估任意画作的创造性算法,其在评估作品原创性及后续影响力的时候会将作品在艺术史上的创作环境纳入考量。CAN使用计算机视觉技术建立了一个从15世纪到20世纪画作的网络,经一系列的数学变换后得出创造性定量分析的结果。根据评估结果,CAN设计了人工智能在绘画时输入部分,如颜色、纹理、视角的采用以及画作的主题等参数。CAN要在两种对立的力量中斗争。一方面,CAN要学习已有作品的美学特征;另一方面,如果它创作的作品与已有作品的风格太接近,则会被惩罚。

二、人工智能绘画中的版权侵权风险及其判断

(一)人工智能绘画中版权侵权的风险

我们在此讨论的人工智能绘画中的版权侵权风险,不是指人工智能作为计算机软件作品的侵权风险,而是指其在绘画行为过程中的侵权风险。这种风险大体上来源于两部分:一是供人工智能进行深度学习的海量数据集中包含有他人的版权作品,而人工智能对相关作品的利用行为构成了版权侵权;二是人工智能在某次具体绘画的过程中使用了他人的版权作品,其使用方式构成了版权侵权。我们可以从常见的人工智能绘画方式中对其潜藏的版权侵权风险作出具体说明。

图片滤镜是应用较为成熟的人工智能绘画方式,即通过智能软件帮助用户实现照片或图片的各种艺术效果。2016年,莫斯科的一家科技公司推出了全新的滤镜人工智能Prisma,很快就风靡全球。以神经网络算法为基础,Prisma通过对原始照片和用户想要实现之艺术风格的代表性画作进行分层,然后在各层图片上将两者不断进行叠加,最终生成一种具有相应艺术风格的作品。显然,图片滤镜所使用的照片和画作都可能是有版权的摄影和美术作品,人工智能在进行特征提取和风格糅合的过程中免不了对作品进行复制和改编,这种复制和改编行为即有侵权之虞。

基于笔触的临摹是人工智能绘画的另一种常见方式。前述“下一个伦勃朗”项目的人工智能即属此类。德国科学家也曾尝试用深度学习算法,让人工智能系统学习梵高、莫奈等世界著名画家的画风,创作出全新的“人工智能世界名画”。微软的另一款人工智能机器人小冰则通过学习400年间艺术史上236位绘画大师的画作而独立进行绘画,并化身为生于不同时期和不同国家的7个画家,举办了“或然世界”画展,展出了100多幅作品。2019年7月,在上海交通大学举办的国内首届人工智能互动艺术作品展中,AI-ART团队即现场展示了人工智能算法如何完成一幅临摹作品,即通过强化学习的一种全新架构,将被临摹的照片“转化”为一系列真实的笔触序列,与真人作画的方式相同,“一笔一笔”将被临摹的对象展现出来。由上可知,如果人工智能临摹或模仿的是特定画家仍在版权保护期内的作品,而非那些已经故去很久的画家作品,就必然会发生是否侵害版权的争议。

基于笔触的神经网络算法绘画不仅可以临摹已有作品的风格,而且可以独立地完成简笔画的勾勒。谷歌的AutoDraw就是这样一款可以将人们的随手涂鸦变成完整有趣简笔画的工具。AutoDraw的算法是一个绘制普通物体简笔画的生成性循环神经网络,旨在以与人类相似的方式训练机器概括抽象概念并绘画。其在一个手绘简笔画的数据集上训练模型,其中每张简笔画表示握笔动作的一个序列:往哪个方向移动,什么时候提笔以及停笔。此类人工智能绘画用作训练的简笔画数据集和每次绘画时用户输入的粗糙或不完整的简笔画,都可能是他人有版权的作品,未经许可的使用同样可能构成侵权。

微软小冰和其他一些人工智能还可以根据用户输入的文字完成绘画。小冰以文字作画的具体步骤包括:抽取意象→激发创作灵感→选择内容主题→尝试画面构图→起草线稿造型→底层颜色涂抹→画面层次深入→细节反复打磨。从中可以看出,文字在此只是起到激发灵感和赋予意象的作用,作为一种与美术完全不同的表达形式,人工智能绘画对所使用的文字作品一般不构成侵权,除非是用户为了说明该幅画作由哪一段文字转化而来,将该他人文字作品复制在人工智能所完成的画作上并对外公开展示、传播或发行。

(二)人工智能绘画中版权侵权的判断

首先,我们必须明确,“思想与表达二分法”作为版权法的基本原则在判断人工智能绘画是否构成侵权时,也具有指导性意义。这是因为,无论是早期符号主义人工智能依靠专家知识所预设的绘画规则,还是神经网络算法对绘画共性特征的抽取,对作为绘画对象之客观事物的概念界定,对一般绘画笔触序列的归纳总结,乃至对绘画的时代背景和文化价值的情感计算等,都属于美术作品的“思想”范畴,并不归任何作者私人所有。进一步来说,版权法也是鼓励这种对绘画创作规律的量化分析行为的,因为这样可以使更多的个人学习并掌握精湛的绘画技法,创作出更多具有美学价值的画作,繁荣艺术市场,促进文化进步,而这在具有较强大数据处理能力的人工智能出现之前,是可望而不可及的事情。

其次,判断人工智能绘画是否构成对他人版权作品复制权的侵害,也有一些具体的标准和方法可以依循。如果人工智能在图片滤镜绘画过程中只是机械地照搬、拼接和组合了他人的美术、摄影或图形作品,那么显而易见地构成侵权行为。早在2010年的一起美术作品侵权纠纷中,武汉市中级人民法院就指出,“被告通过计算机图形软件将原告人模图案进行剪接、粘贴,然后对各个部分进行机械拼凑,缺乏独创性,实质上是一种复制行为。”对于并非机械复制而需要进行“实质性相似”判断的情形,应当明确以具有一定艺术鉴赏能力的“相关公众”作为判断主体。相关公众就人工智能的画作与某一部作品是否构成实质性相似的判断适宜采用部分比对法,而就其与多部作品是否构成实质性相似的判断则应当采纳整体观感法。我们还可以运用计算机技术将人工智能画作与所要比对的作品进行像素分解,观察两者之间的相同与差异之处,作为判断是否构成实质性相似的参考因素。

值得注意的是,如若作品比对的结果是构成实质性相似,人工智能的“临摹”行为即应被认为构成复制侵权行为。尽管我国《著作权法》在2001年修正时明确将“临摹”从复制方式的列举中加以删除,但这仅仅表明,立法者认为并非所有的临摹都构成复制,却并不排除部分临摹仍可能构成复制这一事实。况且,人工智能作为机器在临摹的过程中并不像自然人那样付出的是个性化、差异化乃至创造性的劳动,而是一种精确量化再现的过程。换言之,两款以上的人工智能,或者同一款人工智能两次以上临摹一件作品,都能够生成与原作一模一样的作品,而两个以上的自然人,或者一个人对同一作品两次以上的临摹,既不能形成与原作相同的作品,临摹而成的作品彼此之间也会存在肉眼可见的差异。

再次,人工智能将摄影作品、图形作品、电影作品以及现有的美术作品转换、糅合成新美术作品的过程是否侵犯改编权,要结合合理使用的判断标准加以认定。根据判断合理使用的“三步检验法”,第一步是局限于特定的情形。在法定的合理使用具体情形中,人工智能在绘画中对现有视觉艺术作品的借用只可能与“适当引用”相关,即为介绍、评论某一作品或说明某一问题而在作品中适当引用他人的作品。人工智能在此情境下对现有视觉艺术作品的使用显然不是为了介绍和评论它们,所以只剩下“说明某一问题”这一种可能性。因此,只有当人工智能的这种作品使用行为,是为了说明其神经网络算法对不同类型视觉艺术作品之特征分解、抽取、赋值和计算的共通性,以及糅合成新作品的可能性、技术架构和机器学习策略时,其才符合法律所规定的特定情形。“三步检验法”的第二步是“不与作品的正常使用相冲突”。此处的作品正常使用,既包括经验意义上也包括规范意义上的使用,前者是作品通常的、典型的使用方式,后者则包括考虑技术和市场发展动态的可预期使用。从这个角度来讲,人工智能绘画中对其他作品的挪用很难通过检测,因为将照片、图片等进行智能处理后发布在社交网络上已经成为一种比较常见的作品使用方式,并正变得越来越受欢迎。“三步检验法”的第三步是“没有不合理地损害著作权人的合法利益”,强调的是对权利人利益影响的微小性,在“适当引用”情形下又直接与引用的适当性密切相关。人工智能在绘画中对他人版权作品的引用是否适当要考虑“量”和“质”两方面的限制,前者是指所引用的部分应限于原作和所完成新作的一定比例,后者是指所引用的部分不能是他人作品中最为传神、最具精髓、最体现独创性的部分。当然,损害是否控制在合理的范围内还与该使用方式与版权人使用方式之间,是否有市场替代性等因素相关。

最后,人工智能模仿特定的画家作画并假冒其署名,或者虽然没有直接署名但误导公众相信其画作是该特定画家的作品的,根据我国《著作权法》的规定,属于侵害作者署名权,并可能同时损害公共利益的侵权行为。人工智能为检验其绘画成果是否能够以假乱真,达到了与人类并驾齐驱的水平而进行“图灵测试”,这原本无可厚非。但在获得测试的结果之后,人工智能的开发者、使用者或者画作的展览者、出售者等应当及时地向公众揭示相应的画作系由人工智能完成这一事实。从经济上讲,这是为了防止有人恶意利用人工智能攀附知名画家的声誉获取非法利益,扰乱文化艺术市场的正当竞争秩序;从精神上讲,这是为了防止知名画家向社会传递其艺术思想和审美理解的视觉媒介被不当扭曲,以及人类智力创造的成果与机器生成的表达被混淆在一起。

三、人工智能绘画中版权侵权的体系化法律规制

(一)开发者算法设定的法律规制

绘画人工智能的开发者一般是人工智能绘制并对外展示其画作的最大受益者。开发者首先可以就其智能软件取得版权保护,即便是依据开源框架或平台研发、版权保护受到很大限制的绘画人工智能,开发者仍然可以借此占领客户、应用和数据资源,逐步建立新的产业格局和技术标准。纯粹以研究为旨趣的绘画人工智能开发者也成功引发了人们对其新技术及其艺术创造力的关注,提升了自己的学术声誉和社会价值,获得了一种无法直接以金钱衡量的利益。因此,基于获益与风险承担相一致的原则,绘画人工智能的开发者应当对人工智能的版权侵权行为负主要责任。

从技术上讲,开发者也是对绘画人工智能最具有发言权和控制力的主体。首先,开发者不得故意通过算法指使人工智能从事版权侵权行为,无论该行为属于商业性的营利行为还是单纯炫技的骇客行为。其次,开发者应不断加强绘画人工智能的透明性、可解释性、可靠性和可控性,在面对版权侵权质疑时能够通过对算法运行机理的解释证明“不是算法惹的祸”。最后,对于因人工智能的自动决策、自主行动特点而发生的超出开发者预见范围的版权侵权行为,开发者除了应当立即制止人工智能的侵权行为外,还应当及时对人工智能的算法漏洞加以修补。在不能很好修补算法漏洞的情况下,则应当暂时甚至永久停止该人工智能的发布。

在算法设定上预防版权侵权行为对开发者来说也具有一定的可行性。在符号主义论者看来,法律规则就是一个符号系统,它将规则和事实用文字/符号加以表述,并以一定的方法对符号进行处理,将事实区分为相关与无关,并进一步将相关事实进行合法/非法的编码处理。绘画人工智能的开发者可以将版权法上的独创性、复制、改编、合理使用、侵权行为等概念和规则融入到其算法中去,作为人工智能绘画时为或不为的参考标准。

在实践中,要求一款人工智能既能够学习、模仿甚至超越人类绘画的水平,又可以完全避免在此过程中发生版权侵权行为,似乎确实有些勉为其难,但开发者应在现有技术条件下尽最大努力。例如,库兹韦尔就在其“电脑诗人”RKCP中设计了防止剽窃他人作品的规则。

(二)训练者监督学习的法律规制

几乎所有的绘画人工智能都是在经过海量作品的学习和训练后才达到了较高的创作水平。从某种意义上讲,正是训练使人工智能一步步从绘画的门外汉变成初学者,直到具有专业水准。人工智能独立作画的过程实质上就是其训练效果的集中展示。因此,绘画人工智能的训练者对预防其版权侵权行为具有较强的影响力,在法律上就应当负有采取一定措施的义务。

所谓的人工智能训练主要是指监督学习,即利用已标记的有限训练数据集,通过某种学习策略/方法建立一个模型,实现对新数据/实例的标记(分类)/映射。人类训练者在监督学习中的作用主要在于样本选择和数据标注。表面上看,训练者可以只为绘画人工智能选择全部处于公有领域的作品作为学习的数据集,正如已知的很多人工智能选择伦勃朗、梵高、莫奈、塞尚等历史上美术大师的作品进行学习一样,但这也只能避免训练中所完成的每一幅画作没有版权侵权风险,却无法保证人工智能在被推向市场或者免费公开后,当输入的数据中包含有版权作品时,它不会侵权。并且,这种对训练数据集的时代限制会阻碍人工智能对当代绘画的分析、评估和学习,乃至形成不恰当的艺术偏见,远远悖离了我们研究和探索人工智能绘画的初衷。因此,对训练用的数据集进行科学合理的标注,并保持对人工智能监督学习结果的动态关注,及时与开发者沟通,进行强化学习策略的修正和完善,才是训练者帮助绘画人工智能减少版权侵权几率的最佳做法。更为具体地来说,在绘画人工智能分层提取训练数据集的特征时,可以根据其抽象程度进行“思想”“表达”的标注,运用逻辑回归的监督学习技术,在绘画人工智能每次生成的作品只涉及训练数据集的“思想”时予以奖励,而在其不当使用训练数据集的“表达”时予以惩罚。

训练者还可以借助神经网络算法让绘画人工智能学习海量的美术作品版权侵权案例,使人工智能在绘画过程中尽量避免发生与人类相似的侵权行为。

(三)使用者绘画操作的法律规制

使用者是直接利用绘画人工智能生成自己所需作品的人,其审美诉求、输入数据和操作指令等在很大程度上影响着人工智能所生成画作的具体表现形式,因此,使用者也有防止绘画人工智能版权侵权的注意义务。

使用者应当善意地将绘画人工智能作为辅助创作的工具,不得像文字作品的洗稿软件那样将其用来“洗画”,对众多视觉艺术作品中的独创性特征进行明显可被相关公众感知的碎片化撷取和重组,以创新为名,行剽窃之实,扭曲人们的审美世界,妨碍真正的艺术进步。这一点即便在用人工智能将文字转换为绘画的情形下也同样适用,例如,使用者不得简单向人工智能发出这样的指令:A画作的某某部分,B画作的某某部分,C画作的某某部分……使用者在选择单幅画作、图片或照片作为人工智能滤镜、加工,或者独立绘画的素材时,应当确保这些素材没有版权瑕疵,即要么是自己拥有版权的作品,要么是已经获得了权利人的相关授权。即便是在获得改编授权的情况下,使用者也不得指令人工智能对所使用的作品素材进行明显与其艺术思想、伦理导向相悖的歪曲和篡改,例如对红色革命题材的画作进行低俗趣味化的修改。

当使用者指令人工智能模仿著作财产权仍在保护期内的特定画家的风格绘画时,应就所生成的画作与该画家的作品进行实质性相似与否的比对,必要时还应当寻求专业鉴定部门的意见,以最大限度地排除版权侵权的风险,尤其是使用者准备将人工智能画作用于大规模的工业化产品之上或者公开发行传播时,就更应当如此。使用者当然也不得在人工智能画作上冒用所模仿画家的署名,或者进行这样的虚假宣传。

如果人工智能完全依据抽象概念独立创作完成的画作恰巧与他人的版权作品构成实质性相似,则使用者应对该独立创作的事实负有一定的证明义务。此外,使用者还应当保持与开发者就人工智能系统自动升级的网络联系,及时弥补可能发生版权侵权行为的“算法漏洞”。

四、结语

人工智能绘画开辟了用科技表现艺术的新时代,通过算法概括和总结了人类绘画的规律,并在与人类绘画的竞相勃发、融合转换中展示了计算智能的艺术表现力和丰富可能性,因而是值得继续深入研究和拓展的领域。但这种研究和拓展应当是在价值上以对人类绘画具有增益性的方式实现,而不能反过来侵害人类已有的视觉艺术表达成果,即不能实施版权侵权行为。就现阶段而言,人工智能还只是高级一点的绘画工具,对其版权侵权行为的法律规制应当着眼于其背后的开发者、训练者、使用者等相关人类主体,要求他们在技术上和行动上承担相应的注意义务,以及采取合理的预防措施。

原文刊载于《版权理论与实务》2022年第3期,原标题为《论人工智能绘画中版权侵权的法律规制》,注释从略。

基金项目:国家法治与法学理论研究项目“人工智能的知识产权法挑战与应对”(17SFB3033)。

评论

在线咨询