中文

Base on one field Cast our eyes on the whole world

立足一域 放眼全球

点击展开全部

法律宝库

更多 >>

新质生产力赋能生成式人工智能版权产业:样态塑造、法律障碍与因应之策

发布时间:2024-12-26 来源:版权理论与实务 作者:黄玉烨 张芷维 中南财经政法大学
字号: +-
563
【内容提要】“新质生产力”是知识产权新的时代命题。“新质生产力”的赋能,催生了生成式人工智能版权产业这一新业态。新质生产力塑造了生成式人工智能版权产业的全新样态,推动了劳动者新质化(人工智能作品创作者)、劳动对象新质化(版权数据与交互式信息)与劳动资料新质化(人工智能算法模型),以此促成了生产力要素的全新配置。生成式人工智能版权产业高质量发展面临着三大法律障碍,包括人工智能作品创作者的版权激励困境、人工智能数据训练的版权侵权风险和人工智能算法模型的工具定性分歧。为因应产业的迭代发展,应当通过法律解释的方法将满足“个性融入 + 编辑加工”二元干预条件的人工智能作品纳入版权法的保护范围,并将其版权赋予人工智能作品创作者;应当在立法中明确将人工智能机器学习和文本与数据挖掘行为认定为合理使用情形;坚守人工智能算法模型的工具属性和地位,避免主体拟制所引发的法律和伦理风险。
 
【关键词】新质生产力;生成式人工智能版权产业;人工智能作品;独创性;合理使用
 
“生产力”是马克思主义政治经济学的基石概念,是促进人类社会迭代进步的根本动力。这一概念在中国式现代化的背景下迈入了崭新的历史阶段。2024年1月31日,习近平在中共中央政治局第十一次集体学习时指出,“新质生产力是由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生的先进生产力”。[1] 2024年3月5日,《政府工作报告》对本年度工作进行了部署,其中第一条就提出,“要大力推进现代化产业体系建设,加快发展新质生产力”。[2] 从 web1.0 到 web3.0,内容生产经历了“专业生成内容”“用户生成内容”和“人工智能生成内容”(AI-Generated Content,简称“AIGC”)的代际。知名市场调研机构 Gartner 分析,到 2025年 AIGC 在网络内容中的占比将达到 30% 左右,[3] 国内相关智库预测,到2030年我国 AIGC 的市场规模将突破万亿。[4] 可以预见的是,生成式人工智能(Generative AI,简称“GAI”)将为内容生产提供巨大的技术动能,推动版权产业的深刻变革。
 
吴汉东教授认为,在智能算法时代,版权产业的格局和形态发生了重大变化。[5] 生成式人工智能推动了版权行业的创新发展,其在各领域应用快速普及,并形成产业化。[6] 基于GAI 与版权产业的深度融合,有学者提出了“人工智能版权产业”(AI copyright industry)的概念,认为有关生成式人工智能版权保护的讨论应围绕版权法的“产业法”属性展开,[7] 此外,在美国,与生成式人工智能相关的版权保护规则也建立在“产业导向”(industry-oriented)之上。[8] 根据世界知识产权组织(WIPO)公布的《版权产业经济贡献调查指南》,“版权产业”被定义为版权发挥着明显作用的产业,以产业对版权的依赖程度为标准,可以将其分为“核心版权产业”(the core copyright industries)“相互依存的版权产业”(the interdependent copyright industries)、“部分版权产业”(the partial copyright industries)和“非专门支持产业”(the non-dedicated support industries)四类。生成式人工智能技术嵌入版权产业,催生了“生成式人工智能版权产业”这一新业态。本文认为,“生成式人工智能版权产业”主要是指生成式人工智能对传统版权产业深度赋能后所形成的产业新形态,既包括 GAI 深度赋能后的音乐产业、影视产业、文艺产业、游戏产业等“新型核心版权产业”,也包括那些提供生成式人工智能产品、服务或设备的“相互依存的版权产业”。例如,火爆全球的国产游戏《黑神话:悟空》在角色模型、场景生成、画面渲染、特效设计等方面运用了大量的 GAI 技术,体现了 GAI 对游戏产业转型升级的深度赋能;再如,在影视行业中,爱奇艺以人工智能技术赋能内容创作,极大提高大型综艺创作的速度与艺术水准。[9] 此外,直接提供“文生文”(如ChatGPT)、“文生图”(如 Midjourney)、“文生视频”(如 Sora)等生成式人工智能产品或服务的产业也属于本文所说的“生成式人工智能版权产业”的范畴。
 
人工智能作为大国竞争的工具,对一个国家提高全球竞争力具有重大意义。据中国信通院《人工智能白皮书(2022 年)》统计,已有超过40个国家(地区)将人工智能发展上升至战略高度。[10] 美国更是陆续成立了国家人工智能倡议办公室,将人工智能提高到了“未来产业”的高度。目前,生成式人工智能版权产业是国际人工智能竞争的重要环节,多个国家和地区正致力于推动人工智能版权领域的立法和司法保护工作。在中国,生成式人工智能版权产业的发展必须以本土化理论为镜鉴,结合中国具体国情进行发展和部署。新质生产力理论为当下生成式人工智能版权产业的高质量发展提供了顶层理论参照。
 
一、样态塑造:生成式人工智能版权产业的结构升级
 
马克思主义政治经济学提出了生产力这一经济学概念,是指人类改造和利用自然以维系自身繁衍和存续的能力,是推动经济发展和社会进步的决定性因素。生产力包括劳动者、劳动对象和劳动资料三大组成部分。新质生产力以劳动者、劳动资料、劳动对象及其优化组合的跃升为基本内涵。[11] 在中国式现代化的背景下,新质生产力适应了新一轮的产业革命,使得生产中物的范围、人和物的结合方式、人和人的结合方式发生了深刻改变。这一命题与当下生成式人工智能版权产业的转型升级具有内在契合性。[12] 基于此,“新质产业”的概念已得到学界的高度重视,其被认为是新质生产力形成的核心环节,[13] 是制约新质生产力水平提升的主要因素。[14] 以人工智能作品创作者为代表的新型劳动者、以版权数据和交互式信息为代表的新型劳动对象,以及以人工智能算法模型为代表的新型劳动资料,正在塑造生成式人工智能版权产业的全新样态。
 
(一)劳动者新质化:人工智能作品创作者
 
劳动者(Labor Power)是新质生产力的引领者。推动生产形态向信息化、数智化转变,培育战略性新兴产业和未来产业,离不开新型劳动者队伍。[15] 劳动者是生产过程的主体,指的是那些提供体力或脑力劳动以生产商品或提供服务的人。马克思强调,劳动力是创造价值的唯一源泉。在传统的版权(作品)生产领域,劳动者主要指借助传统工具和媒介创作内容的主体,比如画家、作家、作曲家等。这些主体通过独特的想象力和表达技巧来塑造作品。
 
在生成式人工智能背景下,GAI 技术推动了版权领域劳动者的新质化,新型劳动者包括GAI 算法设计者、GAI 产业投资者和人工智能作品创作者等主体,其中人工智能作品创作者是核心主体,因为他直接关系到了人工智能作品的产生。这种扩展导致了劳动者角色的重大转变,人类更多地从事创意指导、表达训练、审美转嫁、伦理监督等高级认知活动。同时,AI 的加入提升了整个版权产业的创新能力和生产效率,实现了从劳动密集型向知识和技术密集型的转变。在新质生产力的赋能下,创作者将成为利用生成式人工智能技术深度参与人机互动,从而创作出人工智能作品的新型劳动者。目前,生成式人工智能已经应用到了许多版权领域,包括智能写作(如ChatGPT)、智 能 音 乐(如Music LM)、 智 能 绘 画(如Midjourney)、智能视频(Sora)等诸多方面,这些版权分支产业的发展极大地依赖于人工智能作品创作者。
 
在数字社会的创作环境中,存在一种被称作“集体创造性”(collective creativity,简称“CC”)的社会思潮,这种理念依靠“分布式单独个人的大脑”(distributed single brains)使“分布式创造”(distributed creationg)成为可能,并将其凝结为群体力量来增加数字内容“吞吐量”的最大化。[16] 在劳动者新质化的趋势下,传统版权理念中的“浪漫主义色彩”被淡化,作品不再是“普罗米修斯式的天才”的创作,作者也不再是“孤独的天才”。AI 的嵌入使得版权产业迎来了真正的“全民创作”机遇,从而提高了整个社会的文化增量与知识存量。社会主义文艺,从本质上讲,就是人民的文艺。习近平讲到,“文艺创作方法有一百条、一千条,但最根本的方法是扎根人民”[17]。可以说,以最广大人民群众为依托的“全民创作”才是实现社会主义文化繁荣的根本途径。
 
在生成式人工智能版权产业下,人工智能作品创作者是推动创作行为从“精英化”迈向“平民化”的重要桥梁,是促进版权产业转型升级与新质化发展的关键主体。
 
(二)劳动者对象新质化:版权数据与交互式信息
 
劳动对象(Labor Object)是劳动所作用的对象,通常是自然界或理念世界中被加工或转化以生产商品的事物。这些对象包括物质实体(如木材、矿石、农作物)以及非物质材料(如信息、数据或个人情感)。在生产过程中,劳动者将自己的劳动付诸劳动对象,使其转化为具有交换价值和使用价值的产品或服务。在版权领域,劳动对象通常指的是创作者加工或表现的对象:这可以是物质的,比如画布、白纸或雕塑材料,也可以是无形的,比如创作者的经历、情感或者被观察到的社会现象等。这些劳动对象会被创作者转化为具体的表达。例如,在文学创作中,劳动对象可能是作者要讲述的故事或试图抒发的情感;在音乐创作中,它可能是主题、风格或旋律;在绘画中,它可能是画家想要描绘的客观景象或内心世界。
 
然而,在新质生产力和生成式人工智能的推动下,版权领域的劳动对象得以新质化,产生了版权数据与交互式信息这一新型劳动对象。习近平指出:“加快数字中国建设,要构建以数据为关键要素的数字经济。”[18] 2019年10月,党的十九届四中全会正式将数据列为与土地、劳动、资本和技术并列的生产要素,从而拉开了我国以数据要素驱动数字经济发展的新序幕。更进一步,2022 年 12 月 2 日的《中共中央国务院关于构建数据基础制度 更好发挥数据要素作用的意见》明确提出,要建立数据产权制度,激活数据要素潜能,增强经济发展新动能,构筑国家竞争新优势。
 
生成式人工智能的应用进一步增加了传媒业对优质数据的需求。[19] 在生成式人工智能版权领域,创作者之所以能够提高劳动效率,就是因为数据要素的驱动。算法模型将大量享有版权的作品或者公有领域的材料(如诗歌、绘画)汇聚起来形成“数据集”,通过神经网络进行机器学习来培养模型的生成能力。这些数据集在 AI 创作过程中可以等价于原材料,AI 在人类的指导下分析和学习这些“原始数据”并基于人类输入的“新数据”来生成原创内容。此外,劳动对象也可以理解为 AIGC 的主题或灵感来源,即人类试图指导 AI 所表达的内容。在创作过程中,创作者可以将自己的思想或创意作为指令下达给 AI,AI 对创作者的指令进行执行和反馈,在人和机器多轮的互动中,产生了新的劳动对象——(人类和人工智能的)交互式信息。由此传统版权生产领域的劳动对象(纸币、幕布和单向度的思想情感)被 AI新质化为了人机的交互式信息,从而为生成式人工智能版权产业塑造了崭新的劳动对象。
 
(三)劳动资料新质化:人工智能算法模型
 
劳动资料(Means of Labor)是劳动者在劳动过程中所使用的工具或媒介,例如机器、设备和设施等,它们能提高劳动生产率,以此加速劳动生产过程。劳动资料在创作过程中主要指创作工具,如笔墨、颜料、乐器、雕刻工具等。这些工具或媒介使创作者能够将自己的思想、情感和创意转化成具体的表达形式。
 
新介质的劳动资料是新质生产力的核心要义之一。[20] 在生成式人工智能版权产业中,人工智能算法模型属于新型劳动资料(劳动工具)。其中,算法是核心技术,“生成对抗模 型”(Generative Adversarial Network,简称“GAN”),以及其衍生的“深度卷积式生成对抗模型”(Deep Convolutional GAN,DCGAN)、“条件式生成对抗模型”(Conditional GAN,CGAN )、“InfoGAN”等修正模型,增强了模型的收敛速度和可解释性;2022 年扩散模型(diffusion model)的应用持续推动着技术迭代。劳动资料的新质化发展极大地提高了生产效率,降低了创作门槛,使得个人和小型创作团队能够以更低的成本参与到创作过程中,进一步提高了版权产业的市场规模。
 
总之,新质生产力塑造了生成式人工智能版权产业的全新样态,从劳动力(人工智能作品创作者)、劳动对象(版权数据和交互式信息)以及劳动资料(人工智能算法模型)等方面推动了传统版权产业的新质化转型,使其迎来了高质量发展的历史机遇。
 
二、法律障碍:生成式人工智能版权产业发展的著作权法隐忧
 
知识产权是促进新质生产力的有力保障。例如,知识产权可以为创新活动进行产权界定并提供激励机制。[21] 2024年 3月施行的 《第十四届全国人民代表大会第二次会议关于 2023年国民经济和社会发展计划执行情况与2024年国民经济和社会发展计划的决议》指出:“大力强化创新驱动,要完善科技激励机制”。产业发展需要得到法律背书。当下,传统版权产业正处于向生成式人工智能版权产业转型升级的关键阶段,但在法律层面却存在层层障碍。这将严重阻碍版权产业新质生产力的发展。
 
(一)人工智能作品创作者的版权激励困境
 
版权作为最重要的知识产权之一,其核心使命在于激励文化产品的创造。生成式人工智能版权产业的发展存在三种激励机制,其一是“版权激励机制”,其二是“邻接权激励机制”,其三是“产业激励机制”。这三种激励机制具有不同的制度机理,同时也附加了差异化的制度成本。下文将指出,为什么“邻接权激励机制”和“产业激励机制”并非是促进产业发展的最佳选择。
 
1. 邻接权激励机制
 
邻接权说认为,应当在著作权法上设置一项新型的邻接权,对 AIGC 进行统一保护,例如“人工智能创作投资权”“数据处理者权”“生成式信息使用者权”等。邻接权说的支持者提出了消极理由和积极理由以自圆其说。前者认为 AIGC 不具备赋予作品版权的独创性要件;后者认为在 AIGC 上设置邻接权可以鼓励投资和促进信息传播,从而推动产业发展。具体言之,该学说认为 AIGC 作为一种新型信息产品,是基于投资人的“非创作性投入”而产生的,因此在法理上应当通过“利益回报”进行激励,从而促进产业链的发展。[22] 然而,该学说错误地理解了生成式人工智能版权产业的激励机制,邻接权路径并不能产生任何有效的激励作用,也不能更好地促进信息传播。同时,诸如“人工智能创作投资权”、“数据处理者权”等邻接权的设权思路也具有极大的法理障碍。
 
首先值得肯定的是,邻接权说正确地认识到了生成式人工智能版权产业中劳动工具的新质化趋势,正视了人工智能算法模型作为产业技术基础的作用。但是,该观点对产业激励的“所指”存在一定误解。日本著名知识产权法专家富田彻男指出,“知识产权全面反映着技术开发—产业—消费者这种市场结构;如果知识产权制度与这种结构不适应,就不会带来任何实效”。[23] 在生成式人工智能版权产业的市场运行中,推动投资者(企业 / 公司)进行技术开发和商业运营的主要动力并非是“产权激励”,而是“商业利益”。出于明显的商业原因,人工智能投资者或开发者不太可能声称自己对借助其系统产生的成果拥有著作权或共同所有权(co-ownership),因为这可能会降低产品对客户的吸引力。[24] 因此,人工智能系统的合同使用条款(contractual terms of use)很可能会排除这种权利的主张。例如,OpenAI 在《使用条款》中声称,“我们将输出中的所有权利、所有权凭证(title)和利益(如有)转让给您”。再如,智能绘画工具 Midjourney 在《使用协议》中声明,“您在使用服务时所创建的所有图像归您所有”。事实上,无论是《民法典》抑或是知识财产法,其经济本质就是在有价值的资源上创设和界定排他性使用的权利。如果一个主体对特定资源没有占有、管领或排他的意思,为何还要花费大量制度成本进行界权?基于生成式人工智能版权产业的现实,在投资者所谓“非创造性投入”上设置邻接权根本就是缘木求鱼,更别提还要在新型邻接权的立法上付出难以捉摸的论证义务。
 
综上所述,邻接权路径误解了生成式人工智能版权产业的商业动机,不仅无助于产业激励机制的构建,还会产生大量的立法成本,甚至会破坏著作权法的权利体系与制度功能。
 
2. 产业激励机制(产权排除机制)
 
产业激励论认为,生成式人工智能版权产业的发展仅需依靠市场自身的调节机制,无须诉诸产权激励。该观点进一步指出,“不给予AIGC 产权保护反而有利于激励生成式人工智能版权产业的发展”。[25] 这种立场提出了一个坚实的论据:“虽然美国版权局拒绝对 AIGC 进行版权保护,但这丝毫没有影响包括 OpenAI在内的诸多世界顶级的人工智能企业的发展和崛起,也没有阻碍 ChatGPT 等划时代的人工智能产品的不断更新与完善”。该观点提出的论据似乎令人难以拒绝,但实际上却存在诸多难以自洽之处。
 
产业激励论陷入了“形而上学”的陷阱中。在产权经济学中,有一种错误的分析范式——产权的静态分析。著名的法律经济学学者波斯纳指出,“产权的静态分析将经济活动的时间维度忽略不计,把所有对变化的调整都假设为发生在瞬间,这是一种不真实的假设”。[26] 法律具有滞后性,法律对市场的作用遵循“技术/ 产业—法律规制—法律实效”的顺序机制。产业激励论的假设仅仅回答了生成式人工智能版权产业在法律规制之前的“一段时间内”确实有所发展,但是却没能回答如果进行了产权激励是否会进一步推动产业发展、如果拒绝进行产权激励后续会产生怎样的弊端。
 
第一,如果通过市场规律建立起以“产业激励”为中心的发展模式,会对我国整个版权产业带来不可低估的破坏。试想,在不进行产权激励的情况下,会有大量消费者通过使用AIGC 来减少对人类创作内容的使用——因为消费者无须付费和取得授权。在交易成本被大大缩减的情况下,真正的人类创作内容在市场竞争中的优势将大大降低,从而通过供求关系的市场机制影响人类创作者的收入,降低其创作动力,进而破坏著作权法的激励机制。
 
第二,产业激励机制排除了产权功能,将阻碍技术创新。在生成式人工智能版权产业中,人工智能算法模型是劳动工具新质化的体现。算法模型的建立以大量数据(作品集合)为基础。在 GAI 技术起步阶段,其所训练的数据主要是人类创作的受著作权法保护的作品;如果拒绝在 AIGC 上设立产权,为规避侵权风险,AI 训练者可能会用大量现存的 AIGC 代替人类作品进行数据训练。这样会大大降低模型的生成能力。因为 AIGC 是基于人类已有作品进行的模拟、训练和生成的产物,其在客观上虽然具备一定的创造力,但仍不可避免地与人类创作内容在情感维度和创造维度存在差距。在数据训练中,如果将一手的优质数据资料(人类作品)替换成二手的传来数据资料(AIGC)很可能会降低 GAI 的生成能力,不利于技术进步与产业发展。
 
第三,产业激励机制将 AIGC 置于公有领域,会压缩人类作者的创作空间。事实上,基于强大的算法和算力,人类的创作效率远不及AI。AI 巨大的内容“吞吐量”将使其在社会知识存量占比中占据显著优势,并且其比例会不断增大。如果将 AIGC 全部置于公有领域,会导致大量在形式上具有创造性的内容被定性为公有材料,从而压缩了人类潜在的创作空间,加剧人类的创作危机。
 
第四,产业激励机制拒绝对任何 AIGC 赋予产权,将陷入“绝对平均主义”的错误,导致劣币驱逐良币。“绝对平均主义”是我国五十年代中后期人民公社化运动中推行的一项极端政策导向,例如,“发给伤病者的费用,反对分伤轻伤重,要求平均发给”。这种绝对平均主义的倾向在各个领域抑制了生产积极性,这一极端政策导向后来得到了纠正。在生成式人工智能版权产业中,如果对所有的AIGC 不加区分,均不赋予产权,那么愿意花费大量时间和精力用在指令调整、参数设置和后期编辑加工与再创作等过程中的用户将会大大缩减,从而降低市场中内容的质量。长此以往,“精细化创作”将逐渐被“批量化创作”取代,这不利于生成式人工智能版权产业的持续健康发展。
 
3. 版权激励机制
 
版权激励机制承认用户对符合作品构成要件的 AIGC 享有版权,以此使得用户通过专有权的持有和行使,激发自身的创作动能,推动生成式人工智能版权产业的可持续发展。上文提及,生成式人工智能版权产业发展存在着激励困境,而“邻接权激励机制”和“产业激励机制”均无法回应产业的新质化发展。“版权激励机制”能够更好地实现产业利益的平衡:(1)从投资者的角度来说,大型生成式人工智能企业享有新型劳动工具(人工智能算法模型)的软件著作权,其盈利来源主要依赖于收取许可费、广告费等等;上文也列举了 OpenAI 等人工智能企业自动放弃了产权主张以增强产品竞争力;(2)从传统人类创作者的角度来看,将大量 AIGC 放置于公有领域会产生“压缩人类作者创作空间”“削减人类作者市场竞争力”“降低人类作者创作意愿”等负面影响;(3)从产业技术变革的角度看,排除 AIGC 的产权,可能导致 AI 训练者为规避侵权风险,用 AIGC 取代人类作品来进行数据训练,从而降低新型劳动资料(人工智能算法模型)的生成能力;(4)从人工智能作品创作者(用户)的角度看,肯定部分 AIGC 的可版权性可以激励创作者在智能创作的过程中融入更多的创造性劳动,提高 AIGC 的质量,避免让批量化生成的劣质内容充斥版权市场。综上所述,“版权激励机制”才是生成式人工智能版权产业新质化发展的核心逻辑,然而该机制的运行在版权法层面存在一定障碍。
 
对于 AIGC 是否构成作品主要在于考察AIGC 是否具备著作权法所要求的“独创性”。对此,目前学界存在“肯定说”“否定说”和“折中说”三种立场。
 
“肯定说”普遍认为,人工智能作品与人类作品在独创性的有无问题上没有太大差别,应进行同等评价。吴汉东指出,对人工智能作品应该与人类作品坚持同一认定尺度,只要是自己生成的并且与他者不同的结果,就具备独创性。[27] 卡林·赫里斯托夫(Kalin Hristo)认为,应重新定义作者身份,将“非人类”包括在其中,从而使得具备创造性的人工智能作品获得版权法保护。[28] 帕梅拉·萨缪尔森(Pamela Samuelson)认为,人工智能作品完全可以满足独创性和固定性(fixation)的要求,应当赋予版权。[29]
 
“否定说”则一般会认为,人工智能作品并非是独立完成且具备最低程度创造性的智力成果,其本质是一种机械化产物。例如,王迁认为,人工智能作品是基于算法、规则和模板的结果,无法体现人类的情感和个性,不符合独创性之要求。[30] 拉尔夫·D.克利福德(Ralph D. Clifford)则认为,虽然计算机能独立完成创作,但是其输出结果不满足受法律保护的要求,因为其背后没有作者。[31]
 
“折中说”认为,人工智能作品可能具备独创性,也可能不具备独创性,因而只能基于特定标准在个案中进行弹性认定。蒋舸主张,应当根据用户的贡献来决定人工智能作品是否具备独创性。[32] 德国马克斯·普朗克创新和竞争研究所于 2021年4月9日发布了《人工智能和知识产权法的立场声明》。该声明认为,尽管人工智能“自主”(autonomously)产生的输出显然不符合版权保护的条件,但考虑到人类的创造力,借助人工智能工具生成的“作品”是否能达到保护阈值,这高度取决于案例。[33]
 
综上所述,AI 版权产业首先要解决的是内生动力问题,即建立有效的激励机制。上文指出,“版权激励”才是推动传统版权产业新质化发展的真正动力。但是,赋予人工智能作品创作者版权,面临着独创性的解释论障碍,后文将在规范解释层面回应这一难题。
 
(二)AI 数据训练行为的版权侵权风险
 
在生成式人工智能版权产业中,新型劳动对象主要是指版权数据和交互式信息。其中 AI对含有版权的数据进行训练很容易引发侵权风险。人工智能作品创作者需要依托 AI 模型才能完成整个创作过程。因此,AI 模型设计者需要收集大量享有版权的作品,将其“投喂”给大模型进行机器学习,在这一过程中就直接涉及对他人作品的使用问题。根据我国《著作权法》第 24 条之规定,我国并没有将文本与数据挖掘行为或大模型数据训练问题作为合理使用的法定情形,这意味着对他人作品进行数据训练会构成著作权侵权。此外,我国著作权合理使用制度的兜底条款具有严格的法定性,并非是具有抽象判定功能的一般条款,因此也无法为数据训练行为提供豁免。[34]
 
近日,谷歌因在未通知或支付出版商和新闻机构的情况下使用了他们享有版权的内容,对其智能聊天机器人 Gemini(原 Bard)进行训练,被法国竞争管理局处以 2.5 亿欧元的罚款。同时,OpenAI 因训练大语言模型使用了大量《纽约时报》的作品,《纽约时报》将 OpenAI 告上法庭,主张 OpenAI 非法复制和使用其享有版权的作品,并提出了数十亿美元的损害赔偿。
 
中央网信办于 2023年8月15日正式颁布生效的《生成式人工智能服务管理暂行办法》第七条规定,生成式人工智能服务提供者必须保证用以训练数据的来源合法,且不侵犯他人的知识产权。2024年2月29日,全国信息安全标准化技术委员会发布了《生成式人工智能服务安全基本要求》(TC260),其中 5.2 条要求,生成式人工智能服务提供者不应使用有侵权问题的语料进行训练,其中强调包含文学、艺术、科学作品的,应重点识别著作权侵权问题,此外也涉及了对含有专利、商标、商业秘密和个人信息的语料进行审查的规定。欧盟于2024年3月13日通过了《人工智能法案》(Artificial Intelligence Act),其中规定,通用模型(特别是能够生成文本、图像和其他内容的大型生产模型)需要访问和训练大量文本、图像、视频和其他数据,除非适用相关版权例外和限制,否则任何受版权保护的内容都需要获得相关人的授权。2024年3月21日,联合国大会通过了首个有关人工智能的全球决议草案,该草案由121个国家参与提案,历经三个月的谈判经表决一致通过,其中6.(i) 规定,在利用人工智能造福全人类的过程中,应尊重知识产权,包括受版权保护的内容,同时促进创新。这意味着,一方面,利用大模型训练他人数据可能会使用他人受版权保护的内容,另一方面,联合国也认为应该促进创新,鼓励人工智能系统造福人类。
 
事实上,过多的产权和或滥用垄断权会阻碍创新。[35] 知识产权的垄断本质时刻提醒着我们要将版权视为一杯“半满”的水,以避免在任何情况下都秉持绝对知识产权主义。在 AI数据训练的语境下,立法上应倾向于采取“知识产权最低干涉主义”(IP minimalists)的政策立场。这是因为,在很多情况下著作权法规制的极端性使得任何自由社会在法律上允许广泛的技术创造性变得困难,有时甚至是不可能的。[36] 知识产权制度追求权利人与使用人之间的利益平衡,[37] 而著作权合理使用制度则是平衡著作权保护与公共利益维护的“砝码”。[38] 事实上,AI 数据训练和机器学习对作品的使用并不会影响原作品的正常使用,也不必然会不合理地损害著作权人合法权益,因此也不会打破“天平”(利益)的平衡。正如学者所指出的,“人工智能模型在技术系统中属于底层技术资源、技术效果具有普惠性,所以模型训练过程中对海量作品的使用具有著作权法上的目的正当性”。[39] 在我国著作权合理使用制度的立法模式下,数据训练行为难以构成合理使用,这将导致 GAI 模型训练者面临着极大的侵权风险,甚至会导致整个 GAI 版权产业产生“寒蝉效应”,进而阻碍产业的新质化转型。
 
(三)人工智能算法模型的工具定性分歧
 
在马克思主义政治经济学中,劳动工具是劳动资料的重要组成部分。然而,当下的生成式人工智能快速迭代,其智能程度已经引发了学界和业界对其超越工具性的担忧。如果认为生成式人工智能具有主体地位,则难以将其认定为新型劳动资料,因而生成式人工智能版权产业将面临重大的伦理风险。
 
一项来自“Nature machine intelligence”的研究表明,GAI 目前能够在很大程度上理解人类的情感,其与人类相比,GAI 具有更高程度的共情能力。[40] 有观点指出,人工智能的支持者认为随着算法的进化,人工智能就能“感知”世界,做出逻辑地“类人”判断,成为一种从“照我说的做”到“自己看着办”的自治体系。[41] 有学者提出,人工智能可能具有不同的个性和风格,文章的完成度甚至超越人类,成为独立的写作主体。[42] 另一部分激进的观点认为,人工智能的出现,正是反思“人类中心主义”的契机,[43] 应该承认主体性的媒介性存在方式,与机器、赛博格、人工智能在内的生态圈保持互生关系。[44] 
 
在法学领域,也有不少学者认为应赋予人工智能法律主体地位。例如,有学者认为,AI不再单纯只是传统意义上辅助人类创造的机械工具,它具备独立创造的能力,在创造过程中具有实质性贡献,可将人工智能拟制为法律关系中的权利主体。[45] 也有学者认为赋予 AI 权利主体地位符合权利发展规律,是科技与社会实力提升的结果。[46]
 
按照马克思关于生产力的论述,劳动资料(包括劳动工具)不可能成为主体,其只能归属于被人类作用的对象。如果在生成式人工智能版权领域,将 AI 赋予法律主体地位,那么其工具地位将面临崩塌与解组,产业发展的伦理面向将遭致重创。习近平提出新质生产力的概念,表明人工智能、区块链等新型劳动资料的重要性日益突出,但究其根本,新型劳动工具与传统劳动工具一样都必须具有工具的本性。一旦赋予 AI 法律主体地位,生成式人工智能版权产业将面临重大的伦理障碍。
 
三、因应之策:著作权法对生成式人工智能版权产业发展的保障
 
生成式人工智能版权产业的发展需要上层建筑(主要指法律规范)的支持。就目前而言,生成式人工智能版权产业若想迭代发展,必须解决新型劳动者的版权激励困境、新型劳动对象的版权侵权风险和新型劳动资料的工具定性分歧等问题。
 
(一)人工智能作品的可版权性与权属酌定
 
人工智能作品是否具备可版权性具有极大争议。本文认为,人工智能作品在具备人类独创性贡献的条件下,可以构成著作权法意义上的作品,并且应当将其著作权分配给人工智能作品创作者。
 
人工智能作品可版权性否定说在解释论上一般存在两种理由:(1)认为 AIGC 是基于规则、模板和算法的产物,无法体现人类的贡献和个性;(2)认为人类下达给 AI 的指令仅仅构成“思想”,而不能转化为“表达”,由此违背了版权法“思想 / 表达二分法”的基本要求,不能受到版权保护。本文认为,上述两种反对意见不能成立。
 
1. 并非所有的人工智能作品都无从体现人类的贡献和个性
 
很明显,如果人类只是基于“单回合”的指令下达,命令人工智能生成特定内容,这种内容肯定无法体现充分的人类干预,不具有独创性,无法被评价为著作权法意义上的作品。但是,并非所有的人工智能作品均是通过如此简单的方式生成的。崔国斌认为,“单回合”的暗箱模式很难体现用户的独创性,但“多回合”的线性模式下则很可能体现用户的创造性贡献。[47] 所谓“单回合”即“指令(x0)→输出(y0)”的单一阶段;“多回合”是指“指令(x0)→输出(y0)→指令(x1)→输出(y1)→……指令(xn)→输出(yn)”的连续阶段。本文赞同 AI 使用者基于 x0 所产出的 y0 不具备独创性,但是这并不妨碍使用者基于 y0 继续下达指令,不断修改(指令 x1-xn)该画面的每个局部的构图,在画面的迭代中实现终端输出(表达 y1-yn)。在这个过程中,人类可以将自己的审美和个性灌输给 AI,从而使得最终的人工智能作品具备独创性。
 
国际保护知识产权协会(AIPPI)在 2019年伦敦决议中围绕“人工智能作品在何种情况下享有版权 / 邻接权”的问题进行了讨论。决议将人工智能作品的生成过程划分为三个步骤(steps),并讨论了需要在如上三个步骤中实现何种程度的人类干预(human intervention)才能使得相关客体获得版权保护。因此,在理论上,当人类的创造性干预越多时,人工智能作品中所蕴含的人类个性化特征就越充足。例如,2021 年意大利最高法院对 Chiara Biancheri诉意大利广播电视公司(RAI)数字图像作品侵权的再审案件做出判决,认为引入 AI 并不构成对涉案内容独创性的否定,应该对其进行实质性考察,检验其中是否融入了创作者独特的灵感或原创想法,最终肯定了该内容的可版权性。
 
2. 人类对 AIGC 进行手动编辑和加工可以满足“思想 / 表达二分法”的要求
 
充足的个性化干预并非是产生版权的充分条件。正如第二种反对意见所指出的,即便人类下达了很多指令,但这仅仅是在 AI 最终生成的内容中体现了其“思想”,这不能评价为版权法上的“表达”,由此不能获得版权法保护。全球首例 AI 绘画版权侵权案在北京互联网法院进行了判决。法院认为利用人工智能生成的图片是否体现个性化表达需要进行个案判断,不能一概而论,人类对 AI 模型提出的需求越与他人具有差异性、越具体,则越能体现出作者的个性化表达。[48] 最后,法院具体论证了原告如何将个性化需求融入算法模型,并认定该图片享有作品资格。北京互联网法院判决的可取之处在于其肯定了人工智能作品可以具备人类的个性化贡献;但是该判决也存在着明显的法理缺陷,即回避了对“思想 / 表达二分法”的说理。根据《著作权法》第十一条,著作权属于作者,创作作品的公民是作者。换言之,创作行为是著作权产生的法律事实。此外,《中华人民共和国著作权法实施条例》第三条规定,著作权法所称创作,是指直接产生文学、艺术和科学作品的智力活动。这就意味着,作品的产生具有直接现实性,通过指令的方式间接体现思想、创意很难满足直接现实性的要求。在北京互联网法院的案例中,原告确实通过多次指令将自身的创意体现在了人工智能作品上,但这仍不能评价为“表达”。因此,该案的判决和说理仍待商榷。
 
但是,人类可以通过对 AIGC 进行手动编辑和加工的方法,将作为“思想”的指令转化为最终的“表达”。[49] 在这种解释下,下达指令和后续的编辑与加工可以被视为不可分割的连续性创作行为:“下达指令”可以理解为人工智能模型使用者将个性和创意融入生成内容中;而“编辑”与“加工”是将指令中所蕴含的个性和创意转化为最终表达的过程,使其满足作品创作的直接现实性之要求。正如学者所指出的,“编辑是创作过程中一个被低估但却很重要的最后阶段,在该阶段所付出的创造性甚至足以认定整个产品具有独创性”。例如,法国上诉法院认为,在不受保护的卫星上直接绘制地图所形成的内容有资格获得版权保护,因为它们是通过对颜色、对比度和亮度等要素的转换和改进所得到的结果。[50]
 
综上所述,“版权激励机制”应当作为生成式人工智能版权产业新质化发展中的核心激励机制,而赋权人工智能作品创作者的解释论障碍可以通过“前端指令输入与调整 + 后期编辑与加工”的方式予以解决。
 
(二)AI 数据训练侵权豁免的立法因应
 
生成式人工智能是释放新质生产力的关键技术要素。在人工智能大模型设计过程中,必须对大量享有版权的作品进行数据训练,然而对这些作品单独取得授权会产生大量的市场交易成本,从而抑制生成式人工智能版权产业的市场活力。因此,在立法上是否能对数据训练行为进行侵权豁免是促进生成式人工智能版权产业发展的关键因素。
 
在著作权合理使用的制度安排上,我国《著作权法》采用了三步检验法的立法模式。这虽然在一定程度上维持了法的安定性,但也无法包容人工智能数据训练等新型作品使用行为,难以为生成式人工智能版权产业的发展提供令人满意的法律保障。事实上,从比较法上看,美国、英国、欧盟和日本等国家的著作权合理使用制度具有一定的灵活性,在 AI 数据训练和机器学习上存在一定的适用空间。美国的合理使用(Fair use)规则具有世界性的影响,其在版权法第 107 条确立了“四要素判断法”这一规则,由此建立起了相对宽松的立法模式。在实践中,文本与数据挖掘(或机器学习)是否构成合理使用需要法院在个案中根据四要素判断法进行抽象判断,换言之,美国将该行为的判定放置在了司法过程。欧盟 2019 年《关于数字单一市场版权及相关权的指令》(简称“DSM”)第 4 条为科学研究目的以外的文本与数据挖掘提供了可能性,但同时为权利人预设禁止他人获取的保留权。这意味着在版权人没有明确保留的前提下,允许他人对其公开的作品进行机器学习。此外,英国目前也在考虑采取类似欧盟 DSM 的做法——为版权例外附加退出机制。[51] 而日本则规定了十分宽泛的文本与数据挖掘例外,甚至不排除商业目的的使用。因此日本也被誉为“机器学习和文本与数据挖掘的天堂”。
 
目前,我国著作权合理使用制度在 AI 数主要发达国家,难以支持生成式人工智能版权产业的新质化发展。因此,在生成式人工智能版权产业迭代的过程中,我们有理由考虑将文本与数据挖掘纳入合理使用制度中。事实上,早在 2011 年,最高院就在《关于充分发挥知识产权审判职能作用推动社会主义文化大发展大繁荣和促进经济自主协调发展若干问题的意见》(以下简称《意见》)中指出,在促进技术创新和商业发展确有必要的特殊情形下,法院可以适用四要素判断法以及三步检验法进行考察。这意味着《意见》基于“技术创新和商业发展”的考量,认为应当适当放宽对合理使用的适用空间。然而该《意见》不具有法律渊源的效力,无法直接将其应用于司法裁判之中。目前,已经有许多学者赞同将机器学习纳入合理使用制度中。如林秀芹认为,在人工智能时代,应当将为了 AI 学习、创作使用版权作品纳入合理使用的范围。[52] 徐小奔认为,将人工智能深度学习纳入合理使用不仅与合理使用规则变迁的历史趋势相一致,也符合著作权法激励创新的目的,更有助于人工智能产业的健康发展。[53]
 
值得注意的是,在我国《著作权法》第三次修订期间,国家版权局委托国内三家教学科研机构起草《专家建议稿》,在中南财经政法大学提交的建议稿中曾将“三步检验法”的后两步作为兜底条款,若“其他情形”不超出使用目的的必要范围、不影响著作权人对作品正常使用且不会对著作权人的合法利益造成不合理损害,可以通过兜底条款进行抽象判断。[54] 若我国《著作权法》采用了这种立法模式,将会为 AI 数据训练和机器学习等新型作品使用行为留出适法空间。但遗憾的是,最终公布施行的《著作权法》并没有采纳这一建议。出于立法的稳定性,我国短时间内也不宜对《著作权法》展开第四次修订。目前,我国《著作权法》第24条第1 款第(十三)项是合理使用制度的兜底条款“法律、行政法规规定的其他情形”。本文认为,虽然短时间内无法修改《著作权法》,但是可以在当前正着手修改的《著作权法实施条例》中明确将人工智能机器学习和文本与数据挖掘行为认定为合理使用,这样就可以通过《著作权法》第 24 条的兜底条款予以规制。同时,这种使用也必须满足三步检验法的要求,不得影响作品的正常使用,也不得不合理地损害著作权人的合法利益。由此,通过对《著作权法实施条例》的修改,可以极大程度地促进生成式人工智能版权产业的发展,为其提供法律上的支撑。
 
(三)人工智能法律主体地位的严格否定
 
在生成式人工智能版权产业的构成中,作为新型劳动资料的人工智能算法模型是重要的物质基础。在马克思主义看来,主体和客体具有根本区别,工具只能是客体不能是主体。在法律层面,如果将人工智能拟制为法律主体,将极大地破坏产业的伦理基础。马克思认为,生产工具源自主体的人为创造,并附加主体个人意志,且工具的革新与使用必须依赖主体的代续传递。[55] 从这种观点看,主体(人类)衍生了客体(工具),工具是人类意志的产物。如果将人工智能作为主体,将导致生产力结构中基本要素的颠倒和混同,摧毁马克思劳动工具理论的基本架构。
 
此外,也有学者指出,无论人工智能发展到何种阶段,都只能作为人利用的客体和工具处理。[56] 也有学者结合马克思的劳动理论指出,应坚守人的主体地位,人工智能无非是人类的劳动工具而已。[57] 本文认为,主客体不能置换,人工智能只能作为劳动资料(劳动工具),如果将人工智能作为主体,消灭其工具属性,将有如下弊端:(1)劳动主体将由“人类”的一元结构转变为“人类—人工智能”的二元结构,意味着人工智能将可以成为创作的主体,此时将对人工智能作品的版权配置造成种种障碍;(2)将人工智能拟制为权利主体,将与著作权法激励创作的立法目的相违背,毕竟人工智能无法理解“产权激励”问题——人工智能不会因为“产权激励”而创作出更多有价值的内容,其功能的迭代取决于人类对其算法模型的训练;(3)将人工智能作为主体,与新质生产力理论严重违背,因为劳动资料不可能成为劳动者;劳动者只能是运用人工智能模型进行创作的人类。
 
四、结语
 
“新质生产力”作为推动中国式现代化的关键因素,将为生成式人工智能版权产业的迭代发展提供历史性机遇。当下,应采取各种手段扫清产业发展的法律障碍,为生成式人工智能版权产业的发展提供制度保障。就此而言,应当将符合赋权条件的人工智能生成内容认定为受著作权法保护的作品,并将其权利配置给新型劳动者(人工智能作品创作者),以实现产权激励的目的;此外,应当借本次《著作权法实施条例》修订之机,将人工智能机器学习和文本与数据挖掘行为明确规定为合理使用行为,以此为数据训练者提供侵权豁免,从而促进技术创新和产业发展;最后,必须坚持新型劳动资料的工具定位,拒绝将人工智能拟制为法律主体。通过以上对策,或可有效解决生成式人工智能版权产业发展的主要法律困境,促进传统版权产业的转型升级和高质量发展。希冀生成式人工智能版权产业成为“新质生产力”概念的现代化注脚。
没有了 下一篇下一篇

评论

在线咨询