-
专利
-
商标
-
版权
-
商业秘密
-
反不正当竞争
-
植物新品种
-
地理标志
-
集成电路布图设计
-
技术合同
-
传统文化
点击展开全部
律师动态
更多 >>知产速递
更多 >>审判动态
更多 >>案例聚焦
更多 >>法官视点
更多 >>裁判文书
更多 >>摘要
版权制度与作品利用技术的发展密不可分,并随着版权利用技术的创新而不断调整和完善。现代版权制度的核心在于对作品的利用所生之利益以市场的方式进行合理分配,以鼓励作品的创作和传播,促进经济发展和文化繁荣。为了应对科技发展所带来的版权利益分配问题,历史上对作品利用方式所生之利益进行分配的形式主要有四种,分别是:新增作品类型、新增专有性权利、新增获酬性权利以及不给予作者分配利益。在上述四种利益分配形式中,又以新增专有性权利为主。当前,人工智能技术飞速发展,人工智能系统广泛搜集、复制和使用已发表作品并进行处理和加工亦成为行业的普遍实践。人工智能系统对已发表作品的复制及使用与传统的复制、使用行为相比存在本质差别,前者属于新型的作品利用方式。对于人工智能系统使用已发表作品行为的定性,必须立足于这种作品利用方式的特征,从版权制度的目的和经济、科技发展的实际需求出发,才能作出科学、合理的分析。本文在对历史上作品利用方式所生之利益如何分配进行系统梳理的基础上,认为对于人工智能系统使用已发表作品的行为不应再囿于版权侵权与合理使用这种非黑即白、零和博弈的分析和研究路径。当前的科技进步已经发展到支撑版权权利人、作品使用者、消费者等多方实现更高水平合作共赢的临界点,因此,至少有必要在作品使用方式上按照贡献原则对相关当事方的利益进行再平衡,以激励作品的创作和传播,促进科技进步和经济发展。
关键词:作品利用;人工智能;已发表作品;利益分配;贡献原则
版权制度与作品利用技术的发展密不可分,并随着版权利用技术的创新而不断调整和完善。从作品利用方式的历史演进过程来看,现代版权制度的核心在于对作品的利用所生之利益以市场的方式进行合理分配。当前,随着人工智能技术的迅猛发展,人工智能系统广泛搜集、复制和使用已发表作品并进行处理和加工亦成为行业的普遍实践。关于人工智能系统使用已发表作品的法律性质,当前学术界和实务界多有讨论,但是基本上并未脱离版权侵权与合理使用二分法的臼窠。但笔者认为,当代科技进步已经发展到了足以支撑版权权利人、作品使用者、消费者等多方实现更高水平合作共赢的临界点,从版权史角度梳理作品利用所生之利益的分配形式和原则,对于探讨人工智能使用作品等版权问题具有重要镜鉴作用。本文在进行历史回顾和梳理的基础上,提出自己的观点,认为对于人工智能系统使用已发表作品的行为不应再囿于版权侵权与合理使用这种非黑即白、零和博弈的研究和分析路径。在作品利用方式方面,对相关当事方的利益进行再平衡,对于激励作品的创作和传播、促进科技进步和经济发展而言,均具有重要意义。
一、技术创新与作品利用所生利益分配的历史梳理
技术的创新与发展既有可能引起新类型作品的产生,也有可能引起已有类型作品利用方式的产生。无论哪种情况,都会产生新增长的利益,当然,也会致使各利益相关方围绕新增利益而展开争夺。在经过一定时期的实践之后,通常就需要版权法以一定的方式介入,在各方之间合理分配上述新增利益。通过分析技术创新与版权法发展之间的历史关系脉络,可以看出,在版权领域围绕技术创新所带来的新增利益的分配形式主要有以下几种。
(一)在版权法中新增版权客体,并使该版权客体创作者拥有完整的版权权利
版权通常被认为是人们对其作品的一种排他性的专有权利。因此,版权的基础是作品,版权内容围绕作品而生发。版权法的发展史,首先是技术创新导致的作品种类的成长史。世界上第一部现代意义上的版权法是1709年英国的《安娜女王法令》,当时该法规定的版权保护客体只有“图书”。之后,随着技术的发展,特别是电磁技术的发展,人类创作内容的技术手段不断丰富,版权保护客体也不断增加。
比如,随着照相技术的革新和普及,人类利用照相机拍摄的照片越来越多,照片的市场价值越来越大,照片是否属于版权客体的问题就成为一个富有争议的法律问题。在1884年美国沙乐尼与伯罗·贾尔斯平版印刷公司案(Sarony v. Burrow-Giles Lithographic Co.)中,摄影师沙乐尼用照相机拍摄了一幅名为“Oscar Wilde No.18”的照片,该印刷公司未经摄影师沙乐尼许可在出版物中使用了该照片,故摄影师向法院起诉被告版权侵权。该案经美国联邦地区法院和联邦巡回上诉法院审理均认为被告构成版权侵权,但被告抗辩称:照片是原告利用照相机拍摄,照片拍摄仅是一个机械的过程而非艺术创作,原告不能被认为是“作者”,照片也不属于美国宪法版权条款规定的“著作”,所以照片不应获得版权法的保护。该案最终上诉到美国最高法院,美国最高法院在判决中认为:美国宪法版权条款中“著作”的概念应作扩展解释,“著作”应该包括作者所有思想的可见的表达方式,如著述、印刷品、雕刻、蚀刻等形式。同时,法院还认为,虽然普通照片的拍摄过程可能仅是一个简单的机械程序,但该案情况并非如此。在该案中,拍摄者让被拍摄者在镜头前摆出了特殊的姿势,选择并布置了服装、帷幔和其他各种配饰,还设置了优美的背景轮廓,选择了光线和阴影,暗示并唤起了所需的表情,通过这些完全由原告进行的布置、安排或表现,可以认为原告创作出了该案中的照片。故此,美国最高法院判决该案中的照片可以构成版权保护客体,拍摄者可以作为作者获得版权保护。
与照相技术相伴而生的还有录音技术及之后的摄像技术,这些技术的创新和不断发展完善,使版权客体的范围从文字作品、音乐作品扩展到摄影作品和视听作品,相应地,版权主体也由文字作品、音乐作品作者等扩展到摄影师和电影、电视剧制片人等。20世纪中后期,随着计算机技术的发展,在经过激烈的争议之后,计算机软件也被纳入版权保护客体范围。通过版权客体从文字作品、美术作品、音乐作品向摄影作品、视听作品、计算机软件扩展的过程可以看出,每次版权客体的扩张,都是相关当事方重大利益的调整,需要有充分的依据和理由才能做此扩张。
(二)在版权法中新增专有性权利
很多情况下,技术创新不仅会引起版权客体的扩张,也会引起已有版权客体类型利用方式或传播方式的变革,进而引起版权内容的发展变化。例如,摄影技术、录音技术、摄像技术的创新与发展,不仅使版权法增加了摄影作品、视听作品等版权客体;同时也使文字作品有了新的利用方式,如把文字作品拍摄成电影、电视剧。
20世纪初,摄影与摄像技术的成熟以及将文字作品摄制成电影情况不断增多,助推了各国版权法和版权保护国际公约的变革。《保护文学艺术作品伯尔尼公约》(以下简称《伯尔尼公约》)1907年柏林文本,不仅增加了作品的种类,将摄影作品和电影(以及以类似摄制电影的方法获得的作品)纳入其中,还专门为文学艺术作品增加了一项权利,即摄制权。该文本第14条第1款规定,文学、科学或艺术作品的作者享有使用电影方法复制其作品以及以这种方式公开表现其作品的专有权。
随着无线电广播技术的发展,作品利用方式又有了新的增加,即通过无线广播传播作品并使听众欣赏作品。因此,《伯尔尼公约》1928年罗马文本为文学艺术作品作者增加了广播权。该文本第11条之二第1款规定:“文学艺术作品的作者享有授权通过广播向公众传播其作品的专有权。”之后,随着电视广播技术的发展,无线广播不仅能够通过声音传播文学艺术作品,还可以通过图像、声音等方式传播作品,因此,《伯尔尼公约》1948年布鲁塞尔文本特别规定了“以无线传播标志、声音或图像的方式向公众传播作品”也属于作品作者能够控制的行为。
20世纪末,互联网兴起,通过互联网传播作品成为作品利用的一种主要方式。应对互联网版权挑战,国际社会也主要是通过为作者增设专有权利的方式解决此问题。如1996年缔结的《世界知识产权组织版权条约》第8条规定:“文学和艺术作品的作者享有授权通过有线或无线方式向公众传播其作品的专有权,包括向公众提供其作品,使公众可以在自己选定的时间和地点获取这些作品。”我国在2001年修改《著作权法》时,针对作品的互联网利用方式,也专门在该法第十条第一款第(十二)项规定了信息网络传播权。
(三)在版权法中不新增专有性权利但新增获酬性权利
在国际版权公约和各国版权法的发展进程中,除了对作品利用方式或传播方式规定专有权利之外,也可以仅规定作者对作品利用方式的获酬权。
版权制度的一项重要目标是以市场的方式给予作者经济上的回报。仅给予作者就作品利用方式的获酬权,虽然看上去可能不如给予专有权那样更对作者有利,但是也能够实现版权制度的基本价值目标。同时,这种做法也是作者与作品利用方式使用者之间的利益折中之道,在国际版权条约中多有体现。例如,《伯尔尼公约》1928年罗马文本为了应对无线电广播技术的发展,除了在该文本第11条之二第1款为作者规定了广播权这一专有性的权利之外,同时在该文本第11条之二第2款特别规定:“各缔约国国内立法可以对作者的广播权规定限制性条件,但不得损害作者的精神权利,也不得损害作者获得公平报酬的权利。”质言之,该条款允许各缔约国对作品的广播行为仅给予作者获得报酬的权利。
我国《著作权法》第十条第一款第(十一)项虽然规定了广播权,但同时该法第四十六条第二款又规定:“广播电台、电视台播放他人已发表的作品,可以不经著作权人许可,但应当按照规定支付报酬。”这样,在我国就已发表的普通作品而言,作者对作品的广播也是仅享有获酬权。
另外,我国在2020年修改《著作权法》时为录音制品制作者新增了广播获酬权。该法第四十五条规定:“将录音制品用于有线或者无线公开传播,或者通过传送声音的技术设备向公众公开播送的,应当向录音制作者支付报酬。”由此可见,《著作权法》第四十五条为录音制品制作者新增的广播获酬权,也不是专有性权利,而只是一种获酬权。同时,值得注意的是,《著作权法》第四十五条虽然为录音制品制作者新增了广播获酬权,但是并未规定该权利的保护期限。电台、电视台在多长期限内使用录音制品需要向制作者支付报酬、在多长期限之外使用录音制品不需要向制作者支付报酬?由于法律没有规定录音制品广播获酬权的保护期限,故此,对上述问题尚没有明确答案,因此笔者建议,在修改《著作权法实施条例》或下次修改《著作权法》时可对录音制品广播获酬权保护期限问题作出明确规定。
(四)不在版权法中新增权利,由相关利益主体在市场中博弈,根据市场规则进行利益分配
20世纪六七十年代,随着家用录像机快速进入千家万户,电影、电视剧等版权权利人就受到了私人复制行为的直接困扰。如何在版权权利人、家用录像机厂商和使用者之间分配家用录像机所带来的电影、电视剧复制的便利收益,就成为当时一个富有争议的版权话题。
由于索尼公司生产的家用录像机的购买者通过电视广播录制了环球影视公司和迪士尼公司享有版权的节目,环球影视公司和迪士尼公司作为原告于1976年在美国联邦地方法院提起了针对被告索尼公司的诉讼,向法院控告索尼公司售卖的录像机构成版权帮助侵权。在该案的审判中,地方法院作出了有利于被告的判决,然而,上诉法院的判决则主要支持了原告的诉求。当案件进入美国最高法院的审理程序当中时,美国最高法院再次支持了被告的主张,认定被告的行为并没有构成帮助侵权。
美国最高法院在裁判该案件时主要是从合理使用的角度出发讨论该案件,但并没有从根本上解决技术创新与权利保护之间的矛盾。在该案中,持不同意见的法官布莱克曼曾言:“可以认定被告构成帮助侵权,但是可以通过判给损害赔偿金或权利金的方式维持被告的生产与售卖行为,这样,购买者也可以继续使用录像机而不受打搅。”当然,截至目前,世界上大多数国家的版权立法或司法实践对此类行为也持有与美国最高法院索尼案判决的类似观点,即认为此类行为不构成侵权,应由相关利益主体根据市场规则对此类行为所产生的利益加以分配。
二、技术创新与作品利用方式新增利益分配的基本原则
对作品产生的经济利益在各相关主体之间进行合理分配,是版权制度设计的核心问题。通过前述对技术创新与作品利用方式新增利益的分配形式的梳理,可以看出:对于作品产生的经济利益的分配原则正在从以作者为中心的分配原则向以作者和使用者并重、充分考虑新增利益来源与贡献的分配原则转变。
(一)归属作者原则
无论技术如何创新、如何先进,作品都是版权产业经济利益的第一源泉。作品是作者创作的,作者是版权产业经济利益的原始来源。因此,版权制度让作者获取适当比例的作品利用和传播所产生的经济利益,不仅公平正当,而且有利于促进新作品的创作,实现文化产业的可持续发展。
如前文所述,在版权制度发展历史过程中,让作者获取作品利用和传播所产生经济利益的主要方式是赋予作者对其作品利用的专有性权利。作者根据版权法拥有的对作品某些方式利用的专有性权利,如复制权、发行权、广播权、摄制权等,至少在理论上独占了通过这些方式利用作品所获得经济利益。
以图书出版为例,由于作者对其图书享有复制、发行的专有性权利,因此,如果没有作者的许可,出版者就无权出版作者的图书。这样,面对出版者之间的市场竞争,作者就可以依据其复制发行权通过与出版者的谈判,分得出版该图书所产生的经济利益。关于作者从出版者处分得出版图书所获经济利益的份额到底是多少,则主要由作品的市场稀缺程度、出版图书所获经济利益的多寡、出版市场的竞争环境、作者与出版者谈判地位的对比等因素决定。但是,无论如何,作者由于享有对其图书复制、发行的专有性权利,作者就可以不授予出版许可为谈判筹码,要求获得百分之百的图书出版利益。当然,作者依据其图书出版的专有性权利获得百分之百的图书出版利益,仅仅是一种理论上的可能性,而非实践中的普遍情况。实践中,由于作为个人的作者与作为组织的出版者在市场经济地位上的悬殊差距,出版者通常会获得图书出版利益的大部分份额,而作者则只能获得图书出版利益的很少的一部分份额。
也正是考虑到作者在市场经济中的相对“弱小”地位,现代版权制度就作品利用而给予作者的权利绝大部分是专有性权利。如果不给予作者这种专有性权利,作者通常很难在市场经济中通过作品的利用获得经济利益,那么作者所谓的“权利”也就会成为“镜中花,水中月”。所以,虽然法律赋予作者专有性权利看似将作品利用所产生的经济权利全部给予了作者,但还应该看到问题的实质:这种专有性权利仅仅给予作者从作品利用中获得一定经济利益的可能,在某种程度上体现了版权立法与现实的折中和妥协。
(二)作者与作品传播者、使用者并重的贡献原则
版权法赋予作者对作品某种方式利用的专有性权利,就意味着至少在理论上将该种方式利用所产生的经济利益全部给予了作者。版权法之所以如此安排,除了考虑到作者在市场经济中的弱势地位之外,还有一种观点认为,作品是作品利用所产生经济利益的原始来源,作者是作品的创作者,从公平正义的角度出发,作者就应当享有作品利用所产生的全部经济利益。同时,该观点还进一步认为,如果因为技术创新产生了作品新的利用方式,那么就应当如同物权规则那样——由物权客体(物)而生发的新的利益应由物的所有人享有,所以,作者也应拥有因技术创新所产生的作品新的利用方式而新增的全部利益。
笔者认为上述观点值得认真加以分析。首先,需要分析每个要求版权法保护的具体作品与在先作品之间的关系。与发明创造的形成过程类似,作者创作的作品不是凭空而来的,而是“站在巨人的肩膀上”,有意识或无意识地借鉴前人作品的思想和表达的基础上而创作的。虽然受版权法保护的作品要求“独创性”,但此处的“独创性”仅指作品不是复制他人作品而是由作者独自创作并且要求至少有一定创新性。这样,作者独自创作的内容只要与在先的作存在一定的差异,并且这个差异能够在一定程度上体现作者的独立的智力贡献,那么作者创作的内容就可以作为作品受到版权法的保护。有些作品与在先作品的差异有大有小,但无论哪种情况,只要满足上述“独创性”要求,都可以获得版权法的保护。既然受保护的作品都是或多或少地利用或使用在先作品而创作的,那么从这个角度而言,将作品利用所产生的经济利益都给予当前作品的作者,也是不公平、不合理的。
其次,需要分析作品与作品利用所产生的利益之间的关系。作品确实是作品利用所产生利益的源头,但还应看到作品仅是作品利用所产生经济利益的贡献来源的其中之一。在实践中,该经济利益的产生,除了作品这个必要条件之外,还需要有对该作品的加工、传播、宣传、推广等各项工作的支持,如果没有这些支持,作品利用所产生的实际经济利益可能就会微乎其微,甚至就没有实际的经济利益。因此,作品利用所产生的经济利益除了作者的贡献之外,还有作品利用者的贡献,甚至在某些特殊情况下,作品利用者对于上述经济利益产生所做出的贡献可能会大于作者的贡献。所以,从这个角度而言,将作品利用所产生的经济利益全部给予作者,并不公平也不合理。于是,现代版权法越来越重视作者与作品传播者、使用者之间的利益平衡。特别是在作品传播者、使用者对作品新利用方式的新增利益的贡献更大的情形中,国际条约或各国版权法不再仅是一味地授予作者对作品利用的专有权利,而是转向考虑仅给予作者对作品某些利用方式的获酬权;在某些更特殊的情况下,甚至不给予作者获得相关经济利益的权利。
上述立法趋势体现了围绕作品利用所产生经济利益进行分配的新原则,即贡献原则。贡献原则就是根据自然法和财产法原理,谁对作品的利用所产生的经济利益有贡献,谁就应该获得利益。各贡献者获得经济利益的份额,应与各贡献者对作品利用所产生经济利益的贡献程度相当。2020年,中共中央、国务院发布的《中共中央 国务院关于新时代加快完善社会主义市场经济体制的意见》明确提出要“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制。”在分配作品利用方式所新增的利益时,认真权衡作者的创造性劳动、作品使用者的劳动和资本、技术、管理等各方的贡献,并以此为基础对版权制度进行完善,这对优化版权经济资源配置、畅通版权要素流动、促进我国版权经济高质量发展,均具有重要意义。
三、使用费收取技术对版权制度设计的影响
作者创作完成作品后,对该作品进行各种方式的利用,到底能获得多少经济价值?在这些经济价值中,作者贡献的份额是多少?各方作品利用者贡献的份额分别是多少?无论是作者、传播者还是作品的利用者、消费者,甚至是中立的第三方裁决机构,通常都难以对上述问题作出相对合理的回答。也就是说,作品利用所能产生的经济价值难以评估。因此,虽然按照贡献原则对作品利用所产生的经济利益在作者和利用者之间进行分配会更加公平合理,但是,在实践中大多数情况只能通过版权制度给予作者专有性的权利,进而使作者可以凭借其专有权利与作品利用者进行谈判,从而使作者获得其认可的经济回报。
如果作品利用者对于作品特定方式的利用所获得的经济利益可以进行比较准确的计算,而且社会对于作者在该作品特定方式的利用所产生经济利益的贡献份额或比例也有比较一致的观点,那么作者对该作品特定方式的利用所应收取的许可使用费就是该作品特定方式利用所获得的经济利益与作者贡献比例之乘积。在实践中,上述数值(作品特定方式的利用所获得的经济利益以及作者的贡献比例)有时可以比较准确或比较合理地进行计算或确定;但在很多情况下是难以进行比较准确计算或合理确定的。
如果上述数值可以进行比较准确地计算或比较合理地确定,那么对于绝大多数作者而言,无论是给予其专有性权利,还是仅给予其获酬性权利,并没有本质区别。而且如果给予作者的仅是获酬性权利,作品的使用者不必与作者谈判就可以使用该作品;在使用作品后,使用者按照规定的比例从其获得的经济利益中分配给作者即可。另外,考虑到作品获酬性权利可以使作品使用者节省搜索成本和交易谈判成本,进而可以大幅降低作品使用和消费的边际成本,从而进一步扩大作品使用的范围和频率;而作者也可以在作品的广泛和高频使用中获得更多的利益分成。这样就形成了一个围绕作品利用的各方共赢的良性循环。
当然,实现上述良性循环的前提是必须有可信的作品使用收益采集、计算技术或者版权使用费收取技术。否则,版权使用者应该按照什么基准、什么比例向作者支付多少使用费,作者可以收到多少使用费,这些问题就都不会有客观的答案。在这种情况下,如果作者仅有获酬权而没有专有权利作后盾,对于绝大多数处于相对弱小经济地位的作者而言,他们就会很难仅根据法律上的获酬权通过和处于经济强势地位的作品利用者进行谈判,并通过谈判把法律上的获酬权转变为真实的经济利益。这也是在作品使用收益采集计算技术或者版权使用费收取技术成熟、可信之前,各国版权法和版权国际公约仍将专有权作为版权主体内容正当性基础的主要原因。
随着信息网络技术特别是人工智能技术的快速发展,作品的数字化利用越来越普遍,作品利用情况、收益情况的发现和统计的全面性、便捷性、准确性越来越高,发现和统计的成本越来越低,当代版权制度就有必要随着技术创新的发展而作出理性的转变。其实,这种转变的趋势不仅在版权领域有所体现,而且在其他知识产权领域也已有所昭示。如在当前专利领域影响最大的纷争就是手机标准必要专利问题,而手机标准必要专利问题的诉讼争议核心就是专利使用费率标准。当前,标准必要专利纠纷主要内容已经不再是许可使用或不许可使用问题,因为一部手机上使用的标准必要专利就可能有几千、几万、几十万个,所以再讨论是否许可或不许可使用这些专利的问题对于大多数案件而言已经没有实际意义。同时,由于各手机厂商的出货量、售价都是比较透明的,所以标准必要专利使用费率的标准问题就成为核心问题。质言之,当前手机标准必要专利权在实质上已经与获酬权没有显著区别了。同样,在版权领域,特别对于作品利用方式所产生的新增利益的分配而言,在针对作品此种利用方式设计版权相关权利时,就应充分考虑到版权使用费收取技术的发展状况和未来可能,直接根据贡献原则在作者与作品利用者之间对新增利益进行分配。探索人工智能使用已发表作品所产生的相关问题,就可遵循以上的原则。下文将对此进行探讨。
四、人工智能系统使用已发表作品的行为类型化梳理
先来看人工智能系统对已发表作品的使用情形。人工智能系统在开发、运行和商业服务过程中以各种方式使用已发表的作品,既是一个客观事实,也是人工智能产业发展的必要前提。在人工智能使用已发表作品过程中,有相当一部分人工智能使用行为与传统的作品复制、使用行为具有明显而本质的区别,属于新型的作品利用方式;当然,也有一部分人工智能使用行为与传统的作品复制、使用行为没有明显的差异,仍可沿用传统的分析路径对其进行版权分析。因此,有必要对人工智能系统使用已发表作品的行为进行类型化梳理,并根据前述作品利用所生之利益的分配原则对人工智能系统的作品利用方式进行版权分析。目前,人工智能系统使用已发表作品的方式主要有以下几种。
(一)将已发表的作品作为机械学习的素材加以使用
当代人工智能系统的核心及本质在于其具有机械学习能力。人工智能系统主要是通过模拟人类大脑的神经细胞和神经突触等神经网络结构而设计的具有机械学习能力的软件系统。在人工智能系统设计完成并进行初始设置后,人们需要对其进行机械学习训练。机械学习训练的步骤主要有三:其一,搜集、整理人类认为正确的各种输入信息和对应结果的数据库;其二,输入上述某条信息并驱动人工智能系统输出结果;其三,将此输出结果与人们认为正确的对应结果进行对比,如果二者之间差异大于设定的阈值,则由人工智能系统根据一定规则对人工智能系统中的参数或神经网络结构进行微调,并重复执行第二步工作,如果二者之间差异小于设定阈值,就认为对该条信息学习完毕,则在数据库中调取下一条信息,继续从第二步开始进行学习,直至数据库中的信息都学习完毕。
人工智能系统在进行大量数据的机械学习之后,人类再向人工智能系统输入信息并驱动人工智能系统输出的结果就会越来越符合人类的预期。由此可见,为了使人工智能系统更“好用”,就必须搜集、整理尽可能多的经标注的结构化训练数据。当前,各个人工智能系统使用的机械学习训练数据绝大部分来自于互联网已发表的作品或数据;当然,也有相当一部分数据是人工智能系统公司搜集并扫描纸质作品而形成的数据。无论是线上数据,还是线下纸质材料中的数据,有相当一部分是已发表的且尚在版权保护期之内的作品。在人工智能系统将已发表的作品作为机械学习的素材加以使用的过程中,人工智能系统对作品的使用主要涉及三类具体的方式:一是通过网络下载或纸件扫描等方式对作品进行复制,以备机械学习;二是对作品电子复制件进行标注,以适于机械学习;三是将标注好的资料输入机械学习系统进行机械学习。
(二)人工智能系统根据用户的指令生成并输出新的内容
人工智能系统在进行初始的机械学习并通过一定的测试之后,即可投入商业或非商业性的使用。用户在向人工智能系统输入指令之后,人工智能系统即可根据之前已经学习并调整后的参数向用户输出相应的内容。根据人工智能系统输出的内容与已发表作品之间关系,又可以分为四种情况。
第一种情况是人工智能系统输出的内容与已发表的作品相同或实质相似。虽然当前的人工智能系统通常会采取一定的措施,避免输出内容与他人已发表作品相同或实质相似,但由于作品版权归属的复杂性和技术能力、技术实现的可行性等方面的限制,在当前,人工智能系统根据用户指令输出的内容仍然存在与他人已发表作品相同或实质相似的可能性。根据广州互联网法院迪迦奥特曼案判决,在该案中原告是“迪迦奥特曼”形象美术作品的版权独占被许可人,被告是一家人工智能系统服务提供者,向用户提供人工智能图片生成服务。原告在向被告的人工智能系统输入“生成奥特曼”的提示词后,被告系统即输出与“奥特曼”美术作品构成实质相似的图片。在被告收到原告起诉的案件材料后,被告采取了技术措施以避免发生侵权问题。在该案庭审过程中,工作人员在被告人工智能系统中输入保护“奥特曼”的提示词,被告系统就自动弹出“您发送的信息包含不合规的内容”,并且也不会输出图片;但是,如果向被告系统输入“迪迦”,那么被告系统输出的图片仍然与原告奥特曼作品高度相似。由此可见,由于各种条件的限制,确实很难完全避免人工智能系统输出内容与已发表作品相同或实质相似现象的发生。
第二种情况是人工智能系统输出的内容与已发表的作品虽然不相同,但输出内容含有已发表作品的若干片段。人类作者创作作品使用已发表作品的若干片段,可以分为两种情形。一是下意识地、不自觉地使用。人类作者通过学习已发表作品,有可能把该作品的某些内容完全内化到其大脑或思维体系之中,并且,随着时光的流逝,作者有可能会忘却上述内容的原始来源,这样作者在进行独立创作时,就可能把上述内容信手拈来,作为作者自己的内容来使用。二是有意识、自觉地使用。人类作者在完成作品时,为了介绍、叙述、评论、说明或论证等目的,经常会有意识地、自觉地使用他人已发表作品的片段,甚至在某些特殊情况下,会使用到一些短小作品(如诗歌)的全部内容。既然当代人工智能系统主要是在模拟人类大脑神经网络的工作机制,那么人工智能系统输出内容与被学习的已发表作品的片段之间的关系,从理论上而言,似乎也应具有人类作者创造作品与被人类作者学习作品的片段之间的关系;并且在事实上,也确实有很多人工智能系统输出内容包含着被学习的已发表作品的片段,或者在人工智能系统输出内容中可以看到被学习的已发表作品片段的相似内容。当然,由于人工智能系统没有有意识、无意识或自觉、不自觉之说,人工智能系统输出内容包含已发表作品片段的问题,是人工智能系统机械学习的客观结果,至少不能像对待人类作者那样从主观上对上述问题进行评价。
第三种情况是人工智能系统输出的内容与已发表作品虽然不相同,但输出内容与已发表作品的风格存在相似之处。从人工智能技术的科学原理和历史发展来看,当前人工智能系统最擅长的仍然是模式识别和模仿输出。人工智能系统通过大量的、有针对性的机械学习,之后就可以输出与人类行为或成果高度相似的内容。这种相似,不仅体现为表达内容的相似,也可以体现为表达模式、表达风格的相似。由于人们对人工智能系统输出内容版权保护问题的关注度的提升,当前主流的人工智能系统公司已经在采取措施避免输出与已发表作品构成表达实质相似的内容。根据版权法原理,版权保护仅延及到思想的表达,而不保护思想,因此,人工智能系统公司通常并不会限制生成或输出具有与已发表作品相似表达风格的内容。
第四种情况是人工智能系统输出的内容与已发表作品既不相同,也不能从输出内容之中看到任何已发表作品的痕迹。与人类创作的作品类似,人工智能系统某些输出的内容在表达上确实可能看不出任何与已发表作品片段相同或相似的痕迹。人类作者通过学习已有作品,可以创作出与之前被学习作品的表达完全不同的作品,并不意味着人类作者之前所学习的作品对其创作没有任何价值。同样,人工智能系统输出内容与之前机械学习的已发表作品片段不相同、不相似,也并不代表被机械学习的已发表作品对于人工智能系统的上述输出内容没有任何贡献。
(三)将已发表作品用于搜索服务或者其他典型产品化服务,并输出相应的服务成果
由于当前人工智能机械学习能力的大幅提升,人工智能系统利用已发表作品面向市场开发了很多典型的产品化服务。这些典型的产品化服务主要包括自动摘要服务、搜索服务、论文查重服务、科技查新服务、AIGC检测服务、智能辅助写作服务,等等。
自动摘要服务是通过人工智能系统对已发表作品进行分析,提炼出作品的关键信息并形成简明摘要,以使用户能够快速了解和把握作品的主要内容。自动摘要服务涉及人工智能系统对已发表作品全文的分析,明显是对作品的一种新兴利用方式。
搜索服务对于快速查询和定位相关信息及作品至关重要。搜索服务技术的底层逻辑是关键词检索,如何为被搜索的海量作品、电子资料标注准确的关键词以及如何为用户输入的搜索需求设计关键词,均是向用户提供符合其需求的搜索结果的关键。当前主流的大语言模型人工智能技术也正是搜索公司技术专家为了解决上述问题、提升搜索效率而开创的。目前的智能搜索服务或推荐服务,有相当一部分涉及对被搜索作品的全文分析使用。
论文查重服务是人工智能系统将被查重的论文与其数据库里已发表作品进行比对,从而查找出被查重论文中与已发表作品相同或相似的部分,以用于相关学术问题或法律问题的判断。虽然在人工智能技术勃兴之前,市场就已经有论文查重服务,但由于技术的限制,之前论文查重服务的准确性、可用性并不高。广泛引入人工智能技术后,论文查重的质量有了很大改进。虽然之前的论文查重服务也会用到已发表的论文全文,但由于其市场价值较小,故之前论文查重服务使用已发表作品的版权问题并未引起多少关注或讨论;而随着人工智能技术的引用,当前论文查重服务创造的市场价值越来越大,论文查重服务使用已发表作品的版权问题已经越来越引起作品作者的重视。与论文查重服务类似的还有科技查新服务、AIGC检测服务等。
智能辅助写作服务是指人们在创作过程中由人工智能系统根据作者的指令在写作大纲、文章内容、案例资料、文字风格与润色等方面提供咨询服务,以帮助作者完成作品的创作。智能辅助写作服务既可以涉及内容的全新创作,也可以涉及对已有内容的改编或再创作。无论是哪一种智能辅助写作服务,都需要以人工智能对大量的已发表作品的机械学习为基础。
五、人工智能使用已发表作品版权规范完善路径
上述梳理表明,人工智能系统使用已发表作品的行为已经深入到多个领域、多个环节。其中的相关版权问题特别是收益按什么原则分配,就成为一个绕不开的现实话题。笔者认为,面对人工智能技术迅猛发展的新形势,立法和司法机关在完善版权立法或适用版权法解决人工智能系统使用已发表作品的争端时,应充分考虑人工智能系统使用已发表作品的特点,关注版权使用费收取技术的发展趋势和可能,探索保护作者合理利益、促进人工智能技术和版权产业发展的版权规范完善路径。具体而言,主要有以下几点。
(一)宜做增量改革,已有的版权利益平衡不宜轻易变动,要重点围绕人工智能等新兴技术带来的作品利用方式所产生的经济利益进行分配和规范
根据前述分析可以看出,在人工智能系统使用已发表作品的各种方式中,有些属于版权法已有规范的使用方式,有些则属于版权法尚未规范的使用方式。
对于版权法已有明确规范的使用方式,如人工智能系统生成内容与已发表作品相同或实质相似问题,由于立法机关对此类使用方式所产生利益的分配问题在之前已经进行反复权衡,作者、使用者和消费者已经达成共识,因此,在没有特别问题出现的情况下,就没有必要对相关规则进行调整。
对于版权法尚未进行明确规范的作品使用方式,按照版权法定的基本原则,在没有明确法律规范的情况下,就这些方式使用作品的行为,原则上不应向作者分配经济利益。但是,如果上述方式使用作品的行为确实能够产生较高的经济利益,并且可以明确确定已发表的作品对于这些经济利益的产生确实作出重要贡献,那么就应在立法层面根据作品对上述经济利益的贡献程度,对版权权利进行适当扩展。与此同时,在立法之前,司法机关也可根据版权法的原则,参考广播电视技术、互联网技术发展初期的相关实践,考虑给予作者就作品方式的利用以适当的经济回报。
(二)宜跳出专有权利与合理使用二分法的臼窠,考虑直接按照贡献原则对利用方式所新增经济利益在各相关当事人之间进行合理分配
当前,大多数人工智能使用已发表作品版权纠纷的解决方案仍然是秉持专有权利与合理使用二分法的思考路径。在21世纪初美国作家协会起诉谷歌公司一案(Authors Guild v. Google, Inc.)中,谷歌公司对包括原告作家在内的大量图书进行扫描并制作图书索引供其搜索引擎搜索使用。谷歌搜索引擎用户输入检索词后,搜索引擎就会给出包括该检索词的图书列表,以及该检索词在每本书中出现的次数;用户还可以看到包含该检索词或术语的图书片段,当然该片段只有三行;谷歌公司通过技术手段防止用户通过变化检索词或多次搜索的方式看到一部图书关于该检索词的三个以上不同的片段。原告认为被告的行为侵犯了其图书的版权,被告则主张合理使用,不构成版权侵权。最终,美国法院裁判支持了被告合理使用的主张。
美国作家协会起诉谷歌公司案虽然并非人工智能系统使用已发表作品的案件,但是二者之间有很大相似性。因此,当前人工智能系统开始大规模地通过机械学习方式使用已发表作品之后,作品版权人与人工智能系统公司在版权问题上的博弈也基本上采取侵权指控与合理使用抗辩路径。例如,在美国作家协会起诉OpenAI案中,原告主张被告未经许可使用了其享有版权的作品进行机械学习训练侵犯了其版权;而被告则主要利用合理使用等制度进行抗辩。
侵权指控与合理使用抗辩路径虽然是解决传统版权纠纷的常规做法,但是在新的形势下,可能越来越不适宜作品机械学习、人工智能新产品服务等人工智能对作品的利用方式。例如,美国作家协会在其发表的起诉OpenAI新闻稿中就表示:作家的作品应该得到公平的报酬;原告并不反对开发生成式人工智能,但被告应支付合理的许可费来使用受版权保护的作品。由此可见,即使作家协会作为作者的代表,也并非想禁止人工智能系统公司使用已发表作品,而仅是要求获得“公平合理”的报酬。
进一步看,事实上用版权侵权与合理使用二分法的思路来解决人工智能使用已发表作品的纠纷,已经越来越困难。人工智能系统在机械学习过程中使用已发表作品或者人工智能系统在提供搜索服务、论文查重、科技查新等服务过程中使用已发表作品,所使用作品的数量不是一部或几部作品,而是几百万、几千万甚至数以亿计的海量作品。如果版权法对作品的此类使用赋予作者专有性权利,人工智能系统公司如要以上述方式使用这些海量作品,就必须事先一一获得版权人的授权。这种制度设计是否可行?显然是不可行的。因为无论是从成本上来说,还是从现实可行性来说,让人工智能系统公司在机械学习之前就一一获得海量版权人的授权,都是不能做到的;如果法律真的这么要求,那么显然会严重阻碍作为当代经济发展重要引擎的人工智能产业的发展。
与此同时,很多人工智能系统公司通过使用已发表作品确实获得了巨大经济利益,这些作品的使用与上述经济利益之间确实存在直接的联系,并且人工智能系统公司以使用已发表作品为基础提供的服务也确实在一定程度上挤占了人类作者的创作空间和相关市场利益。综合考虑上述各种因素,如果将人工智能使用已发表作品视为合理使用,这样作者就无权从上述人工智能系统使用作品而产生的利益中获得一定的份额;这样的结果显然是不公平的,也不利于作者的可持续创作。
综合以上分析可以看出,对于人工智能需要大规模使用已发表作品进行机械学习并以此为基础提供服务的行为,既不应给予作者对此类作品使用行为的专有控制性权利,也不应不给予作者任何经济回报。对于此类使用,应根据具体情况给予作者获酬性的权利,即作者应有权从此类使用中获得一定的利益分成,但无权禁止此类使用。
(三)宜建立有利于保护作者和促进版权产业、人工智能技术协同发展的作者获酬路径和基础设施,实现文艺创作、技术创新、经济社会的综合可持续发展
版权法赋予作者获酬性质的权利,仅仅是使作者有了从人工智能使用已发表作品过程中获得一定经济利益的可能性,但作者是否可以真正地从中获得经济利益,还需要取决于其他现实条件。由于人工智能需要使用数量庞大的海量作品,人工智能使用作品的情况对于每位作者而言并不透明,这样,作者真正实现其获酬权就必须解决两个现实问题:一是特定人工智能系统在一定时期内应向作者群体支付的使用费总额应是多少;二是每位作者应从上述使用费总额中获得的个人利益是多少。
关于上述第一个问题,可以从以下两个角度考虑。第一,应只对市场上的大型人工智能系统收取作品使用费。当前的人工智能系统千差万别,对所有的人工智能系统都收取作品使用费,既不现实,也无必要。为了促进人工智能技术的创新和人工智能产业的发展,同时考虑到此种人工智能作品使用费是作者传统版权权利的增量,所以,应该只对大型的具有较高营业收入(比如年营业收入1亿元人民币及以上)的人工智能系统收取版权使用费;而营业收入在此之下的人工智能系统则应豁免支付版权使用费。第二,人工智能版权使用费应按照作品使用方式的不同类型分别按照不同的提成比例计算。人工智能使用已发表作品的方式的不同,作品对该使用方式所生经济利益的贡献份额也不同。例如,作品对于机械学习所产生经济利益的贡献份额显然会远小于作品对于论文查重服务、科技查新服务所产生经济利益的贡献份额。因此,按照贡献原则,作品不同使用方式的使用费提成比例就应有所不同。例如,人工智能系统机械学习使用费提成比例可以考虑以该系统年营业收入为基础,在十万分之一到万分之一之间确定;而论文查重服务或科技查新服务的提成比例则可以考虑以该服务年营业收入为基础,在百分之一到百分之十之间确定。
关于上述第二个问题,即每位作者个人应获得利益份额计算问题,应至少考虑两个方面的因素。第一,该作者作品的类型、篇幅、时长等。为了确定每位作者人工智能使用费的具体份额,可以将作品分为文字作品、音乐作品、美术作品和视听作品等几类。文字作品、视听作品又可以根据其篇幅和时长分为若干档。第二,作品被人工智能使用的性质。在人工智能使用已发表作品的各种方式中,有的属于对作品均等性的使用。比如机械学习对作品的使用,这种类型的使用除了与作品的篇幅、时长等有一定的关系之外,与作品的其他要素基本上没有特别关联,即被使用的各个作品对机械学习的贡献基本上是平等的。有的则属于对作品非均等性地使用。比如论文查重服务,人工智能系统除了要将论文与其数据库中的全部作品进行对比之外,还要摘出被论文使用的已发表作品片段;而被论文使用的已发表作品对于论文查重服务的贡献,显然要远远大于那些没有被论文使用的,但被人工智能系统检索的作品。因此,论文查重服务的版权使用费就应分为两部分:一部分给予其数据库中全部作品的作者;另一部分给予被论文使用的那些已发表作品的作者。
由上述人工智能版权使用费的实现路径分析可以看出,计算、收取、分配版权使用费绝不是单个作者或者某个企业能够单独完成的。除了要有科学合理的制度规则之外,还特别需要建立相应的基础设施。该基础设施应全面搜集、登记和存储作者和作品的有关信息,并可在作者同意提供的情况下存储作品的全部数据;该基础设施的主要目的在于:便利人工智能对已发表作品的使用,监测和统计人工智能对已发表作品的使用情况,甚至计算、收取和分配人工智能版权使用费。建立该基础设施需要有作者、版权登记机构、集体管理组织、人工智能公司甚至版权主管部门的共同参与。只有作者、人工智能系统公司、相关使用者和消费者与版权主管部门等各方面多向善意奔赴,才能在人工智能使用已发表作品问题上实现既保护作者合理利益,又促进人工智能创新和经济社会发展的多方合作共赢。
没有了
下一篇
评论