中文

真理愈辩愈明

点击展开全部

法律宝库

更多 >>

生成式人工智能著作权侵权问题研究

发布时间:2025-03-07 来源:知识产权杂志 作者:祝建军 深圳知识产权法庭
字号: +-
563

内容提要

生成式人工智能是目前人类创新活动的前沿性领域,具有广阔的发展前景。新技术应用往往会带来利益分配和纠纷解决的法律适用难题。在生成式人工智能领域,首当其冲的难题是著作权法适用。面对新问题,理论界与实务界均存在较大争议。立足审判实务,总结生成式人工智能著作权侵权纠纷的中外实践经验和裁判规则,依据著作权法的原理和制度内涵,生成式人工智能大模型训练主要是培育机器具有类似人的智力能力,而非传播作品牟利,故生成式人工智能大模型训练未经许可使用他人作品构成合理使用。人工智能生成内容是机器运行生成的结果,不是自然人智力创作直接产生的成果,不应作为作品受到著作权法保护,否认其可版权性,并不会阻碍人工智能的技术发展和产业应用。人工智能生成内容与他人作品相同或近似构成著作权侵权时,为保护他人作品不受侵害,人工智能服务提供商应尽必要的注意义务。适用著作权法处理生成式人工智能著作权侵权纠纷,既要保护著作权人的合法权益,又要促进人工智能技术的发展,平衡好相关方的利益。

关 键 词

生成式人工智能 大模型训练 合理使用 自然人创作 独创性 注意义务

引 言

进入21世纪,人类进入互联网、大数据与人工智能相互联系又有所区别的人类创新与应用的崭新时代。其中,生成式人工智能(Generative Artificial Intelligence, GenAI)发展最为迅速,尤其体现在自然语言处理领域,该项技术使机器能够理解、解释并生成人类语言,从而催生出强大的计算机应用系统,使机器能够针对人类的各种询问及任务作出与人类相似的反应。在这些系统中ChatGPT作为领先的智能语言应用,为生成式人工智能带来颠覆性改变。ChatGPT是由OpenAI开发的语言应用,能够理解并生成类似人类的反应,以及应对各种问询及任务,具有理解自然语言和文本生成能力。与之同时,各种可以生成文字、图片、语音、视频、音乐等内容的同类人工智能产品涌现,成为各行业争先使用的商业应用工具。有些国家机关也积极使用生成式人工智能技术,如广东省深圳市中级人民法院依托人工智能大模型的逻辑推理和文本生成能力辅助审判系统制作判决书,有效缓解工作强度并提高审判效率。生成式人工智能是人类文明史上翻天覆地的革命,对人类社会的方方面面产生极其深刻的影响。人工智能具有非常广阔的发展前景,已经成为推动全球新一轮产业变革和经济增长新的着力点。据领先研究(Precedence Research)预测,至2030年全球人工智能市场规模将达到近1600亿美元,比2022年底的119.78亿美元有大幅增长。我国高度重视人工智能技术及产业的发展,把发展人工智能提高到国家战略高度。2017年7月国务院发布《新一代人工智能发展规划的通知》(国发〔2017〕35号),明确提出我国人工智能发展的战略目标、部署、组织实施等。2024年6月,工业和信息化部等四部门联合发布《国家人工智能产业综合标准化体系建设指南(2024版)》(工信部联科〔2024〕113号),为加快、加强我国人工智能产业高质量发展制定体系化标准。一系列文件助推了我国人工智能技术及产业的迅猛发展。

人工智能是人类技术的飞跃进步与革新,同时也孕育着巨大的社会风险。英国著名物理科学家霍金认为,“强大的人工智能的崛起要么是人类历史上最好的事,要么是最糟的”“人工智能也有可能是人类文明史的终结,除非我们学会如何避免危险”。从法律调整与规制层面看,在使用生成式人工智能技术研发新产品、提供新服务,从而推动社会发展进步的同时,如何分配由此带来的经济利益以及纠纷解决的救济问题,也紧迫地摆在我们面前。在著作权领域,生成式人工智能系统使用各种算法和大数据训练的大模型可以生成文字、图片、语音、视频、音乐等内容,即生成式人工智能包括大数据输入和内容输出两个方面,由此引发的著作权侵权纠纷已开始呈现,这给著作权法的适用带来了前所未有的挑战。如,生成式人工智能大模型训练未经许可使用他人作品是否构成著作权侵权?人工智能生成内容是否可以作为作品受到著作权法保护?人工智能生成内容与他人作品相同或近似是否构成著作权侵权?面对这些新问题,理论界和实务界都存在较大争议。如何解决这些问题,既保护著作权人的合法权益,又保障人工智能技术及产业的快速发展,平衡各方利益,是目前知识产权领域的重大课题。鉴于此,本文拟对上述问题进行深入研究,以期对生成式人工智能著作权侵权纠纷的裁判和相关立法提供借鉴和参考。

一、生成式人工智能实现的基本原理及市场应用

生成式人工智能是人类意识凝聚的一种反映,人类已实现了将部分意识片段或认知移植给机器,让机器在一定程度上自主地对获得的意识片段进行契合匹配。如,阿尔法围棋(AlphaGo)人工智能程序能战胜人类围棋冠军是借助了海量的人类棋谱大数据作为训练集,在人类棋谱或规则的指引下取得围棋对弈的胜利。微软研究院对GPT-4内部版本研究的结论是:“在所有这些任务中,GPT-4的表现与人类水平接近得惊人。”

生成式人工智能之所以在一定程度上具有人类意识,本质上是人们利用计算机程序、算法、模型和数据等,通过输入大数据进行训练,不断调整变量和优化参数,从而形成机器学习系统,甚至是模仿人类的神经网络学习系统和模型。机器学习系统从大数据中自主地学习,通过大量的文本数据集训练后,可以输出复杂的、类人的内容。数据、算法、算力是生成式人工智能的稳定三要素,要素的质越好、量越大,训练出来的人工智能就越进步、越聪明。

生成式人工智能的研发以数据输入和训练作为重要条件,多样化大数据训练使大模型从短期记忆效应发展到长期记忆效应。大数据输入和训练的质与量,对大模型人工智能的行为及其全局会产生重大影响。一方面,大模型人工智能生成内容越来越快、越来越多、越来越逼真,生成式人工智能的商业模型逐渐显露,人类自身初步创作的生成内容逐渐被边缘化;另一方面,人工智能输出内容的数量越来越大,但质量堪忧,甚至有些平台因人工智能输出内容较多,其知识信息存在大面积被污染甚至虚假的情形。

人工智能连接虚拟和现实,与产业深度融合,不断打破技术边界和思维局限,其生成内容广泛运用于影视动漫、艺术设计、教育培训、广告宣传、软件代码撰写、医疗应用、商标或LOGO设计等商业领域。人们经常利用人工智能生成内容获得创意和灵感,再根据该创意和灵感进行重塑或创作。艺术是根植于人类精神和灵魂的创作表达,人工智能创作并非替代人,而是更好地激发人的创造性,从而为文化产业的发展注入创新活力和动力。

人工智能生成内容正在成为人人皆可拥有的“魔法棒”。如,在百度“文心一格”平台上,只需输入几个关键词,人工智能就可以很快生成风格独特的画作。随着技术的突破,人工智能生成文字、绘画,创作音乐、视频,甚至构建虚拟世界,可能会变得像手机拍照一样简单。人工智能生成内容将开启“人机共创”新模式,创造出有独特价值和独立视角的内容,同时实现成本大幅下降、效率大幅提升。在这种语境下,人工智能生成内容所引发的法律问题或纠纷逐步显现,其中著作权侵权纠纷是人们最关注的问题之一。

二、人工智能训练使用他人作品是否构成合理使用

(一)人工智能训练使用他人作品引发是否构成合理使用的争议

生成式人工智能依赖于大数据、算法和算力,只有对人工智能持续输入大量高质量的数据并运用算法对其进行训练,才能输出优质的内容。从企业视角来看,目前人工智能大模型训练的数据主要来源于以下几种途径:与第三方数据企业签订协议购买数据;利用爬虫技术从公开渠道爬取数据;经过授权向用户采集数据;对志愿者提供的数据进行采集等。如果人工智能研发者在进行大模型训练时未经许可使用他人作品,就可能涉及著作权侵权纠纷问题。

从比较法的视角来看,2023年5月,图库图片提供商Getty Images向英国伦敦高等法院提起诉讼,指控Stability AI研发的一款人工智能绘画工具未经许可使用其网站上的海量图片作为训练数据,构成版权等权利侵权。2023年12月,《纽约时报》在美国纽约南区联邦地区法院提起诉讼,称OpenAI未经许可大量使用其作品训练人工智能模型,构成著作权侵权。2024年10月,《华尔街日报》的母公司道琼斯公司、《纽约邮报》联合在美国纽约南区联邦地区法院向Perplexity提起诉讼,其中一项侵权指控为:Perplexity通过复制两公司的作品训练其研发的大型语言模型,侵犯了两公司的著作权。针对著作权人的起诉,OpenAI、Perplexity等人工智能企业表示不理解,并呼吁内容创作者和所有者应与人工智能企业合作,建立互利共赢的新商业关系。

在国内,2024年1月,广州互联网法院受理上海新创华文化发展有限公司(以下简称新创华公司)与广州年光网络科技有限公司(以下简称年光公司)著作权侵权纠纷案。在该案中,新创华公司指控年光公司提供的Chatstudio AI绘画生成的奥特曼形象侵犯了其美术作品的著作权,要求年光公司将涉案奥特曼语料从其训练数据集中删除。尽管新创华公司在案件审理过程中撤回了该项诉讼请求,但仍说明我国已开始出现涉人工智能训练的著作权侵权纠纷问题。2025年1月,北京爱奇艺科技有限公司向上海市徐汇区人民法院提起诉讼,指控国内人工智能初创企业MiniMax在人工智能模型训练及内容生成流程中涉嫌侵犯其著作权,要求MiniMax停止侵权并赔偿约10万元经济损失。

由上可见,因人工智能大模型训练未经许可使用他人作品引发的著作权侵权问题,已成为亟须解决的难题。我国理论界就如何规制该问题存在很大争议,归纳起来主要包括以下几种观点。

第一种观点认为,人工智能训练对作品的使用属于“非作品性使用”,因此,未经许可使用他人作品不构成著作权侵权。理由是:传统著作权法对作品的使用具有特定性,而人工智能大模型对作品的训练使用属于非特定性使用,因其缺乏独立价值、具有高度可替代性、边际价值低,可以认定为非作品性使用。同时,人工智能大模型对作品的训练使用,其输入内容与输出结果不具有必然关联性。人工智能的后续应用和创新可能性较高,允许后发竞争式创新比由著作权人控制能够产生更大社会福利。

第二种观点认为,人工智能训练对作品的使用属于合理使用,因此,未经许可使用他人作品不存在著作权侵权问题。理由是:大模型训练需要大量数据,当前作品授权许可市场失灵,合理定价困难,交易成本高,作品的许可费和贡献价值缺乏有效计算方式,大模型产生的利益已远远超过著作权领域,很难由市场进行利益分配。大模型为人类的文艺创作提供了新的模式和空间,具有巨大的社会价值。而大模型训练需要海量高质量的数据,在坚持利益适度原则的前提下,大模型训练不会对著作权人的合法权益造成不合理的损害,因此,利用著作权合理使用的“三步检验法”,将大模型训练使用作品扩大解释为合理使用。

第三种观点认为,按照目前我国关于著作权合理使用制度的规定,人工智能训练不构成对作品的合理使用。但考虑到我国作品授权的著作权集体管理制度尚不完善、难以合法使用优质内容将导致生成劣质内容、我国人工智能的发展面临技术落后的风险等因素,基于总体国家安全观的考量,可以通过立法的方式,在《著作权法实施条例》中增设人工智能训练使用作品构成合理使用的权利限制条款,待人工智能企业开始盈利后,再探讨利益分享机制。

第四种观点认为,人工智能训练不构成对作品的合理使用,可以考虑通过集体管理组织授权或法定许可制度给予著作权人适当补偿,从而保证人工智能对作品的训练问题。理由是:作品合理使用通常为非营利性使用,或者像教学、研究、公益性使用等,而人工智能数据训练在很多场合下为营利性使用。人工智能训练使用的数据量很大,同时向全世界提供使用大模型,这已经超出了合理使用的数量限度。有些人工智能使用的数据是利用爬虫或者其他非法手段获取,更谈不上合理使用。人工智能训练使用作品应给予著作权人适当的补偿,从而平衡双方利益。除此之外,还有学者提出建立“有条件共享训练数据池”,以解决人工智能发展的版权之困。

综合以上观点,为促进人工智能技术和产业的发展,我国理论界多主张限制著作权的行使,只是主张限制的方法有所不同。我国文艺界和创作界则普遍反对上述观点,认为目前人工智能技术的研发主要是企业的商业行为,不属于著作权法列举的合理使用情形,也不符合判断是否构成合理使用的“三步检验法”。人工智能生成大量文字、音乐、绘画、视频等,挤占人类创作者作品的传播空间,对著作权及相关文化产业会产生可预见的严重损害。将人工智能利用作品进行训练视为无须经过许可和支付报酬的合理使用行为,是无法容忍的。在现行著作权法框架下,可以通过著作权集体管理组织授权许可解决大模型训练的数据使用问题。

(二)人工智能训练未经许可使用他人作品是否构成合理使用

当前,人工智能技术已成为全球科技创新的重要高地,是提升本国科技、经济和国际竞争力的关键领域。鉴于此,各国均高度重视人工智能技术的研发及产业化应用。一个国家在人工智能领域的落后,意味着在科技创新方面的整体或代际落后。从世界范围来看,基于地缘政治的考虑,美国财政部自2025年1月采取措施限制美国个人及企业投资中国包括人工智能在内的三类先进技术,以防止美国资本和专业技术被用于帮助中国研发人工智能等先进技术。我国人工智能最大的风险在于技术落后,为了促进人工智能技术的发展并突破美国“卡脖子”技术封锁,应大力提供包括法律制度、法治环境在内的各种条件积极发展人工智能技术,并扩大高新技术领域人工智能产业化应用,这也是国家安全和发展的迫切需要。

人工智能大模型训练需要海量高质量的作品作为语料进行“投喂”,成本非常大。我国著作权集体管理制度尚不完善,如果对作品的使用遵循“事先许可谈判、授权付费使用”模式,则意味着人工智能可能会因无法获得足够的优质训练内容而停滞,人工智能技术将面临生存的重大风险。人工智能技术的发展对整个社会具有普惠性,具有获得优先发展的价值和目的上的正当性,因此,为保障人工智能训练有足够数量、高质量的语料,从而输出高质量的内容,应对大模型训练作品著作权的行使进行限制。对大模型训练使用他人作品进行著作权限制可能选择的司法政策或制度依据主要有以下两种。

其一,以支付经济补偿替代停止侵权的司法政策依据。《最高人民法院关于当前经济形势下知识产权审判服务大局若干问题的意见》(法发〔2009〕23号)明确规定,“如果停止有关行为会造成当事人之间的重大利益失衡,或者有悖社会公共利益,或者实际上无法执行,可以根据案件具体情况进行利益衡量,不判决停止行为,而采取更充分的赔偿或者经济补偿等替代性措施了断纠纷”。根据该司法政策,在处理涉人工智能训练未经许可使用他人作品著作权侵权纠纷时,考虑到大模型训练对国家技术创新和社会发展的重大意义,在查明大模型使用他人作品的情况下,针对著作权人要求停止侵权的诉请,可以判决不停止大模型训练使用作品的行为,但应给予著作权人合理的经济补偿。

其二,《著作权法实施条例》第21条规定的“三步检验法”合理使用一般条款的法律规范依据。《著作权法》第24条规定了12种作品合理使用的情形及“法律、行政法规规定的其他情形”的兜底条款。最高人民法院《关于充分发挥知识产权审判职能作用推动社会主义文化大发展大繁荣和促进经济自主协调发展若干问题的意见》(法发〔2011〕18号)第8条指出,“在促进技术创新和商业发展确有必要的特殊情形下,……如果该使用行为既不与作品的正常使用相冲突,也不至于不合理地损害作者的正当利益,可以认定为合理使用”。本文认为,我国《著作权法》第10条赋予著作权人13项财产权的目的是让著作权人控制作品的传播从而维护其经济利益。人工智能大模型训练通常会涉及对作品的复制行为,但该行为处于人工智能技术的研发阶段,且主要作用是训练大模型使其具有类似人的创作能力,而不在于通过传播著作权人的作品牟利。这与《著作权法》设置复制权的目的存在本质区别,故大模型训练使用作品与著作权人行使权利所形成的市场并不构成竞争关系,不会与作品的正常使用发生冲突,也没有不合理地侵害著作权人的合法利益,可以认定人工智能大模型训练使用他人作品构成合理使用。

本文倾向采用第二种制度依据,即人工智能训练未经许可使用他人作品的情形构成合理使用,并建议修改《著作权法》或《著作权法实施条例》,增设“人工智能训练使用他人作品构成合理使用”条款。我国司法实践中已有法院认定大模型训练未经许可使用他人作品构成合理使用。在上海新创华文化发展有限公司与杭州水母智能科技有限公司(以下简称水母公司)侵害著作权及不正当竞争纠纷案中,法院认为,生成式人工智能的创设与发展,需要在输入端引入巨量的训练数据,其中不可避免会使用他人作品。鉴于生成式人工智能在数据训练阶段使用他人作品的目的,原则上应是用于学习分析在先作品所表达的思想感情、语言特征、特色风格等内容,从中提取相应的规则、机构、模式、趋势,便于后续转换性创作新作品。该种使用行为聚合大量作品作为分析样本数据进行提高创作能力训练,并非以再现作品的独创性表达为目的,数据训练及生成过程中也未将在先作品展示给公众,不会影响权利作品的正常使用或者不合理地损害作品著作权人的合法权益,因此,构成合理使用。

值得注意的是,认定人工智能训练使用他人作品构成合理使用,并不意味着人工智能研发者可以自由获得大数据进行训练。因为大数据多由经营平台或数据企业采用技术保护措施进行控制,这些平台或数据企业通过搭建社交媒体平台或者提高流量对广告收益进行分成等经营模式,吸引著作权人将其作品上传到企业经营平台,同时与作品著作权人约定将其著作权和侵权救济的请求权交由企业行使。如此一来,这些平台或数据企业对其平台上的大数据享有财产权益。人工智能研发者若要获得数据进行大模型训练,必须与这些平台或数据企业签订合同并支付相应报酬才能获得大数据的使用权。如果未经许可破解这些平台或数据企业设置的技术保护措施,爬取或获取其平台上的大数据,将有可能构成破解技术保护措施的违法行为而被追究侵权责任。

三、人工智能生成内容是否可以作为作品受到著作权法保护

人工智能技术研发成功并实现产业化后,如果用户使用或购买该人工智能技术服务生成相关内容并公开发布,他人未经许可使用上述用户的人工智能生成内容,用户可否以其作品著作权受到侵害为由追究该行为人的法律责任。处理该问题的前提是弄清楚用户使用人工智能生成的内容是否构成作品,即人工智能生成内容的可版权性问题,这是涉人工智能生成内容著作权侵权纠纷亟须解决的又一难题。

(一)我国法院关于人工智能生成内容可版权性的实务经验

梳理我国法院的相关判决,可以总结人工智能生成内容可版权性的实务经验和裁判规则。在深圳市腾讯计算机系统有限公司(以下简称腾讯公司)与上海盈讯科技有限公司(以下简称盈讯公司)侵害著作权及不正当竞争纠纷案中,腾讯公司自主研发了一套基于大数据和算法的Dreamwriter计算机软件智能写作辅助系统,腾讯公司使用该系统每年可以完成大约30万篇作品。2018年8月20日,腾讯公司使用该系统创作了一篇财经类文章并在腾讯证券网上首次发表,文章末尾注明“本文由腾讯机器人Dreamwriter自动撰写”。2019年5月17日,盈讯公司未经许可在其经营的网站上传播该文章。腾讯公司指控盈讯公司侵害其文章的著作权,要求其承担法律责任。广东省深圳市南山区人民法院认定涉案文章是腾讯公司主持创作的法人作品,应视为该文章的作者,享有该文章的著作权。盈讯公司未经许可在其网站上传播该作品,侵害了腾讯公司对该法人作品所享有的信息网络传播权。盈讯公司网站已删除该作品,法院判决盈讯公司承担著作权侵权的赔偿责任。

在李某某与刘某某侵害作品署名权、信息网络传播权纠纷案中,李某某使用开源软件Stable Diffusion通过输入提示词和参数的方式生成涉案图片,并在小红书平台以“春风送来了温柔”为名发布,同时标注“AI插画”。刘某某未经许可在百家号账号上发表的《三月的爱情,在桃花里》诗歌配图里使用了该图片。李某某指控刘某某侵害了其涉案作品的著作权,要求其承担法律责任。北京互联网法院认为,李某某利用人工智能生成的涉案图片具备作品的独创性要件,李某某为该美术作品的作者,享有该作品的著作权。刘某某未经许可使用李某某作品的行为构成著作权侵权,刘某某已删除该图片,法院判决刘某某在百家号网站上刊登声明、消除影响,并承担赔偿责任。

在林某与杭州高斯气膜技术有限公司(以下简称高斯公司)、常熟市琴宏房地产开发有限公司(以下简称琴宏公司)侵害著作权纠纷案中,林某通过Midjourney软件进行文生图设计,通过输入和修改关键词,生成4张“黄浦江边爱心气球的夜景”图片,随后通过Photoshop软件进行编辑,并将完成的图片重新导入Midjourney软件继续进行设计。经过多次迭代,林某将其中1张图片再次通过Photoshop软件进行编辑,最终形成名为“林晨《伴心》概念装置”图片,在图片左下角标注白色水印“©Visual design from Ai artist Tudou_man, 2023”,进行了作品著作权登记,并在小红书平台发布。高斯公司、琴宏公司在相关网站上传的爱心宣传图片与林某主张权利的《伴心》相同或近似,并承认有实施爱心气球装置实地搭建的行为。江苏省常熟市人民法院认为,林某为《伴心》美术作品的作者及著作权人,高斯公司、琴宏公司使用的涉案图片,在可供对比部分与林某的《伴心》图片构成实质相似。法院认定高斯公司、琴宏公司的行为构成信息网络传播权侵权,但爱心气球实地搭建的行为不构成复制侵权,判决高斯公司承担刊登声明、消除影响的法律责任,高斯公司、琴宏公司连带赔偿林某经济损失及维权合理费用1万元。

以上三个案件的审理法院均认定人工智能生成内容可以作为作品受到著作权法的保护。但在北京菲林律师事务所(以下简称菲林所)与北京百度网讯科技有限公司(以下简称百度公司)侵害署名权、保护作品完整权、信息网络传播权纠纷案中,北京互联网法院认为,文字作品应由自然人创作完成,自然人创作完成是著作权法上作品的必要条件。威科先行库自动生成的涉及对电影娱乐行业的司法分析报告,由软件用户选定关键词,使用可视化功能自动生成,该分析报告并非传递软件开发者的思想感情,亦非传递软件用户的思想感情。因此,软件研发者和软件用户均非该分析报告的作者,分析报告系威科先行库利用软件用户输入的关键词与算法、规则和模板结合而成,某种意义上可以认定威科先行库创作了分析报告。由于分析报告不是自然人创作的,因此,即使该分析报告具有独创性,也不是著作权法意义上的作品。换句话说,人工智能生成内容不可以作为作品受到著作权法的保护。

从上述案例的不同观点可见,司法实践中关于人工智能生成内容的可版权性问题还存在较大争议。

(二)人工智能生成内容在著作权法中如何定性

我国理论界关于人工智能生成内容是否可以作为作品受到著作权法保护亦存在较大争议,主要有两类观点:一类观点认为,人工智能生成内容符合著作权客体的独创性条件,满足该条件,可以认定其为作品并受到著作权法保护。人工智能生成内容是人类智力活动和智力劳动的产物,与自然人从事的智力创作活动成果实质性相同,给予人工智能生成内容以著作权法保护,有利于鼓励和促进人工智能的研发和投入,促进人工智能技术和产业发展。另一类观点认为,人工智能生成的图画、写出的新闻报道或谱出的乐曲,都是应用算法、规则和模板的结果,不能体现创作者独特的个性,亦即人工智能研发者和使用者均不能基于自由意志直接决定人工智能生成的内容,人工智能生成的内容并非由人类以人工智能为工具创作的内容,故人工智能生成内容不能被认定为作品而受到著作权法保护。人工智能产业有自己的经营模式,不给予作品著作权保护,并不会妨碍人工智能的技术进步与产业发展。

从比较法的角度看,2018年,美国计算机科学家斯蒂芬·泰勒(Stephen Thaler)通过其研发的人工智能系统生成了《最近的天堂入口》图画,并向美国版权局申请作品著作权登记,泰勒给美国版权局的留言中记载“该作品是由运行在机器上的计算机算法自动创建的”。2019年,美国版权局拒绝该版权登记,理由是“缺乏支持版权声明所需的人类作者身份”。泰勒不服申请复议,2022年,美国版权局复议认为,美国版权法规定只有人类才能是作者,泰勒的主张与美国一个世纪的判例规则相悖,不应获得支持。泰勒随即向美国哥伦比亚特区联邦地区法院提起诉讼,要求撤销美国版权局不予版权登记的决定。2023年,美国法院依据《版权法》第101条规定的作品的作者必须是人类的规定,驳回了泰勒申请的动议。法官豪厄尔(Beryl Howell)认为,版权法是为了鼓励人类的创作,非人类不存在激励的问题。2022年,杰森·艾伦(Jason Allen)就人工智能生成的《太空歌剧院》图画向美国版权局申请作品著作权登记。艾伦向美国版权局解释,其至少进行了624次修改和文本提示,在后续使用Adobe Photoshop专业图像处理软件进行修改时,还使用Gigapixel AI提高了图像的分辨率和尺寸,使最终内容与人工智能生成内容具有显著区别。美国版权局援引Thaler v. Perlmutteret案指出,作品必须由人类创作,艾伦提交的人工智能生成的图片完全是由技术决定和执行的结果,并没有包含人类的创作性,艾伦只有在排除机器生成的部分后才能获得作品的版权登记。克里斯蒂娜·卡什塔诺娃(Kristina Kashtanova)将利用人工智能软件创作的系列图片放入图画小说《黎明的扎里亚》(Zarya of the Dawn),向美国版权局申请并于2022年获得著作权登记。美国版权局通过社交媒体得知该作品的创作过程使用了人工智能,美国版权局坚持人类才能成为作者的规则,认定卡什塔诺娃采用不可预测的人工智能方式生成图片,不是人控制和引导的工具,她作出的独创性贡献微不足道,最终取消了卡什塔诺娃的作品登记证书,并颁发仅涵盖其创作表达材料的新证书。2025年1月,美国版权局发布的《版权与人工智能第二部分:可版权性》提出如下结论和建议:一是可版权性和人工智能问题可根据现行法律解决,无须修改立法;二是在使用人工智能工具辅助但不代替人类创造的情况下,产出作品的版权保护不受影响;三是即便作品中融入了生成式人工智能的创作元素,版权法依然保护着人类作者在作品中所展现的原创性表达;四是版权保护并不延伸至完全由生成式人工智能创作的内容,或人类对表达元素控制不足的内容;五是人类对生成式人工智能创作的贡献是否足以赋予其作者身份,必须根据具体情况分析;六是根据目前广泛可获得的技术功能,提示性语言本身并不能提供足够的控制力;七是人类作者有权对其生成式人工智能创作中可感知的原创作品,以及对创作内容的创作性作出选择、协调、安排,或对创作结果的创作性修改享有版权;八是目前无须为生成式人工智能创作的内容提供额外的版权保护或特殊保护。由上可见,美国版权法及实践否认人工智能生成内容可以作为作品受到著作权法保护。

本文认为,人工智能生成内容是否可以作为作品受到著作权法保护,仍需要从著作权制度的基本原理和我国《著作权法》的规定分析论证。我国《著作权法》第3条所称的作品是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。可见,《著作权法》要求作品必须是对思想或感情的独创性表达。所谓表达是指必须以文字、语言、符号、声音、动作、色彩等表现形式将无形的思想表现于外部,使他人通过感官感觉其存在。作品的表达通过创作来实现。著作权法所称的创作是指直接产生文学、艺术和科学领域的智力活动。根据著作权法的基本原理,作品作为独创性表达,源于人内在的思想或感情,只有人才能够通过创作行为创作作品表达自己的思想或感情,因此,著作权法规定创作作品的自然人是作者。同时,《著作权法》第11条第3款还规定了特殊情形下的作品,即由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者。此时,法人或者非法人组织被拟制为作者,但特殊情形下的作品本质上仍是由自然人创作完成,只是该自然人因与法人或者非法人组织的职务隶属关系而认定其创作作品的著作权归属于法人或者非法人组织。自然人以外的“主体”不能够创作作品。著作权法的立法目的是保护作者的精神权利和财产权利,通过赋予作者各项权能保障其对作品的使用和控制,使作者能够对他人使用其作品而获取物质利益,从而激励作者创作更多、更好的作品,丰富和满足人类的文化艺术生活。

在人工智能生成内容的表现形式上满足作品构成条件的前提下,即与自然人创作的作品类似的情况下,该人工智能生成内容能否作为作品给予著作权保护的关键在于,其是自然人智力劳动的产物,还是由机器运行生成的结果。前文已述及,人工智能生成内容在本质上是人类利用计算机程序、模型、算法和数据等,通过大模型数据训练形成的机器学习系统,甚至是与人类相类似的神经网络学习系统,一定程度上具有了与人类相类似的智力水平。通过大量文本数据训练,人工智能可以输出较复杂的、类人的内容。由此可见,人工智能生成内容是人类采用“提问、回答”方式或发出任务需求指令,比如通过输入、修改提示词,并不断调整参数,最终选定的比较满意的人工智能输出内容,故人工智能输出内容是机器运行生成的结果。对于同一人工智能模型,在不同时间输入相同的提示词、参数,可能会生成不同的内容。由于各企业“投喂”人工智能大模型的数据不同,使用相同的提示词、参数但输出的人工智能内容亦可能不相同。上述情况进一步说明,人工智能输出内容是机器运行生成的结果,不是自然人智力创作直接产生的成果。根据我国著作权法规定,只有自然人创作的智力成果才能作为作品受到著作权法保护,人工智能生成内容无法作为作品受到著作权法保护。当然,如果自然人在人工智能生成内容的基础上进行了创作,则对其独创性表达的部分享有著作权。

否认人工智能生成内容的可版权性,并不会阻碍人工智能技术的发展及产业应用。人工智能研发者或服务提供商获取经济利益的经营模式主要有两种:一是采用有偿非专有授权方式许可他人使用其人工智能软件,从而获取经济利益;二是在其网站或平台上免费许可他人非专有使用其人工智能软件,通过提高网站或平台的流量以及收取广告服务费获取经济利益。人工智能研发者或服务提供商并不太在意人工智能生成内容的“著作权”归其享有,比如Midiourney人工智能服务协议约定,付费用户享有人工智能生成内容的所有权利,免费用户不享有人工智能生成内容的著作权,但Midiourney采用知识共享许可协议允许用户以非商业使用为限自由使用生成内容。ChatGPT人工智能服务协议约定,人工智能生成内容的所有权利归属于用户,但会提示用户生成内容可能包含他人作品以及用户输入类似提示可能生成同质化内容,以规避侵害他人作品著作权的风险。

四、人工智能生成内容与他人作品相同或近似是否构成著作权侵权

人工智能服务被投放市场后,如果用户使用该人工智能生成内容与他人作品构成相同或实质性近似,那么人工智能研发者、服务提供商或用户是否构成著作权侵权?这是涉及人工智能生成内容著作权侵权的又一问题。

(一)我国法院关于人工智能生成内容构成著作权侵权的实务经验

在上海新创华文化发展有限公司与广州年光网络科技有限公司著作权侵权纠纷案中,新创华公司通过继受方式取得了奥特曼美术作品的著作权,年光公司经营Chatstudio网站,具有人工智能对话及生成绘画功能。Chatstudio AI绘画功能为会员专属服务,因每次生成图片需要消耗算力,会员需充值使用。新创华公司发现,当要求Chatstudio AI生成奥特曼相关图片时,其生成的奥特曼形象与新创华公司享有著作权的奥特曼形象构成实质性近似。新创华公司认为年光公司侵害了其奥特曼美术作品的著作权,向法院提出如下诉讼请求:年光公司立即停止生成奥特曼侵权图片,采取合理措施阻断Chatstudio AI生成与奥特曼作品相同或近似的图片,并赔偿经济损失及维权合理费用30万元。广州互联网法院认定,年光公司的行为侵犯了新创华公司对奥特曼美术作品享有的复制权和改编权(著作权直接侵权),判令年光公司采取相应技术措施防止用户正常使用Chatstudio AI生成侵犯新创华公司奥特曼美术作品著作权的图片,并赔偿新创华公司1万元(含合理开支)。

在上海新创华文化发展有限公司与杭州水母智能科技有限公司侵害著作权及不正当竞争纠纷案中,水母公司通过触手人工智能平台提供基础模型和LoRA模型,支持文生图、图生图、模型在线训练等功能。用户在该平台上可通过上传在其他网站下载的奥特曼图片并使用基础模型训练出奥特曼LoRA模型,训练完成后的奥特曼LoRA模型可被用户反复使用并在此基础上生成其他奥特曼图片并发布在平台上。以奥特曼相关关键词进行搜索,可以在其平台广场上以浏览或下载方式获得涉案5张奥特曼图片及8个奥特曼LoRA模型。新创华公司据此指控水母公司构成著作权侵权及不正当竞争,要求水母公司停止侵权并赔偿经济损失30万元。法院认定,用于数据训练的奥特曼图片由用户上传,LoRA模型的封面图或示例图亦由用户上传,用户利用水母公司提供的人工智能服务生成奥特曼图片和侵权LoRA模型,并由用户在平台发布或分享实现信息网络传播,水母公司作为人工智能服务提供商并未参与上述行为,且在主观上与用户不存在共同提供作品的意思联络,故不构成直接侵权。由于奥特曼美术形象的知名度较高,水母公司将该奥特曼图片和侵权LoRA模型置于其平台能够较为明显感知的位置,应当知道其具有较大侵权可能性。用户生成上传的奥特曼LoRA模型可以被其他用户反复使用,如“布莱泽奥特曼”LoRA模型使用次数已达1000多次,其他用户再叠加该模型后又会不断生成更多侵权内容,侵权内容扩散风险较高,水母公司应对此承担更高注意义务。水母公司应当知道用户利用其生成式人工智能服务侵害涉案作品的信息网络传播权而未采取必要措施,未尽合理注意义务,主观上有过错,构成帮助侵权,但不构成不正当竞争,判令水母公司赔偿新创华公司经济损失及维权合理开支3万元。

从上述案例来看,在用户使用人工智能生成的内容与他人作品构成相同或实质性近似时,不同法院对人工智能服务提供商在什么条件下构成著作权侵权存在不同观点。

(二)人工智能生成内容与他人作品相同或近似如何认定构成著作权侵权

如果著作权人举证证明,用户使用人工智能服务生成的内容与自己的作品相同或实质性近似,且该用户未经许可使用生成内容,则通常可以认定其著作权受到侵害。由于存在人工智能的研发者、服务提供商和用户,此时应如何认定侵权主体?有观点认为,从人工智能的研发者来看,由于研发者进行大模型训练时事先接触和复制了他人作品,为了保护他人作品的著作权,其应负义务避免大模型的输出内容与他人作品相同或实质性近似,亦即研发者应采取必要的技术措施防止用户输入模态指令后所生成的内容与他人作品相同或实质性近似。如果研发者在大模型训练时不事先接触他人作品,无论用户输入何种模态指令,人工智能大概率不太可能输出与他人作品相同或实质性近似的内容。如果人工智能输出内容与他人作品相同或实质性近似,说明研发者极有可能未尽应尽的注意义务,则应承担侵害他人作品著作权的法律责任。在大多数情况下,人工智能服务提供商与研发者属于同一人或者经济利益共同体,此时人工智能服务提供商应负担与研发者相同的义务,如果人工智能服务提供商未履行该义务,亦应承担侵害他人作品著作权的法律责任。有的人工智能服务提供商比较特殊,如其通过与第三方签订合同,进而可以从后者的服务器应用编程接口(application programming interface)调用该第三方的模型,再结合自身需求和应用场景进行深度设计,并在其平台部署人工智能服务,即人工智能套接服务商。如果人工智能服务提供商构成侵权,则人工智能套接服务商基于其身份亦构成侵权,应承担著作权侵权的法律责任。

本文不赞成上述观点,人工智能大模型需要不断“投喂”海量数据或内容,作为研发者或服务提供商自身根本无法接触或识别这些海量内容,尤其无法防范用户采用故意或诱导等方式,利用人工智能生成与他人作品相同或近似的内容。如果让研发者或服务提供商事先承担一般意义上防止侵犯他人著作权的注意义务,即事先负有采取技术措施防止人工智能生成内容与他人作品相同或近似的义务,这对研发者或服务提供商过于苛刻,极有可能会限制或阻碍人工智能技术及产业的发展。为了平衡著作权人与人工智能研发者或服务提供商的利益,建议构建一般情况下的“通知—删除”规则设置研发者或服务提供商保护他人作品著作权的相应义务,以及在特定情形下用户存在明显侵权行为而未尽相应注意义务的过错责任认定规则。

从用户的角度来看,其使用人工智能服务就如同开“黑箱”,在通常情况下只要不是刻意所为或故意诱导,其利用人工智能生成与他人作品相同或近似内容的概率极低。如果用户基于主观过错利用人工智能生成与他人作品相同或近似内容,并未经许可实施受著作权保护的行为,应认定构成著作权侵权,并应承担相应的侵权责任。

为了保护著作权人的合法权益,人工智能服务提供商应承担必要的注意义务:一是潜在风险提示义务,以服务协议的方式提示用户不得侵害他人著作权,否则可能承担相关的法律制裁;二是建立有效投诉机制,在发生著作权侵权行为时,应建立方便著作权人及时、有效的投诉机制;三是阻断义务,在知道著作权侵权时,应采取合理措施阻断侵权行为;四是对人工智能生成内容的显著标记识别义务,如标注“xx由AI生成”,使著作权人能够明确认识到生成内容系由人工智能生成,进而采取有效维权措施。人工智能服务提供商未尽这些注意义务,可能要承担著作权侵权或者相关法律责任。

结 语

生成式人工智能是目前人类创新活动的前沿性领域,在世界范围内具有广阔的发展前景。新技术的发展往往会带来利益分配和纠纷解决的法律适用难题,其中首当其冲的难题是著作权法适用。我国涉人工智能著作权侵权纠纷还刚刚起步,理论界和实务界对相关问题的解决均存在较大争议,还需进一步深入探索并明晰相关规则。

为了妥当处理涉人工智能著作权侵权纠纷案,应立足国际视野,认真聆听著作权人、人工智能高新技术企业、用户等的意见和建议,根据国家发展人工智能技术和产业应用的政策要求,依据著作权法的原理和制度内涵,总结国内外涉人工智能著作权侵权纠纷的理论与实务经验和裁判规则,避免脱离技术、市场和产业实际的“闭门造车”式思维,采用理论联系实际的方法,认真研究破解疑难复杂问题,构建既能较好保护著作权人的合法权益,又能促进人工智能技术和产业发展,平衡好相关方利益的著作权法适用和裁判规则。

没有了 下一篇下一篇

评论

在线咨询