隐木与数据堂不正当竞争纠纷上诉案
一、基本案情
上诉人(一审被告):隐木(上海)科技有限公司(以下简称“隐木公司”)
被上诉人(一审原告):数据堂(北京)科技股份有限公司(以下简称“数据堂公司”)
原审原告数据堂公司系数据堂网站(www.datatang.com)的运营者,同时是涉案1505小时普通话语音数据集(下称“涉案1505小时数据集”)的数据知识产权登记主体。
原审被告隐木公司系格物钛网站(www.graviti.cn)的运营者。
原审原告数据堂公司主张,原审被告隐木公司未经许可,非法获取涉案200小时普通话语音数据集(即涉案1505小时数据集的子集,下称“涉案200小时数据集”)并在其官方网站(www.graviti.cn)向公众传播,并以提供下载服务为方式诱导用户注册会员(简称被诉行为),被告的上述行为违反了诚信原则和公认的商业道德,侵害数据堂公司的数据财产权、著作权和商业秘密,同时构成2019年《反不正当竞争法》第二条规定的不正当竞争行为,应承担相应法律责任。数据堂公司遂向一审法院提出诉讼请求:1、判令隐木公司立即停止侵害数据堂公司合法权益行为,删除涉案数据集;2、判令隐木公司在国家级报刊及隐木公司网站(www.graviti.cn)上赔礼道歉;3、判令隐木公司赔偿数据堂公司经济损失722400元;4、判令隐木公司赔偿数据堂公司公证费2300元。
一审法院经审理后认为,本案在案证据显示,数据堂公司在涉案语音数据的录制过程中投入了相应的人力、财力成本,因此有权基于自己的投入获取相应的经营性收益。一审法院指出,涉案1505小时数据集在内容的选择和编排上不具有独创性,不构成《中华人民共和国著作权法》保护的汇编作品。但是,涉案1505小时数据集是不为相关人员普遍知悉和容易获得,具有现实商业价值,并已由权利主体数据堂公司采取了合理保密措施的商业秘密,可以适用商业秘密相关法律规定予以保护。被告隐木公司作为一家提供数据存储、标注、训练服务的科技公司直接将涉案1505小时数据集的子集涉案200小时数据集作为其“格物钛”官网数据产品的服务内容向网络用户披露并提供下载链接使用,主观上存在过错,客观上减少了数据堂公司的交易机会,属于通过不正当手段获取以及披露、使用他人商业秘密,应当承担相应的法律责任。此外,因涉案侵权行为不涉及人身权利,一审法院对原告主张赔礼道歉的诉讼请求不予支持;又因原告已认可被告网站中已无涉案200小时数据集下载链接,故一审法院对原告停止侵害、删除侵权数据的诉讼请求不予支持。综上,一审法院遂判决:1、自判决生效之日起十日内,隐木公司赔偿数据堂公司经济损失100000元;2、自判决生效之日起十日内,隐木公司赔偿数据堂公司合理维权支出2300元;3、驳回数据堂公司的其他诉讼请求。
本案二审法院判决:驳回上诉,维持原判。
二、案件焦点
综合本案的上诉请求、理由以及双方当事人的诉辩意见,二审法院指出本案的争议焦点为:(一)数据堂公司是否有权基于《民法典》第一百二十七条之规定主张涉案数据财产权益;(二)数据堂公司的涉案数据集是否构成汇编作品;(三)涉案数据集是否构成商业秘密;(四)被诉行为是否违反2019年《反不正当竞争法》第二条之规定;(五)如被诉行为违法,一审判决确定的民事责任是否适当;(六)一审判决是否程序严重违法。
三、裁判要点
(一)关于数据堂公司是否有权基于《民法典》第一百二十七条之规定主张涉案数据财产权益
《民法典》第一百二十七条规定,法律对数据、网络虚拟财产的保护有规定的,依照其规定。法院认为,本案中,涉案数据集通过对原始数据的提炼整合,将原本单一且价值有限的碎片化数据信息通过算法分析处理,可以提升数据的使用价值,具有数据财产权益。从现行法律规定和现实利益两个层面,均可得出涉案数据集具有财产性利益需法律保护的结论。
从数据财产权益的法律保护来看,《民法典》明确了民事主体可享有的财产权益类型,财产不仅包括传统上的物权、债权、知识产权、股权及其他投资性权利,而且包括具有一定经济价值的权利和利益,如数据、网络虚拟财产等。现行法律的财产权益类型可分为以物权、知识产权为代表的绝对财产权、以债权为代表的相对财产权和以有一定影响的商品名称、包装装潢等为代表的其他财产性法益。权利(益)人可以依据相关法律规范直接主张对侵害其绝对财产权的行为提起诉讼,亦可对违反合同约定的行为主张违约责任,还可对损害其财产性法益的行为提起反不正当竞争之诉。
但是,在财产性法益未被法律确认为绝对财产权之前,财产性法益的权益人不得类推适用其他绝对财产权类型寻求司法保护,此为“财产权法定原则”的应有之意。《民法典》第一百二十七条的规定属引致规范和宣示条款,尚未将“数据”作为一种类型化的民事权利(即绝对财产权)而规定其权利内容,在缺乏法律明确赋权的情况下,数据堂公司无权依据民法典第一百二十七条之规定要求将涉案数据集类推绝对财产权请求保护。
综上,数据堂公司主张涉案数据集具有法律保护的合法权益正确,但无权依据《民法典》第一百二十七条之规定类推适用著作权法主张相关权项。
(二)关于涉案数据集是否构成汇编作品
根据《著作权法》第十五条的规定,汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品。
二审法院指出,涉案数据集是在基础语音文件(wav音频文件、metadata文件、txt文本文件)上进行编排而成,但每个单元文件夹中的结构、分布方式、整体布局均相同,其数据集在展示方式及布局编排等方面尚不能体现出独特构思,故涉案数据集在内容的选择和编排上不具有独创性,不构成著作权法保护的汇编作品。一审法院对此认定正确,依法予以支持。
(三)关于涉案数据集是否构成商业秘密
根据2019年《反不正当竞争法》第九条第四款的规定,商业秘密是指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息、经营信息等商业信息。法院强调,“不为公众所知悉”是指有关信息不为其所属领域的相关人员普遍知悉和容易获得,判断主体是所属领域的相关人员,判断的标准是既不能“普遍知悉”,也不能“容易获得”,认定的时间点是“被诉侵权行为发生时”。因此,一旦信息可以通过公共来源容易获得,它就失去了作为商业秘密受到保护的资格。进言之,当商业秘密权利人在网络等其他公共空间公布该信息时,只要所属领域相关人员可以直接获取,该信息就失去了秘密性,不会被认定为商业秘密。
本案中,数据堂公司于2019年7月2日已经在其官方网站面向不特定公众公开披露了涉案200小时数据集的下载渠道和训练方法,即被诉行为发生时(2021年9月15日),涉案200小时数据集已经因数据堂公司的主动公开而丧失秘密性。鉴于被诉行为仅涉及涉案200小时数据集,且该数据集因缺乏秘密性而不构成2019年《反不正当竞争法》第九条规定的商业秘密,故一审法院有关隐木公司侵犯数据堂公司商业秘密的认定是错误的,依法应予纠正。
(四)关于被诉行为是否违反2019年《反不正当竞争法》第二条之规定
法院指出,能够纳入2019年《反不正当竞争法》第二条规制的不正当竞争行为应包括以下要件:一是原被告具有竞争关系;二是原告享有应受反不正当竞争法保护的合法权益;三是被诉行为违反法律和公认的商业道德;四是被诉行为扰乱市场竞争秩序,损害其他经营者或者消费者合法权益;五是被诉行为属于违反2019年《反不正当竞争法》第二章及专利法、商标法、著作权法等规定之外的情形。
本案中,数据堂公司和隐木公司同属数据服务领域的经营者,具有竞争关系,且如前所述,被诉行为不属于知识产权专门法和《反不正当竞争法》第二章规定的情形。在此前提下,二审法院针对其他要件分析如下:
1、关于数据堂公司是否享有应受反不正当竞争法保护的合法权益
法院强调,判断经营者告是否享有受保护的竞争利益,不应抛开被诉行为而泛谈经营者所具有的竞争优势或交易机会,应结合被诉行为对于竞争秩序等的损害来判断。具体而言,可综合经营者实质性投入情况、竞争优势地位、交易机会及由此产生直接经济利益、未来机会利益等因素进行判断。同时,该竞争利益本身不得违反法律的相关规定。
首先,从实际投入与利益看,涉案200小时数据集是涉案1505小时数据集的子集,数据堂公司就涉案数据集取得的《数据知识产权登记证》,可作为证明数据堂公司享有涉案数据集相关财产性利益的初步证据,加之在案证据证明涉案数据集是数据堂公司投入大量人力、物力、技术等经营资源收集并整理,含有大量可用于人工智能模型训练的声音数据条目,满足了人工智能模型研发主体对声音数据的相关需求,能够为其带来交易机会与竞争优势。
其次,从保护方式看,基于《反不正当竞争法》第二条的补充性原则,针对数据集合的保护,如处于公开状态,并对数据内容的选择和编排具有独创性贡献时,优先通过汇编作品保护。反之,如数据集合不为相关领域人员所容易获取,则可适用商业秘密保护。如数据集合处于公开状态且数据内容的选择或编排不具有独创性的,因缺乏知识产权专有权和商业秘密保护的基础,故可视情况通过《反不正当竞争法》第二条进行规制。本案中,虽然数据堂公司通过开源的方式将涉案200小时数据集主动公开,供使用者和其他经营者免费下载,并在遵循涉案CC开源协议规则的情况下使用,但是,若该数据集因被公开而不能得到法律的保护,则竞争对手可以轻松获取和复制数据,这将导致相关企业的投资积极性受抑制并影响数据的流通和利用。因此,虽然涉案数据集已被数据堂公司主动公开,但是数据堂公司仍可对违反涉案CC开源协议规则的行为寻求《反不正当竞争法》第二条规制。对于隐木公司有关涉案数据集已经被公开不应予以保护的上诉理由,二审法院不予支持。
再次,从保护门槛看,数据集合保护本质上是对不具有独创性的数据或事实的集合提供保护,如果保护数据数量的门槛过低,会妨碍公众利用公共领域数据信息创作普通作品,为避免对普通公众的创作和表达自由产生负面影响,且数据规模的扩大增加了数据集合的价值,也增加了社会容忍法律制度负面影响的意愿,因而获得保护的数据集合应当具有实质量的数据条目。同时,数据条目的实质数量应结合数据集合的性质、数据来源、数据集合价值等因素综合判断。涉案200小时数据集是数据堂公司主动收集并整理,含有70余万条可用于人工智能模型训练的声音数据条目,且被众多人工智能模型研发主体所使用,符合公开数据条目应具有实质量的要求。因此,隐木公司有关涉案数据集音频数量过少不应得到保护上诉理由依据不足,不能成立。
最后,从数据集合法性看,涉案数据集的文件信息中不含有被收集人的姓名,录音文件中的声音系被收集人的口语化表达、且均为短句,与涉案数据集的其他信息结合,一般亦无法识别特定自然人。同时,隐木公司亦未提交充分证据证明数据堂公司收集的涉案数据集合具有危害个人信息安全的风险。数据堂公司提交的四批次授权文件可以证明其在涉案数据集收集过程中已取得被收集人的书面同意及授权,且涉案《数据知识产权登记证》可作为涉案数据集收集行为合法的初步证据。据此,可以认定涉案200小时数据集收集行为未违反相关法律的规定。综上,隐木公司的相关上诉主张,缺乏事实和法律依据,法院不予支持。
综上所述,涉案200小时数据集虽然因处于公开状态不符合商业秘密的构成要件,同时因数据内容的选择、编排上不具有独创性而不构成作品,但由于数据堂公司对此付出了技术、资金、人力、物力等的实质性投入合法收集形成了具有实质量的声音数据条目,在原始数据上添附了更多的商业价值,能够满足人工智能模型研发主体对声音数据的需求,可为数据堂公司吸引流量、带来交易机会与竞争优势等商业利益。该种商业利益本质上是一种竞争性权益,应属反不正当竞争法所保护的合法权益。
2、关于被诉行为是否违反了诚信原则和商业道德
法院指出,根据现行法律法规与行业惯例,无论采取何种法律保护方式,在未获得数据集合持有者的许可前,任何人均不得公开传播其付出实质性投入合法收集整理的数据集合。在数据行业中,数据需求方获取、使用开源数据应当遵守开源协议,已成为行业共识。因此,当数据集合持有者对数据集合开源时,数据需求方的获取、使用行为是否遵循开源协议是衡量该行为是否违反数据服务领域商业道德的重要考量因素。
本案中,被诉行为违反了涉案CC开源协议的非商业目的使用规则。该协议规定的“非商业性目的使用”是指该使用的主要意图或者指向并非获取商业优势或金钱报酬。具体而言,隐木公司与数据堂公司均从事向公众提供数据集业务,存在此消彼长的竞争关系。隐木公司的被诉行为会将具有相关数据需求的网络公众变成其具有黏性的网站用户。隐木公司的被诉行为违反了涉案开源协议的非商业目的使用规则。另外,若隐木公司对其使用方式是否属于非商业性使用存在疑义,根据涉案CC开源协议的常见问题答复中的释明,隐木公司亦应当联系数据堂公司确认,而非径行使用。此外,隐木公司未自行进行资源积累、亦未支付对价或获得许可的“不劳而获”行为,实为利用共享数据之名,行不正当竞争之实,有违相关行业的诚信原则和商业道德。隐木公司有关其行为符合商业惯例等上诉理由,缺乏事实和法律依据,不能成立。此外,隐木公司主张其要求注册是履行法律义务,然而其作为数据共享平台并不涉及网络接入、提供信息发布等服务,且数据下载行为也不属于上述服务,故其要求用户注册是为了增加网站用户数量和用户黏性,获取商业优势,法院对该项上诉不予支持。
3、关于被诉行为是否损害了数据堂公司的合法权益、市场竞争秩序及消费者利益
法院指出,数据堂公司依托涉案数据集,获得了用户的关注,并通过其官网开展数据交易,这为数据堂公司直接带来了竞争优势和经济利益。隐木公司实施的被诉行为,使涉案200小时数据集在具有竞争关系的数据共享平台公开传播,一定程度上截取了本属于数据堂公司的用户流量,损害了数据堂公司所享有的合法权益。同时,由于隐木公司提供了涉案200小时数据集的下载服务,数据堂公司无法通过涉案200小时数据集的开源行为获得对数据集合的进一步改进建议,故被诉行为亦影响了数据堂公司的数据服务研发能力。综上,被诉行为损害了数据堂公司的合法权益。
法院进一步解释,市场竞争秩序是否被扰乱取决于市场竞争的各要素结构和运行机制是否被干扰。影响竞争的市场运行机制主要包括准入机制、供求机制、价格机制、信息机制、信用机制和创新机制。如果被诉行为直接影响到上述六种机制作用的正常发挥,则可认定干扰了市场竞争秩序。被诉行为直接影响的是数据服务领域的创新机制。如果允许被诉行为在市场竞争中普遍存在,无疑将导致与数据堂公司情况相近的数据服务经营者无法从市场竞争中获得相应的回报和有效的激励,必然打击数据服务经营者投资收集、加工制作新数据集的积极性,与此同时,却会间接鼓励其他经营者对前者形成的竞争资源径行利用、坐享其成。长此以往,将严重扰乱竞争秩序,降低数据交易市场的丰富程度,损害数据要素市场发展,导致符合社会需求的数据产品和服务供应不足,最终阻碍社会总体福利的提升,损害消费者的长远利益。
综上,隐木公司在未经数据堂公司许可的情况下实施被诉行为,违背了数据服务领域的商业道德,损害了数据堂公司的合法权益及消费者利益,扰乱了数据服务市场竞争秩序,构成了《反不正当竞争法》第二条规定的不正当竞争行为。
(五)关于一审判决确定的经济损失和合理费用数额是否适当
二审法院指出,鉴于数据堂公司因涉案不正当竞争行为所受到的实际损失和隐木公司因侵权所获得的利益难以确定,本案可以综合考量数据堂公司为收集、积累涉案数据集投入的经营成本,涉案数据集许可单价,隐木公司对涉案数据集的使用方式、使用范围和持续时间,涉案数据产品的知名度,隐木公司用户流量增长等因素确定损害赔偿数额。一审判决虽然适用法律错误,但酌情确定隐木公司赔偿数据堂公司经济损失10万元数额适当,对数据堂公司支出的2300元公证费用予以支持亦属正确,二审法院对此均予以维持。
(六)关于一审法院是否严重违反法定程序
数据堂公司在一审庭审时已经提交《数据知识产权登记证》及《电子证据存证回执》作为本案证据,隐木公司亦当庭发表质证意见,故不存在隐木公司上诉主张的其未收到该份证据也未进行质证的情形。对隐木公司的相关上诉理由,二审法院不予支持。
四、案件意义
本案系涉公开数据集不正当竞争典型案例。本案二审法院整合并列明了当下数据集的三种司法保护进路:若数据集处于公开状态,且权利人对数据内容的选择和编排具有独创性贡献时,优先适用汇编作品保护规则;若数据集满足商业秘密构成要件,则可适用商业秘密保护;如果数据集既处于公开状态,数据内容的选择或编排又不具有独创性的,因缺乏知识产权专有权和商业秘密保护的基础,故可视情况通过《反不正当竞争法》第二条进行规制。二审法院特别指出,在人工智能迅猛发展之际,若对公开数据集的不正当竞争行为不加规制,则会使得权利人的流量优势迅速遭到侵夺,进而打击相关主体的创新积极性,扰乱市场竞争秩序,损及消费者权益和社会总体福利。此外,法院确认,数据权利人取得的《数据知识产权登记证》,在诉讼中可以用于初步证明权利人就特定数据产品享有财产性利益。本案判决再次强调,司法评价数字经济时代的数据利用与竞争行为,除了对竞争利益的损害,还应当重点考量其对行业惯例(如开源协议、平台规则、用户协议等)的遵守程度,以及对激励创新和公共利益的影响。
-
上一篇:
-
下一篇:
- 宝可梦诉《口袋妖怪:复刻》侵犯著作权案一审判赔1.07亿
- 快团团糯米福利社恶意攀附“FILA”二审改判赔362万余元
- 江小白诉东方优选不正当竞争
- “立式二次构造柱泵”实用新型专利侵权案二审判决书
- “循环水处理设备”发明专利财产损害赔偿案二审判决书