-
专利
-
商标
-
版权
-
商业秘密
-
反不正当竞争
-
植物新品种
-
地理标志
-
集成电路布图设计
-
技术合同
-
传统文化
律师动态
更多 >>知产速递
更多 >>审判动态
更多 >>案例聚焦
更多 >>法官视点
更多 >>裁判文书
更多 >>摘要
数字经济时代,赋权模式能够激励数据领域的投资与创新。数据权利的行使与保护,不仅关涉原始数据来源者的利益,也关涉到原始数据持有者的利益和数据处理者的利益。所以,数据产权制度的构建需要巧妙地权衡数据保护与利用、集中与流通、数量与质量、私益与公益的关系。数据立法的应然路径是,通过法律确认数据的财产属性与保护范围,明晰数据产权与个人信息权益的并存与依附关系,数据持有者基于其在数据采集存储、保障安全等方面的投资而对数据集合享有支配权和收益权。在数据爬取与挖掘问题上,保护数据主体的相关权益不受侵犯的同时,还需为数据权利的行使设定限制,以保障数据的流动性所产生的价值。在制度构建时,应就公共数据与非公共数据、公开数据与非公开数据、原始数据与衍生数据进行区别对待,设计精细化的默示许可、合理使用和防止权利滥用规则来划定权利边界、促成数据交易并保障公平竞争。
关键词:原始数据;衍生数据;数据产权;数据保护;权利限制
引言
数据是数字经济时代最为重要的资源,海量数据推动数据产业快速发展。《民法典》及司法判决均认可数据具有财产性利益,但我国现行法律尚未明确给予数据专门的赋权保护。面对产业实践中市场主体未经数据持有平台许可而实施的数据爬取和数据挖掘行为,以往的司法实践依赖《反不正当竞争法》第2条“一般条款”进行规制。但是,《反不正当竞争法》作为一部行为规制法,无法像赋权模式那样为权利提供全面的法律保护,也难以从社会公共利益的角度对权利的行使施加必要的法定限制。一般条款的适用仅仅是在欠缺私法上的数据权利保护与行使规则的情况下的权宜之计,司法机关对于第2条中诚实信用和商业道德的把握过于弹性,容易造成裁量标准的不统一。而且,受制于《反不正当竞争法》对竞争关系的存在、经营者主体身份的限定,其适用无法全面覆盖所有数据侵权行为。《反不正当竞争法》中的商业秘密保护路径高度依赖对保密性和非公知性的认定,但对于互联网空间的商业数据而言,数据是否可公开获取,与是否具有保密性是不能划等号的。在竞争者未经许可爬取挖掘他人商业数据时,获取型侵权情况下的举证和使用型侵权情况下的数据比对均存在较大困难。因此,若仅仅以行为规制模式来保护数据权益,存在一定的局限性。因此,理论界出现了为数据赋权的声音。但是,数据的内容纷杂,涉及的利益多元,这使得数据的立法保护需要精细化的规则。立法不仅需要结合数据类型与数据形态进行区别对待,而且需要厘清数据提供者、持有者与使用者之间的权责关系,有鉴于此,本文在数据赋权模式下,以激励数据产出、实现数据价值、保障数据流通、规范数据竞争为目标,分析数据权利的保护与限制,为我国数据领域立法与数据产业发展的法治保障提供参考。
一、数据赋权保护模式的提出
数据是数字化时代的一项重要资产,对其法律保护模式主要有两种思路。第一种是赋权保护模式,第二种是行为规制模式。理论界对这两种模式展开了激烈的讨论,分别论证一种模式的合理性以及另一种模式的弊端。事实上,这两种模式并不冲突,可以并行不悖。因为赋权保护模式与行为规制模式的侧重点不同,前者的背后逻辑是对权利主体劳动所得的法律认可、对数据产生与应用的促进,后者的背后逻辑是对市场秩序的维护。从权利保护的角度,数据产权制度的构建有其必要性,但也需要对于不同类型的数据予以区分对待,避免对数据的过度保护影响到公共利益。
(一)数据赋权模式的正当性
有别于传统的物权客体,数据具有形态无体性、内容杂糅性、权益复合性的特征。尽管在日常商业和经济活动中数据被视为商品,但是,人们对它拥有的实际上的财产权益,与理论上的所有权具有明显差异。[1]《民法典》总则编第127条为“法律对数据、网络虚拟财产的保护有规定的,依照其规定”,这说明法律肯定了数据具有财产属性,属于民法上需要保护的权益,与此同时,排除了“物权编”对于数据、虚拟财产的直接适用,而是应由其他法律来进行专门规定。在现行法之下,对数据的赋权仍停留在学术讨论阶段。理论界存在很多提议,比如数据资源权、准财产权、数据经营权等。这些不同的提议反映出学者们对于数据权的构建路径、客体范围与权利边界存有争议。
回顾过往,法律制度的发展与变革,每一过程的路径选择和规则设计,其法律思维一般都是客观事实分析与主观价值判断的综合。[2]将数据作为一项财产权的客体,其重要性在于对数据领域的投资予以激励。功利主义理论的集大成者边沁认为,财产这个概念存在于一种确定的期望中,存在于根据事物本质可以从所占有的物中取得这样一种好处的信念。这种期望,这种信念,只能是法律的产物。对财产权的法律保护创造了有效地使用资源的激励。[3]当法律赋予人们某种排他性的财产权利时,才会促进人们进行创造、生产和利用资源的动力。从数据的角度,数据资源的实际控制者需要衡量激励措施的创建是否有助于生成新的或更好的数据。[4]从数据的生成过程来看,数据采集、加工和处理环节需要耗费一定的投资。此处的投资,既包括持有者以获取数据为目的而进行的直接投资,也包括其以提供网络服务或其他商业服务为目的而进行的投资。也就是说,数据既可以是投资的直接结果,也可以是投资其他商业模式所产生的附属结果。投资者基于其投资而获得相对于其他人的排他性权利,这符合劳动自然权学说。以平台型企业为例,个人在使用企业的商品或服务过程中,被记录上传存储在企业系统中的数据产权归属企业,符合法经济学的产权赋予规则。[5]产权激励能够对投资给予回报,提高大数据产品开发者的创造积极性,从而使得更多对社会公众有价值的数据得以生成,由此起到激励创新的效果。与数据作为商业秘密进行保护所能实现的对内激励效果相比,数据赋权既能实现对内的激励,也能发挥对整个社会的对外激励效果。所以,在促进数据流动这一价值的实现上具有明显优势。
反对意见认为,赋予数据内容更广泛、更强的专有权并不是为激励数据生产者所必需的,相反,这会建立一种反竞争环境,使数据产品变得更加昂贵,从而损害消费者和整个社会的利益。[6]但是,从当下数据产业的发展现状来看,海量原始数据是数据商业化模式的核心所在。如果对数据权利保护不足,持有数据所需要的技术和经济成本无法得到足够的效益回报。若没有政策的推动与法律的保护,没有经济回报机制对原始数据采集者和衍生数据生产者给予激励,数据生产的驱动力不足。
更为重要的是,数据产权制度能够为数据交易提供法律保障。数据的应用前景十分广阔,数据赋权能够使其在市场上被估价和交易,实现稀缺资源的配置,使得数据产生更大的效用。[7]这从整体效果来看,能够增加社会的总体福利。数据赋权立法能够基于数据特性,系统化地设计数据交易规则,设计权利保护机制与权利限制机制,根据公共政策,在利益天平的两端进行相应的侧重。我国目前的数据市场尚处于发展初期,存在数据不能交易、持有主体不敢交易、数据交易无法可依的情况。在目前企业数据交易市场失灵与既有相关制度失灵的困境下,在现实交易需求与信息自由目标的共同作用下,数据赋权模式具有重要的存在意义。[8]诚然,如果数据权利过于膨胀,个体数据专有权会给其他主体造成负担,抑制数据竞争与创新,侵蚀公有领域。所以,制度在为数据提供法律保护的同时,也需要设置必要的权利限制制度,防止数据领域的集中与垄断现象产生。
(二)私法领域数据立法的核心要务
数据本质上是一种信息集合,表现形态较为多样,与著作权法之下作为汇编作品进行保护的数据库有所不同。根据数据的产生次序和生成机理,可以将其分为原始数据和衍生数据两个层次。第一个层次是采集的基础性的数据集合。以社交媒体平台控制的数据为例,用户头像、昵称、职业、教育、个人标签等注册信息以及网络社交关系和网络行为轨迹,均属于一种原始数据。每个用户在平台上发布的内容,也构成平台上的信息集合。这其中,既有面向全网公开的数据,也有设置了访问限制的数据以及不公开的数据。多数情况下,原始数据无法落入到数据库著作权的保护范围,除非其在数据的选择和编排过程中有独创性。第二个层次是以一定规模的原始数据为基础,在数据挖掘与分析工具的运用之下所产出的衍生数据,属于一种数据产品。衍生数据的生产者就是对原始数据的开发利用者,故又称为数据处理者。从衍生数据的生成机理的角度,其并非对数据信息进行编排和整理,而是数据开发使用者设定算法后自动生成的数据成果,欠缺著作权法保护所需要的独创性,故衍生数据本质上不是汇编作品。
鉴于著作权法难以为所有数据提供法律保护,理论界对于通过完善立法进行数据产权制度构建的具体路径形成了两种观点。第一种观点主张为数据进行单独立法。数据难以融入“物权”“商业秘密”“虚拟财产”任一体系内,基于数据制度设计的规范目的,需要开辟一片新的领域对其予以单独规制和保护。[9]另一种观点则认为可以在知识产权法制度体系之内为数据设定权利,最可行的做法是在著作权法中的邻接权制度中增设一项权利,称谓可以是数据处理者权、数据生产者权或者数据持有者权。从增加数据资产的供给、激励数据处理技术的投资、推动数据的传播和流动等方面,对衍生数据的权利保护契合邻接权制度的宗旨与价值。[10]数据本质上是一种具有可复制性信息,需要通过立法来人为地设定知识支配权的专有性或排他性,这正如其他知识产权客体一样,是为了市场交易之需而给其“人为强制稀缺性”。若能将衍生数据置于业已成熟的知识产权制度体系,立法成本将明显低于专门制定单行法。但是,原始数据却难以纳入数据处理者权的保护范围。从数据规则的体系性与系统性的角度,在一部专门法中规定所有与数据保护有关的法律问题,更稳妥恰当。
事实上,单独立法抑或是在邻接权制度中增设权利,不过是一个立法技术问题。数据赋权问题的复杂性根源于数据之上多元化的利益冲突形态。[11]数据产权制度的根本,是需要厘清数据产权的保护边界,从而解决利益冲突。对于数据赋权模式下的权利客体范围,应当有类型化的思路。对于公共数据与非公共数据、公开数据与非公开数据、与个人信息有关的数据与不涉及个人信息的数据、原始数据与衍生数据进行区分对待,由数据权利的限制规则来调适保护力度强弱。
首先,应当明确数据权利客体的构成要件,将没有财产价值、落入公共领域的数据排除出保护范围。接着,从数据的生成过程是否具有公共属性上看,需要区分公共数据与非公共数据,并设计不同的制度。行政机关在履行行政职能过程中采集的公共数据,权利主体应为国家。[12]但这些数据具有公益性,所以,在其依据《政府信息公开条例》在政府数据开放平台或者通过其他渠道得以公开之后,任何民事主体均可以进行使用。然而对于非公共数据,则需要区分公开数据与非公开数据。单个数据条目的公开不等于数据集合的公开,所以公开的数据应当指的是数据整体处于公之于众的状态。对于非公开的数据,数据持有主体享有数据权利的同时,在该数据满足商业秘密构成要件的情况下,还可以受到《反不正当竞争法》的保护。为了避免数据权利保护与著作权保护存在交叉,需要根据数据生成过程中的独创性有无,将数据库与数据集合进行区分。如果数据在生成过程中包含了信息采集者的独创性的编排整理,那么,则具有构成汇编作品的可能性,不再落入数据权利的保护范畴。
对于非公共数据,还有必要区分原始数据和衍生数据,在权利归属与保护力度上差别对待。原始数据是数据产业链条的起点,为防止数据赋权产生抑制创新的负面效果,需要对原始数据的持有者行使权利设置更多的必要限制,从而为下游市场进行数据开发与利用提供便利。在数据权的权属上,对于原始数据而言,有两种路径选择。以平台与用户的关系为例,用户是原始数据来源者,平台是原始数据持有者。第一种路径是,原始数据的权利属于数据来源者即用户,而平台作为数据持有者享有的是用益权,包括控制、开发、许可、转让四项积极权能和相应的消极防御权能,在公平、合理、非歧视原则下行使各项权能。[13]第二种方案是原始数据的权利属于数据持有者,数据来源者对于与其有关联的数据信息享有获取权和处分权。第二种方案更符合数据与数据内容之间的实质关系。数据权利不等于数据中承载的内容之上的权利,二者彼此独立。数据权利的客体,是将数据集合作为一个整体来看待,由持有者享有权利;但是,数据中的内容之上会存在用户的个人信息权益以及用户对其创作内容的知识产权。对于衍生数据而言,其是运用数据挖掘和算法技术对原始数据进行深度开发、将数据中的个人信息进行脱敏化处理,经过对信息的重新整合后形成具有特定指向性和商业价值的数据,是一种创新成果,毫无疑问应当归属于数据处理者。
二、数据权利保护中的利益平衡
数据权利的行使与保护,不仅关涉原始数据来源者的利益,也关涉到原始数据持有者的利益、数据处理者的利益以及公共数据资源使用者的利益。数据权利不是一种不受限制的垄断性权利。在一定条件下,财产机制会导致权力的集中,容易在行为者之间的权力关系中制造不平衡。[14]正因如此,需要对数据权利的排他性进行必要的立法干预,使其不至于过于膨大以至于损害数据流通原则,从而,通过限制权利来维护各行为者之间的平衡。
(一)数据权利与个人信息权益、知识产权的交织与分立
原始数据来源者,是数据信息的来源主体。在自媒体时代,海量的数据来自于网络用户。从互联网平台型企业的用户的角度,其在数据之上的利益分为两个方面。第一,用户的注册信息、使用平台服务所产生的社交关系与行为数据等关联信息属于用户的个人信息;第二,用户上传至平台之上的内容,也构成了平台所存储和控制的数据。这些内容如果有独创性,则受著作权法的保护。所以,每个原始数据来源者对其生成的个体数据享有法定的权利;平台作为原始数据的持有者,其为数据的存储提供了空间,对数据的存续具有控制力,其数据权利的产生是基于其在数据获取与维护方面的劳动与投资,故对平台存储的所有数据享有整体上的财产权。
在这种权利的交融状态中,个人信息权益、知识产权与数据权利分别具有独立的价值,法律保护模式亦彼此独立。鉴于前两者对应的客体是数据权利客体不可避免的组成部分,平台在进行数据采集和存储时需要征得用户的许可。在数据权利取得维度,注重维护个人对数据使用的知情权与监督权,进而解决数据收集正当性问题。[15]持有用户数据的平台在使用、加工、传输、提供、公开、删除个人信息时,应当依据《个人信息保护法》遵循合法、正当、必要和诚信原则。原始数据持有者对数据的使用不得侵犯用户私权。这就要求其在进行数据利用时,不仅需要事先以注册协议的方式告知用户并获得用户的同意,而且在生成衍生数据时必须对用户信息进行脱敏化处理。侵犯用户个人信息权益的数据不具有可交易性。平台在使用用户享有著作权或邻接权的内容时,除非有法定合理使用事由,否则需要事先通过合理的方式来征得用户的许可。对于用户生成的包含个人信息的数据,平台还负有信息安全保障义务。
从原始数据来源者的角度,其个人信息权益和知识产权构成了对数据持有者权利的有效制约。平台还需要为用户访问、使用和处分其个人信息提供便利。对于网络用户使用平台服务的过程中生成的数据,有必要保障用户获取、访问、迁移和进行有限支配的权利。从域外立法动向来看,欧盟2022年2月提出的“数据法草案”1尝试设计用户对数据的合理访问权,进而实现对数据持有主体依据《欧洲议会和欧盟理事会关于数据库法律保护的指令》所享有的排他性特别权利的限缩。
(二)数据保护需要考察的几组关系
法律是利益的产物,各种法律命令要从生活需要和利益状况出发来进行解释,并根据利益的要求予以补充。[16]对数据的赋权保护,需要考虑其对不同主体间利益的影响以及如何通过制度调试来维系利益平衡。同样强调利益平衡的知识产权制度,既对知识产权人的排他性权利予以充分的保护,又关注对权利的限制。所以,知识产权制度在规则设计上,除了权利保护性规则之外,还包含了大量的促进知识产权传播与运用的规则。对于社会公共利益的共同关照决定了知识产权制度对于数据立法的可参照性。[17]
从数据赋权立法的角度,需要首先把握的是保护数据与利用数据之间的关系。数据产权保护规则所应起到的激励效果,既应当包含对原始数据产出的激励,也应当包含对数据成果加以利用的激励。因此,有必要将激励数据创造与促进数据交易作为两个并重的价值,形成数据生产、交易、利用、创新的促进机制。在数据控制者能够依靠技术手段实现数据事实控制的情况下,建立数据访问和获取制度是促进数据流通、建立数据利用秩序的关键。[18]
对于原始数据持有者而言,其可以使用其控制的数据进行后续开发从而生产衍生数据。衍生数据是对于特定领域有针对性的数据,是独立于原始数据的有用信息。其能够作为企业进行市场分析与评测、产品推广、定位消费者群体的重要参考。比如在“淘宝诉美景”案中,淘宝公司依其与用户的约定享有对原始数据的使用权,经过其智力劳动投入而衍生的数据内容,是与用户信息、原始数据无直接对应关系的独立的衍生数据,可以为网络运营者所实际控制和使用,并带来经济利益,属于无形财产,淘宝公司对此享有独立的财产性权益。2衍生数据生产者与原始数据持有者并非总是同一主体。当衍生数据生产者所欲开发的原始数据是由他人采集、持有和控制时,其应当经许可方能获取数据。衍生数据生产者在数据处理环节投入了技术开发成本和数据获取成本,所以,其对衍生数据享有财产性权利。不同于著作权法意义下在原作品基础上的演绎作品,衍生数据在内容上不以原始数据作为基本表达,因此,衍生数据的权利行使并不以原始数据权利人同意为前提,除非双方有相反的合同约定。
保护数据与利用数据之间的关系,从另一方面讲,是数据集中与数据流动之间的关系。在权利保护与权利运用之间寻求平衡,背后是数据控制所产生的利益与数据流动所产生的利益之间的博弈。数据的流通问题成为对数据进行权利限制的核心考量因素,世界贸易组织以及其他国际和区域论坛对数字贸易和跨境流动进行了持续讨论。[19]立法有必要在加快数据市场化流通、激活数据要素价值等方面发挥对数据要素的规制作用。[20]数据具有内容上的杂糅性、使用目的的多元性以及对用户活跃度的依赖性,因此,为避免数据被大型互联网平台所集中控制产生数据垄断损害公共利益,在保护数据权利人自主经营权的情况下,应以默示许可、合理使用、法定许可等制度来为数据权利行使设定边界。对来源唯一的数据,探索实行法定许可制度;对于政府公共数据,实行开放获取制度。
数据赋权立法还需要关注到数据体量与数据质量的关系。一方面,数据产业的发展有赖于数据体量的庞大。数据样本越多越全面,数据处理所得成果的准确性越高。原始数据的缺失会影响到算法模型的构建,容易产生偏差,形成算法偏见。但另一方面,也要关注数据质量,应当将不具有应用价值的数据、应属于公有领域的数据、在内容与形式上不满足数据构成要件的信息排除在数据权利之外。而且,数据具有易变性的特征,所以,数据的实时更新、真实有效对于衍生数据的生成质量至关重要。为了确保数据的质量和数量,数据持有主体在数据交易中应负有瑕疵担保责任。
最后,数据立法需要注意数据私益性与数据公益性之间的关系。数据赋权是基于数据的私益性,让数据持有者在一定期限内获取正当的商业利益,从而起到激励企业进行数据采集与开发。但是,数据作为数字经济时代一项重要的生产要素,对数据的控制和利用,应当从根本上有助于数据产业发展、增进社会的公共福祉,而不能压缩或挤占公共利益。数据内容具有杂糅性,其中既有其他民事主体享有权利的信息,也有不归属于任何主体的公共资源。尤其对于社交媒体,不同数据持有者所采集的用户数据具有部分重复性和关联性。数据保护的本质是在保护数据集合作为一个整体的价值,所以,数据权利行使所能控制的使用行为,应当有使用体量上的要求。从数据公益性的角度,数据流动所产生的社会效益显然高于数据不公开所产生的价值。清晰的数据产权交易规则能够一定程度上促进数据持有主体以公开来实现权利,而不是“以保密守利益”。此外,对数据产权的保护不得与数据安全、数据隐私以及公众信息获取自由权相冲突。
有观点指出,应为数据权利设定保护期限,在期限届满后,企业数据进入公共领域,其他数据开发使用者可以免费自由使用。[21]但笼统地说,这一做法并不具有可操作性。互联网环境下,数据信息是不断变化和即刻更新的,所以,平台控制的数据内容是无法固定的。即便对于有固定内容的数据以及利用某一个时间节点的原始数据生成衍生数据,立法难以给出一个让各方满意的期限。所以,对于数据权利的保护期限,交由数据交易的合同双方来设定更为合适。法律通过对数据权利客体排除、权利行使限制制度,即可以实现数据私权对公共利益的避让。
三、数据利用者爬取数据行为的合法边界
数据持有主体对其控制的数据享有权利。对于其他市场主体而言,如果要获得数据,则需要获得接入权限。在未获得许可的情况下,通过爬虫技术获取权利人的数据的行为,在产业界被称为是数据爬取行为。行为主体实施爬取行为之后,存在两种情况:第一种是将爬取结果在自己经营和控制的平台上展示;第二种是并不直接展示爬取结果,而是利用爬取的数据进行深度挖掘,从而生成有价值的衍生数据。数据爬取是数据利用的重要方式,是衍生数据生成的前提。因此,界定数据爬取的法律性质是数据保护中的重点问题。
(一)数据持有者对数据的支配权
数据权包含着对数据的收益权与支配权。从收益权来看,数据作为数据持有主体的一项权益,能够为数据持有平台带来更多的用户黏度。在当下的内容为王的网络生态之下,区别于过去平台业务的单项性,当下更多网络平台趋于业务综合性,平台内的服务多元互通。很多平台采取的是用一种免费的业务去吸引用户,用其他的收费业务来产生经济回报。所以,数据持有主体就其数据所获得的收益,具有非直接性。而且,平台搜集、存储、积累后形成海量数据,成为其提供平台服务及开发衍生产品的重要基础,该些数据整体能够为平台带来商业价值及竞争优势,应予以保护。因此,平台经营者对其平台上的数据从整体上享有权益。当其他市场主体试图利用这一平台上的数据来开展经营活动时,必需以数据持有者的知情和同意为前提。若允许其他市场主体可不经数据持有者授权即可使用,那么可能会破坏数据采集过程中业已形成的激励机制。若衍生数据生产者未经许可、故意且直接从数据主体处收集、获取原始数据,或者超出授权范围从原数据控制者处收集、整理数据,在客观上已经对他人数据权益造成侵害,应当由衍生数据生产者对这一行为承担责任。
从支配权来看,虽然数据持有主体对数据进行了事实上的控制,但这种支配存在一定的不稳定性。这是因为数据本身具有可识别性与流动性,存在于网络空间的数据,很容易被数据技术工具所识别出来。数据作为一种信息,信息流动过程中的易复制性使数据持有主体对数据的支配存在难度。就网络平台而言,即便平台一方作为数据持有主体,能够通过一些技术措施来限制其他市场主体对其平台内容的复制,但这些措施可被规避,数据爬取行为难以被技术手段有效约束。在一起案件中,法院指出:“对于涉案数据中的公开部分,正常情况下,微博用户可随时选择修改或删除相关数据,运营微博的平台基于其与用户之间的协议亦应维护用户处理其数据之权利;但第三方抓取和展示涉案数据的行为会使这部分数据脱离用户自身和平台的控制,减损其处理数据的权利。”3
在互联网行业,网站通过内置robots协议,又称为爬虫协议,来宣示其哪些页面和内容允许被抓取,这一做法是行业通行的惯例。robots协议本质上是一种存放于网站根目录下的 ASCII 编码的文本文件。网站运营者通过设置robots协议,向那些使用网络爬虫机器人访问网站的市场经营者告知该网站是否准许爬虫访问、准许哪些爬虫访问、访问的范围如何。对于数据持有主体而言,设置robots协议是其对数据的支配,是一种对其他市场经营者的宣示,是一种对数据的自力控制。在以往的司法案例中,围绕数据保护已产生了一些规则。在“新浪”诉“脉脉”案中,法院认定,第三方手机应用软件通过开放平台获取用户信息时,应坚持“用户授权”+“平台授权”+“用户授权”的三重授权原则。4在“酷米客”诉“车来了”案中,法院认定“酷米客”手机应用软件后台服务器存储的公交实时类信息数据具有实用性,能够为权利人带来现实或将来的经济利益,具备无形财产的属性。“酷米客” 作为手机移动应用软件著作权人,对该软件所包含的信息数据的占有、使用、收益及处分享有合法权益。5
(二)“互联互通”与禁止数据权利滥用
网络空间中的数据,大多具有公开性。公开的数据可自由被访问,并不意味着数据持有者同意他人能够以违背其意愿的方式进行访问。所以,如果互联网平台采取了robots协议、白名单等机制来对数据访问设定条件,那么,市场竞争者应对这一公认的商业惯常做法予以尊重。如果某一数据持有主体设置的robots协议不具有合理性,那么,则适用合同法、反垄断法进行评价。基于互联网的互联互通和共享开放的性质、搜索引擎的信息检索功能以及对公众获取信息的便捷性的保障,数据持有主体设置robots协议限制搜索引擎进行数据抓取,需要经过更加严格的合理性考察,应当具备合理正当的理由。但是,对于非搜索引擎的应用场景,数据持有主体采取技术手段或者设置robots协议来禁止未经其许可的数据爬取,这既是其数据权利的应然之义,也是其行使自主经营权的表现。相反,如果数据控制者并未对他人获取其平台上的公开数据施加以技术上的限制或者禁止使用的宣示,那么,应当视为其默示许可他人使用其数据。
诚然,数据的“互联互通”对于数据经济发展与产业良性竞争至关重要,有利于最大化实现数据价值,提高数据的可用性。但是,从现行法律层面,“互联互通”并非是商业性平台企业的法定义务。企业商业数据的互联互通是以平台企业间合作为前提,是以尊重数据产权、认可数据流通是一种交易行为作为前提。数据互联互通并不等于数据交换、不等于自由获取其他平台的商业数据,数据共享不是强制无偿共享。所以,数据互联互通还需要通过市场公平交易、主体间平等交换等方式达成。从数据产权制度的构建角度,有必要禁止数据权利的滥用,规定特殊情形下的数据强制许可使用规则。倒逼数据持有主体对外进行数据许可,推动平台企业间的合作,形成数据兼容开放的生态圈。
四、数据挖掘情况下的合理使用
大数据时代,原始数据是进行统计分析工作的基础要素。数据处理是数据采集之后的第二个步骤。无论是经数据持有者授权获得原始数据,还是未经授权采取技术手段获得原始数据,数据处理者对数据进行挖掘,是需要被独立进行法律评价的行为。在著作权法领域,欧洲一些国家将“文本与数据挖掘”作为一种合理使用作品的行为,不侵犯被挖掘的作品的著作权。与此相类比,在数据产权制度中,是否应当设立数据挖掘例外条款作为一种对数据持有人权利的限制,则需要考虑数据挖掘对不同主体间利益的影响以及设置什么样的适用条件。
(一)数据挖掘作为一种侵权例外
从计算机技术的角度,文本与数据挖掘是运用算法从海量的数据中提取知识信息的一种技术活动,在存储数据的基础上,进行数据清洗、计算、分析后,生成新的结果。为论述的便利,本文将这一系列行为统称为数据挖掘行为。数据挖掘能够结合人工智能和机器学习等技术,通过对海量基础数据的复制、撷取以及整合对文本内容进行深度开发与分析,构建可识别的模型,形成具有独立价值的衍生数据。数据挖掘作为大数据时代深度利用数据的一种手段,与传统的数据分析法相比,具有准确性、智能化和高效率的特点,显著提升了对原始数据的使用效率。
从数据挖掘侵权例外设立的必要性的角度,伴随着互联网产业的繁荣,我国数据产业发展迅猛。与此同时,我国人工智能产业处于起步的关键阶段。从最有利于数据开发利用与人工智能应用创新的角度,设置数据挖掘例外条款能够为数据处理者“松绑”,发挥原始数据的效用,开展数据领域的创新。从数据挖掘所涉及主体的利益角度,虽然原始数据会包含个人信息,但数据持有主体或者第三方是对数据进行脱敏处理之后进行开发利用,一般不会损害其合法利益。原始数据中也会包含他人享有著作权的作品,但文本挖掘对作品的使用仅存在于衍生数据生成前的采集与处理阶段,产生的结果不是简单地重复此前已有的作品,也不是以既有作品中的基本表达为基础的创作,而是在不影响既有数据价值的同时开拓其增值价值,故是对作品的一种转换性的使用,这种使用行为并没有干涉到作者对其自身的思想表达的公开传播。[22]一般不会损害作品创作者的合法利益,也不会对作品的正常使用产生负面影响。从原始数据持有者的角度来看,一方面,其掌握着大量的用户生成数据,由其实施数据挖掘具有天然优势;另一方面,在其与第三方进行数据交易时,数据能够以何种方式被第三方所用应当由合同进行明确约定,利用方式一定程度上决定了交易价格。因此,需要必要的立法干预来调整数据许可关系中双方的地位差距,避免数据交易中的不公平现象以及阻碍对数据的公益性使用。作为大数据时代深度利用数据的一种手段,数据挖掘能够起到加快知识发现进程的作用,在法定条件下,将其作为数据权利的例外情形,有利于原始数据的价值转化。
(二)数据合理使用的前提
为了发挥数据挖掘对于数据产业发展的推动作用,同时兼顾到对原始数据持有主体权利的保护,我国有必要区分非商业性的实施主体与商业性的实施主体。前者实施的数据挖掘行为,是“绝对的例外”,数据持有人不可以通过在先声明予以禁止;后者实施的数据挖掘行为,是“相对的例外”,即允许其对合法获取的数据进行挖掘,但原始数据持有者在数据交易合同中明确约定或者公开声明禁止挖掘的除外。该声明应当为数据挖掘实施过程中具有平均行业水平的技术能够识别出的声明,即以“机器可读”的方式。而且,在先声明的正当性与否,应当接受反垄断法和合同法的考验。综上,对于科学研究目的的数据挖掘,数据持有主体的禁止挖掘声明应属无效,同时,也允许避开原始数据持有主体所使用的数据技术保护措施,但是科学研究目的之外的数据挖掘,则应当尊重原始数据持有主体的声明。
对原始数据的合法获取是数据处理者实施数据挖掘行为的前提。如果原始数据的获取来源不合法,那么,该获取行为本身就具有可责性,随后的对数据的利用行为就不具备合法基础。不过,有必要注意到在网络空间中存在着大量的不归属于任何主体或者难以确定权利归属的数据。基于数据挖掘对海量基础数据的需求,要求其在获取数据环节与大量权利主体进行许可谈判,不仅耗费大量的时间和精力,还提高了数据挖掘的交易成本。比较折衷的方式是,将数据挖掘所使用的基础数据,限定为通过合法渠道或者从公开渠道合法取得的数据,也就是说,第一种情形是通过付费、订阅、合作等方式获得数据资源的访问权限进而有权抓取、采集、存储的数据;第二种情形是从公开渠道获取的,无法确定权利归属的、原始数据来源者及持有者默示许可他人进行利用的数据。另外,为平衡原始数据持有者与衍生数据生产者之间的利益,有必要要求数据挖掘所呈现出来的衍生数据结果应当具有有别于被挖掘对象的内容上的独立性和价值上的独立性,应当不包含或者仅少量包含被挖掘的基础数据。除非原始数据持有者同意,否则对于挖掘生成的衍生数据的使用,不得与被挖掘基础数据的市场相冲突。在衍生数据包含有部分的基础数据内容的情况下,是否构成合理使用,需要综合该内容在整个衍生数据中所占的比例、所使用的量、使用时的精细程度等因素进行认定。
五、结语
数据作为数字经济时代的生产要素,具有重要的战略发展地位。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》明确要求“加快建立数据资源产权、交易流通等基础制度”。2022年6月22日中央全面深化改革委员会审议通过的《关于构建数据基础制度更好发挥数据要素作用的意见》强调“统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系。”数据要素市场秩序的形成,有赖于完善的数据利用规则。高水平的数据保护对于发挥数字经济的潜力、促进数据经济增长和一国数据竞争力至关重要。为数据赋权,“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”亦是我国的数据产业政策所向。
数据持有者投入经营资源和服务,对数据的收集、存储和安全付出了人力、物力、财力和时间等经营成本,对最终形成的数据集合拥有专有权。我国加快制定数据产权制度是完善数据规则体系的重要组成部分,是发展数字经济和数据产业集群的法治保障。数据立法的最根本目的在于通过发展数据产业,实现社会总福利的增加。为了激励数据的生产与利用,实现数据的合理流动,数据产权制度中需要匹配数据分类保护和产权约束机制。对于非公共数据,应当保障持有者的自主经营权。对于公开的数据,除非数据持有主体明确限制第三方的获取行为,否则应视为其默示许可其他主体对其数据的技术爬取。为了避免数据集中对数据市场竞争的负面影响,还需要注重运用合同法、反垄断法对数据交易行为进行规制。为了数据领域的创新发展,有必要对数据权利增加侵权绝对例外和相对例外规则,明晰在特定条件满足时,对基础性数据的挖掘属于一种合理使用情形,无需获得数据持有者许可且无需支付使用费。当下,数据要素正逐渐成为国家重要的生产力之一,数据产权保护与限制制度的建立,能够强有力地推动数据的市场化发展,同时能够为数据的跨境流动提供另一种规范思路。
脚注
1.Proposal for a Regulation of the European Parliament and of the Council on Harmonised Rules on Fair Access to and Use of Data (Data Act), Published on 23 February 2022.
2.杭州市中级人民法院(2018)浙01民终7312号民事判决书。
3.北京海淀区人民法院(2017)京0108民初24512号判决书。
4.北京知识产权法院(2016)京 73 民终 588 号判决书。
5.广东省深圳市中级人民法院(2017)粤03民初822号判决书。
参考文献:
[1]Swinnen K..Ownership of Data: Four Recommendations for Future Research[J]. Journal of Law, Property, and Society,2020, 5(3), 139-177.
[2]吴汉东.人工智能时代的制度安排与法律规制[J].法律科学(西北政法大学学报),2017,35(5):128-136.
[3]理查德·波斯纳.法律的经济分析(上册)[M].蒋兆康译.北京:中国大百科全书出版社,1997:40.
[4]Gervais D..Exploring the Interfaces between Big Data and Intellectual Property Law[J]. Journal of Intellectual Property, Information Technology and Electronic Commerce Law, 2019 (10), 3-19.
[5]张玉屏.个人数据产权归属的经济分析[J].江西财经大学学报,2021,134(2):130-139.
[6]Yu P..Data Producer's Right and the Protection of Machine-Generated Data[J]. Tulane Law Review,2019,93(4): 859-929.
[7]许可.数据保护的三重进路——评新浪微博诉脉脉不正当竞争案[J].上海大学学报(社会科学版),2017,34(6):15-27.
[8]黄细江.企业数据经营权的多层用益权构造方案[J].法学:2022(10):96-111.
[9]郑佳宁.数据信息财产法律属性探究[J].东方法学,2021(5):43-56.
[10]陶乾.论著作权法对人工智能生成成果的保护——作为邻接权的数据处理者权之证立[J].法学,2018(04):3-15.
[11]沈健州.数据财产的权利架构与规则展开[J].中国法学,2022(4):92-113.
[12]衣俊霖.论公共数据国家所有[J].法学论坛,2022,37(4):107-118.
[13]申卫星.论数据用益权[J].中国社会科学,2020(11): 110-131+207.
[14]彼得·德霍斯.知识财产法哲学[M].周林译.北京:商务印书馆,2017:214.
[15]叶嘉敏.算法风险防控视域下企业数据权利的三维构建研究[J].江西财经大学学报,2021,133(1): 139-148.
[16]菲利普·黑克.利益法学[M].傅广宇,译.北京:商务印书馆,2016:43.
[17]郝思洋.知识产权视角下数据财产的制度选项[J].知识产权,2019(9):45-60.
[18]周樨平.大数据时代企业数据权益保护论[J].法学,2022(5):159-175.
[19]Burri M..The Governance of Data and Data Flows in Trade Agreements: The Pitfalls of Legal Adaptations[J]. University of California, Davis Law Review, 2017(51):77-99.
[20]冯晓青.知识产权视野下商业数据保护研究[J].比较法研究,2022(5):31-45.
[21]李晓宇.权利与利益区分视点下数据权益的类型化保护[J].知识产权,2019(3):50-63.
[22]Sag M..The New Legal Landscape for Text Mining and Machine Learning[J]. Journal of the Copyright Society of the USA, 2018(66): 291-367.
评论