-
专利
-
商标
-
版权
-
商业秘密
-
反不正当竞争
-
植物新品种
-
地理标志
-
集成电路布图设计
-
技术合同
-
传统文化
律师动态
更多 >>知产速递
更多 >>审判动态
更多 >>案例聚焦
更多 >>法官视点
更多 >>裁判文书
更多 >>01、数据、大数据与数据库
在计算机术语中,数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的的原始素材。数据可以是连续的值,比如声音、图像,称为模拟数据;也可以是离散的,如符号、文字,称为数字数据。“位(bit)”是电子计算机中最小的数据单位。8个二进制位构成1个"字节(Byte)",它是存储空间的基本计量单位。这里先抛出2个问题:一是拥有多少字节的数据可能构成垄断?根据媒体2017年报道,脸书有近20亿用户,存了300千兆字节的数据。脸书是否构成数据垄断?二是,是否数据存储容量足够大,就是大数据?通说认为,“大”是指数据规模,大数据一般指在10TB(1TB=1024GB)规模以上的数据量。但大数据不简单等同于海量数据,其基本特征除了体量大(Volume)之外,还包括多样性、价值密度低、速度快等特性。假设公安人口数据库中,只有姓名、身份证号、性别等几个字段,但记录有14亿条之众,体量足够大,但没有与其它数据库进行关联或映射,它是否为大数据?
法律术语中的“数据”需要结合立法目的、文本和上下文做出综合认定。例如,《民法总则》第127条“法律对数据、网络虚拟财产的保护有规定的,依照其规定”;第137条还涉及“数据电文”的意思表示。再如《电子商务法》第25条关于经营者的信息提供义务:有关主管部门依照法律、行政法规的规定要求电子商务经营者提供有关电子商务数据信息的,电子商务经营者应当提供;第69条关于促进电子商务的条款中规定:国家维护电子商务交易安全,保护电子商务用户信息,鼓励电子商务数据开发应用,保障电子商务数据依法有序自由流动。《电子签名法》第2条界定“电子签名”是指数据电文中以电子形式所含、所附用于识别签名人身份并表明签名人认可其中内容的数据;而数据电文,是指以电子、光学、磁或者类似手段生成、发送、接收或者储存的信息。
可见,在法律文本中,法律保护的往往并不是数据本身,而是数据所表达或传递的信息。这种信息对于法律主体来说,有稀缺价值或有商业价值。
另外,在知识产权法语境下,数据库受到著作权法等法律保护。1996年WIPO互联网条约之一《世界知识产权组织版权条约》规定:“数据或其他资料汇编,不论用任何形式,只要由于其内容的选择或编排构成智力创作,其本身即受保护。” 我国《著作权法》也规定:“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品,其著作权由汇编人享有,但行使著作权时,不得侵犯原作品的著作权。”也就是说凡受著作权法保护的数据库,只要在组成材料的选择或编排上具有独创性,就可受到著作权法的保护。
从大数据和数据库二者关系来说,二者大致是互相重合的。大数据可能是一个或多个数据库构成,而数据库是按照特定的顺序或方法排列,并具有相互联系的数据信息的集合体(大数据)。离开组成数据库的信息材料(数据),就无法形成数据库;如果汇编的经信息材料是受版权保护的数据,数据库的权利人在制作数据库时要获得著作权人的同意。如果汇编内容包括以非著作权材料为内容的数据库,其中非著作权材料如果涉及个人隐私或其它财产权利,数据库汇编人也需要取得相关权利主体的同意;例如《网络安全法》中所确立的个人信息收集的知情同意和最小化收集原则等。
数据库著作权保护不延及数据库的内容;著作权法对数据库保护的是对其内容的选择或者编排体现独创性的表达,而不是它所选择或编排的内容本身。因此,数据库著作权保护不延及数据库的内容。数据库著作权保护也不延及操作数据库的计算机程序(例如,oracle 或excel);数据库和操作数据库的计算机程序是两个独立的著作权保护对象。
02、数据的权利与利用
接着前文数据库著作权保护的阐述,不可回避的一个问题是:数据或大数据是否存在财产所有权,权利人是谁?
网络经营者累积的大数据中一部分是个人信息有关的敏感数据,即,个人数据。欧盟《通用数据保护条例》(GDPR)中使用“数据主体”(data subject)的概念来指征个人是含有个人信息数据的权利主体。有趣的是“data subject”(数据主体)一词在GDPR(含序言)中共出现88次,但没有在第4条定义中明确单列解释,而是在“personal data”(个人数据)这一术语中间接说明。原文为“‘personal data’means any information relating to an identified or identifiable natural person(‘data subject’)”;因此可反推出:数据主体应为根据个人数据信息已识别或可识别的自然人。由于我国实行网络实名制、快递实名制等一系列安全管控措施,提供个人信息成为网民享受网络服务的前提。因此,移动互联网应用程序(APP)中强制授权、过度索权、超范围收集个人信息的现象密集涌现,个人信息安全保护形势严峻。
大数据中也存在大量非个人信息,例如浏览记录、交易记录等,也有人认为这些数据通过一定的分析也可识别出数据主体。这也是我们经常所听到的“数据画像”(data profiling)的作用,它是精准营销和大数据杀熟的基础。然而,我们假定这些交易数据已经匿名化和脱敏处理,非个人信息数据的权利主体是否为网络经营者?比如,实践中大众点评网的点评留言数据,豆瓣网上的书籍或电影评分数据。
实践中,网络经营者往往通过协议的方式来约定这部分数据的权利主体为网络经营者。例如,新浪微博《开发者协议》专门作出约定;第1.6条:“用户数据指用户通过微博平台提交的或因用户访问微博平台而生成的数据。用户数据是微博的商业秘密”。第1.7条:“平台运营数据,是指在用户通过微博平台使用平台服务、授权网站、开发者应用期间,用户所提交的或在微博平台生成的或在授权网站和开发者应用生成的任何数据或信息,包括但不限于用户登录数据,游戏操作数据、以及虚拟物品交易数据等数据。“平台运营数据”是微博的商业秘密。双方确认,平台运营数据和用户数据统称“数据”。[1]此处暂不讨论此类协议是否为格式条款及其法律效力。在司法实践中,人民法院支持网络经营者对收集数据的保护。[2]
此外,大众点评开发者协议第8.1条关于知识产权的规定:“开发者认可,大众点评开发者平台的全部内容、以及通过大众点评API获取的数据的知识产权(包括但不限于著作权、商标权、专利权或其他知识产权及其它附属权利等)归大众点评所有”。[3]这种表述的主语是“开发者认可”,开发者需要数据,格式化条款的运用只能使开发者“被认可”;其次,“数据的知识产权”表述不清,“其它附属权利”也不知意指何种权利。在法院看来,大众点评所主张的应受保护的利益并非绝对权利,用户评论信息是大众点评的劳动成果。对于未经许可使用或利用他人劳动成果的行为,虽然不能当然的认定为构成反不正当竞争法意义上的“搭便车”和“不劳而获”,但是在“大数据”时代的背景下,信息所具有的价值超越以往任何时期,如果不加节制的允许市场主体任意的使用或利用他人通过巨大投入所获取的信息,将不利于鼓励商业投入、产业创新和诚实经营,最终损害健康的竞争机制。[4]因此,市场主体在使用他人所获取的信息时,仍然要遵循公认的商业道德,在相对合理的范围内使用。法院试图在数据原始收集者与数据的二次开发者之间取得一种平衡。
综上,数据收集者对数据的占有是被认可的,甚至是一种合法的独占或垄断,因此,通过爬虫抓取数据或其它数据挖掘行为都受到严格的限制,尽管英国等通过修订著作权法为数据挖掘提供了著作权例外,但对数据挖掘主体、目的、形式及结果处理等作出规定。因此,数据收集者利用反不正当竞争法维护权利反证了数据垄断本身并不成立。
有人说,数据是21世纪的石油。石油也好,能源也罢,如果数据存储在那里,没有得到充分利用,并没有价值,徒增存储和维护成本。相对于杂乱无序的原始数据,运用大数据的理念开发出的数据衍生品具有更高的意义和价值。如前所述,如果构成数据库作品,依据著作权法基本原理,这些作品在某种程度和形式上也是合法垄断。
然而,对于公共数据则不适宜独占或垄断形式据为己有。例如,《上海市公共数据和一网通办管理办法》将公共数据界定为:上海市各级行政机关以及履行公共管理和服务职能的事业单位(公共管理和服务机构)在依法履职过程中,采集和产生的各类数据资源。在公共管理和服务机构之间,共享公共数据时,以共享为原则,不共享为例外,无偿共享公共数据。对于社会第三方使用公共数据的需求,上海做法是将公共数据按照开放类型分为无条件开放、有条件开放和非开放三类。涉及商业秘密、个人隐私,或者法律、法规规定不得开放的,列入非开放类;对数据安全和处理能力要求较高、时效性较强或者需要持续获取的公共数据,列入有条件开放类;其他公共数据列入无条件开放类。这种规定奠定了公共数据不得垄断的基本原则,除非法律法规另有规定。
03、数据垄断的迷思
数据大量积累的同时,必然出现了对数据垄断的担忧:一些企业或国家为了维护自己的利益而拒绝信息的流动,这不仅浪费了数据资源,而且会阻碍创新的实现。在国际法领域,在多边和双边国际贸易议题中,美国为首数据开放主义者认为,一国不得要求将数据存储在本地,数据应当自由跨境流动。这也引发与注重数据安全和数据主权的贸易伙伴之间争论不断。
在国内法语境下,如文章开头所述,拥有数据的多寡并不能直接构成垄断与否。数据的经济价值与数据的容量并不成正比,等量的不同性质的数据市场价值也有差异,例如1TB的金融大数据和1TB医疗大数据的定价不尽相同。脸书(facebook)从来没因为拥有20亿用户的数据而遭到美国司法部指控。脸书能收集20亿用户的数据,微信也有机会收集20亿用户的数据,这是用户根据自我体验,可以用脚投票的事件,竞争越充分,数据越不容易垄断和集中。欧盟GDPR中数据迁移权(Right to data portability),可以使用户方便地在A平台上的个人数据,迁移到B平台。
因此,反垄断执法还是应当关注具体的垄断行为,例如经营者达成垄断协议,经营者滥用市场支配地位,具有或者可能具有排除、限制竞争效果的经营者集中。而不是先入为主地将数据密集型企业作为反垄断法执法优先审查的对象。而且,我国《反垄断法》第55条明确:经营者依照有关知识产权的法律、行政法规规定行使知识产权的行为,不适用《反垄断法》。
也有人认为大数据可能适用反垄断法中的“必要基础设施”理论,该理论起源于美国判例法,是现代反垄断法在实践中针对拒绝交易行为发展出来的一项基本原则,该理论对规制经营者滥用市场支配地位行为具有重要的作用和意义。传统上,必要基础设施理论的适用都与自然垄断设施有关,但大数据毕竟不同于高速公路、输油管道或铁塔公司。
笔者无意否认数据的竞争影响力及其可能带来的市场优势地位。但是数据采集并不具有独占性,其市场准入门槛也并不高,大数据规模并不必然导致市场支配力量。[5]数据本身并不构成垄断,非法利用数据的行为才可能构成垄断,例如合谋算法等形式经营者垄断协议。对数据集中的并购审查,不仅要看到数据集中带来的市场力量的加强,也要看到数据集中对于降低信息不对称和提高动态效率的作用,结合个案分析权衡是否准予合并。[6]
另外,“数据垄断”是欧盟以数据保护受害者心态提出的担忧,特别是对以美国为首强大的高科技公司和社交网络平台所产生的数据虹吸现象,即欧盟公民的数据都GAFA(谷歌、亚马逊、脸书和苹果)收集,而欧盟本土企业却很难收集到欧盟境外的数据(个人数据)。因此,可以说GDPR就是欧盟发起的一种数据反垄断措施,还包括欧盟拟议的对某些数字服务收入征收数字服务税措施。然而,这些数据反垄断措施有效吗?GAFA在欧盟被抑制了吗?因此,从产业发展的角度,谦抑审慎应当是数据相关反垄断执法的基本原则。
注释:
[1]参见https://open.weibo.com/wiki/开发者协议。
[2]新浪微博诉脉脉不正当竞争案,北京知识产权法院(2016)京73民终588号民事判决书。
[3]参见http://developer.dianping.com/app/terms。
[4]北京百度网讯科技有限公司与上海汉涛信息咨询有限公司不正当竞争上诉案,上海知识产权法院(2016)沪73民终242号民事判决书。
[5]JOE KENNEDY.The Myth of Data Monopoly: Why Antitrust Concerns About Data Are Overblown, http://www2.itif.org/2017-data-competition.pdf.
[6]詹馥静,王先林:反垄断视角的大数据问题初探,载《价格理论与实践》2018年第9期。
评论