中文

Base on one field Cast our eyes on the whole world

立足一域 放眼全球

点击展开全部

法律宝库

更多 >>

“信息—数据二分”视野下对平台数据竞争问题的审视

发布时间:2024-03-29 来源:《中国知识产权》杂志 作者:德嘉 北京市海淀区人民法院
字号: +-
563

数据竞争的问题,特别是企业之间、平台之间涉及数据爬取和利用等方面的竞争问题,是当前的热点法律问题之一,其中存在不少争议。本文将探讨其中的一个重要问题,即数据与信息的区分。笔者认为,在讨论数据竞争特别是企业间、平台间关于数据的爬取和利用问题时,必须明确地限定所讨论的对象,即此处所指的“数据”是指作为信息载体的电子数据。基于这一前提,在“信息—数据二分” 视野下,对平台数据竞争问题进行审视。

信息与数据的定义辨析

讨论数据保护、数据赋权、数据竞争,首先应明确讨论对象的精确定义。什么是法律意义上的“数据”?《民法典》对此并没有直接规定,《数据安全法》第三条则给出了精准的界定:“本法所称数据,是指任何以电子或者其他方式对信息的记录。”此外,国际标准化组织(ISO)也指出:数据是信息的一种形式化方式的体现,该种体现背后的含义可被再展示出来,且该种体现适于沟通、展示含义或处理。

不少专家、学者都非常重视对数据和信息的认识与区分。时建中在《数据概念的解构与数据法律制度的构建——兼论数据法学的学科内涵与体系》一文中强调:“概括地讲,数据是信息的载体,数字是数据的传输和处理方式……信息需要载体。若无载体,信息就失去了得以存续和呈现的介质,等同于没有信息。”吴汉东在《数据财产赋权的立法选择》一文中指出:“‘数据与信息具有很强的共生性和相互依赖性’。数据作为信息的表现形式和载体,可以说是信息类的无形财产。”申卫星在《论数据用益权》一文中也明确指出:“数据的本质是信息的载体,而信息是知识来源……数据应是对已知或者未知信息 (连同元数据)的数字描述,且在技术上能够成为数字运算(处理、存储与传输)的对象,是以可机读方式存在的电子化信息记录……要正确讨论数据权属问题,必须从客体上严格区分数据和信息,将二者混为一谈会产生许多不必要的误解。”

上引学者观点与笔者的个人观点较为接近,即认为信息和数据是内容与载体的关系。打比方来说,信息和数据的关系类似于著作权法当中的作品与载体,或者说《红楼梦》这部作品与《红楼梦》纸质书之间的关系。

应当注意的是,日常生活中出现的很多有关“数据”的提法,并不都是明确、严谨地指向上述的作为载体的数据。在大量场景中,信息和数据这两个概念都是被混淆使用的,如果不结合上下文分析,就无法确定所谓的“数据”到底指向的是信息还是载体;甚至在同一篇文章、同一份文件的不同段落中,“数据”一词所指代的对象和内涵都可能是不同的。随着语境的变化,“数据”一词似乎也在不断变换着角色:有时候,它是指作为载体、结果的数据,即狭义的数据本身;有时候,它是指数据所记录、承载的信息或内容;而在某些情况下,它又指向“数据+信息” 的全部内涵,成为内容与载体的集合。

对“数据”概念的不清晰、不严谨的认识和使用以及频频出现的一词多义的情况,很可能正是对相关问题的研究和讨论从一开始就出现混乱甚至严重分歧的原因所在。例如,《反不正当竞争法(修订草案征求意见稿)》第十八条“数据专条”最后一款:“获取、使用或者披露与公众可以无偿利用的信息相同的数据,不属于本条第一款所称不正当获取或者使用其他经营者商业数据。”单从字面意思上看,这一表述很容易导致人们认为此处所指的“数据”等同于信息,如果不对其进行适当优化,可能在未来的法律适用过程中引发一系列问题。

将信息与数据两个概念混淆使用,在日常生活中似乎问题不大,但在探讨法律规则的场景下,就很容易产生方向性的误导和根本性的误判。数据与信息的本质差异,必然导致二者指向不同的权利配置与行为规则。

对信息与数据不加区分,在信息权利主体与数据权利(权益)主体完全重合的情况下,可能存在的问题还不那么明显;然而,一旦信息主体与数据主体是分开的,二者各自所拥有的权利或权益就很可能相互关联又各自独立。由此一来,这两类主体各自行使其权利时,就不免产生一定的摩擦甚至矛盾。此时,如果还把信息与数据混为一谈,这种不同主体之间的权利冲突恐怕就无法妥善解决。不去准确地限定研究对象,而在一个模糊的前提下匆匆探讨相关的利益平衡与行为规则问题,就很难得到清晰、合理的结论,反而很可能引发毫无意义的分歧与争论,陷入自说自话的死循环。

因此,笔者认为,在讨论数据竞争特别是企业间、平台间关于数据的爬取和利用问题时,必须明确地限定所讨论的对象,即此处所指的“数据”是指作为信息载体的电子数据。基于这一前提,再试着对一些现象、问题和争议进行梳理。

“信息—数据二分”视野下对平台数据竞争问题的审视

其一,同样的信息,完全有可能对应着不同的数据,进而对应着不同的数据控制主体。即便这些不同的数据所记录的是完全相同的信息,也并不妨碍上述不同主体对其各自所控制的数据,分别享有各自独立的、并存不悖的权利(权益)。比如说,某视频博主把自己摄制的同一条短视频分别上传到不同视频平台上。此时,作为信息、内容的短视频的权利人仍然只有一个,即该视频博主本人,而这一条短视频却在不同的平台上被分别记录、存储成了多份各自独立的数据;相应地,各个平台对其自己所存储、控制的相应数据,均分别地、独立地享有权利(权益)。

 其二,信息的权利主体,并不必然是该信息所对应之数据的权利(权益)主体,也并不必然地享有控制、支配这些数据的权利。举个例子,虽然刘慈欣是《三体》小说的作者,但其对于新华书店、图书大厦中售卖的《三体》图书并不享有占有、处分等权利。小说作者的特殊身份,并不会使其产生控制、支配这些图书的特殊权利。借鉴“作品—载体二分”的思路,在“信息—数据二分”的视野下,可以得到解决涉及UGC(用户生成内容)平台数据的一个争议问题的清晰路径,即用户作为内容(作品)的生成者、上传者,其对于自身所生成、上传的内容(作品)所享有的权利,并不能当然地吸收、对抗甚至消灭平台运营主体对于相应数据所享有的权利(权益)。进一步思考 :此时,用户能否授权第三方径行去现平台爬取与其生成内容所对应的数据呢?笔者认为,答案是否定的。简而言之,除非明确存在有法律规定或合同约定的义务,否则便不存在正当理由去要求数据的加工、存储、控制等主体无偿、无条件地把数据提供给其他任何市场经营者。

 

其三,当前流行着这样一种观点:数据在被反复、多次利用的过程中不会产生损耗,反而是使用得越多、越广泛,其发挥出的价值就越大,所以应当鼓励更多市场主体对数据进行更多方式、更为广泛的利用;此时,如果数据的收集、加工、控制者等去限制他人使用自己的数据,反而是妨害了“数据流通”“数据共享”,将成为数字经济发展的阻力。对此,只要认真思考,就不难发现这种观点存在的根本问题:客体在数量和物理属性等方面没有受到减损,并不代表其市场价值不会受到贬损,更不代表该权利(权益)的所有者没有遭受损失。为便于理解,仍以著作权进行类比:多印几万本盗版书,对作品及其内容本身不会造成任何改变和损害,但毫无疑问地会侵害作者、出版社等相关主体的合法权利和经济利益。

 

其四,大众广泛认同,对于数据这一新的生产要素,应当鼓励其市场流通和广泛利用。但同时也必须注意到,这不能成为某些主体在缺乏合理理由的情况下违反robots协议甚至破坏、规避技术保护措施,去违法爬取、使用其他平台数据的借口。应当看到,土地、劳动、资本、技术等其他生产要素,都是在市场交易中,通过订立合同、支付对价去实现流通、发挥价值的。笔者认为,似乎没有把数据要素作为例外的正当理由。对于某些采取单方的、强行的甚至具有欺骗性、破坏性的方式去获取他人平台数据并牟利的行为,有必要从相对宏观的角度对其进行冷静、客观的评判:这种行为会不会冲击和破坏反不正当竞争法所维护的市场竞争秩序?这种行为与市场激励机制是否相违背?从长远和整体上看,这种行为是否真的有利于提升消费者福利、促进经济和技术发展?再进一步思考:这种行为模式是否能够复制、推广到域外市场?能否提升我国的国际影响力和竞争力?

 

其五,时至今日,仍有观点认为:数据像水和空气等自然资源一样,具有天然性和公共性,加之本身并不稀缺,人人皆可得之,且应无条件地进行利用。笔者认为,这恐怕是对平台数据的误解。首先,我们今天所谈及的作为“信息载体的电子数据”,从来就不是天然存在的。如果将其比喻为水和空气,那么它也是经过加工、过滤等工序生产出来的饮用水和氧气,是流通在市场中、放在货架上的商品,是需要通过交易、支付对价才能够被合法取得的。当然,很多与数据有关的网络产品或服务都是由平台“免费”提供给用户的,但免费提供并不代表无对价、无条件、无限制地提供,更不代表是默认向任何主体、以任何使用方式提供的。其次,平台数据也并非真的不具有稀缺性。珠穆朗玛峰顶上散落的石头、马里亚纳海沟里流淌的海水,如果放在原地的话,似乎确实没有什么稀缺性;然而,当有人投入时间、购置装备、冒着风险把它们从原地采集回来,放在城市的商场、酒店里售卖时,这些石头、海水就成为具有稀缺性的商品,这种稀缺性与其此前是否属于自然资源无关,而是由人工获取的成本和机会所决定的。

 

最后,需关注一些细节问题:比如数据的控制者并不代表其必然也是信息的控制者。对数据的控制,有可能同时实现对信息的控制;但这并不意味着只要控制了数据,就一定会出现所谓的信息垄断,而需要根据具体情况加以区分。又如,所谓“互联互通”“数据流通”“数据共享”,所提倡的到底是信息和知识的共享和流通,还是作为载体的数据本身的共享和流通?这也需要加以区分和思考。从数据需求者的角度来看,到底如何合法地获取和利用其他市场主体的数据?笔者认为,首先还是要到市场中去,通过平等、公允的市场交易及合同获取数据,这一方式的优先性和正当性是不言而喻的。如果通过市场无法正常获得所需要的数据,则首选的方式也是诉讼等法律途径,其中可能涉及到反垄断审查等问题。如果不采用以上方式,而直接单方、强行地甚至是带有破坏性、欺骗性地爬取和使用他人的平台数据,目前并不具有任何合法依据和合理理由。

评论

在线咨询