黄博文:数据的法律属性

要说2020年互联网法律领域的重大案件。“头腾大战”绝对是其中之一。一头是中国社交软件的龙头老大,手握庞大的用户基数和丰富的数据资源;另一端则是大数据领域的新锐,努力进行用户数据的“圈地运动”。案子的核心焦点在于,微信的好友关系的数据权属到底是应该归平台方还是归用户。前者意味着微信方面可以限制对微信数据的爬取来维护自己的竞争地位;而后者意味着用户可以授权抖音等其他平台使用自己的个人数据。由此,关于数据权属的讨论持续升温。

对这一问题的传统讨论,主要限于两个方面:一是在平台技术背景下如何认定广大平台用户的“隐私”等消极防御性利益期待,致力于建构一套包括隐私利益期待在内的消极防御权体系;二是在一个相对宏观的层面来讨论数据保护基本路径的选择,即应当通过何种法律路径配置平台企业和如何在现有法律框架下给予数据以绝对的物权保护。前者根植于隐私保护的相关理论自不待言;而后者将理论根植于科斯定理,认为由于信息具有非常便捷的可复制性和非常快的流转速度,具有非排他性、非竞争性,从而构成一种公共物品,容易引发搭便车的问题,从而损害数据原始收集者的利益。对这一问题的解决之道是合理界定产权,降低交易成本;并以此为前提,通过交易协商解决问题。

而包晓丽、熊丙万的《通讯录数据中的社会关系资本——数据要素产权配置的研究范式》一文,为这个问题的解决提供了新的思路。文章在继承传统权利束理论对不同社会关系的包容性的同时,针对大数据时代权利束体积和数量扩张所引发的确定性缺乏问题,提出在正视同一宗数据上的权利束数量和体积变动性的同时,采用一种开放的权利束学说来描绘和理解一宗数据财产之上的权利样态。我们同样可以将该宗数据之上的财产权内容想象为一捆权利束体,束体中的每一条块代表了数据的一种用途。而这个权利束体的体积则代表了该宗数据的物理大小。随着数据量的积累和利用方式的丰富,无论是这一宗数据权利束体本身,还是束体内的权利条块,都会随时间和技术的进步而不断增长。因此,当下的要务根据找出用户和平台各自对于数据的利益期待划分权利束,文章对双方的利益期待分别作了总结,其中前者主要是隐私等人格利益与积极利用个人信息的利益;后者可总结概括为数据开发利益与竞争利益。而用户关于隐私的关切容易与平台的数据开发利益相冲突,用户关于积极利用个人数据的利益期待容易冲击平台的竞争利益;此外用户与用户之间的隐私偏好不同将导致隐私关切不能一刀切地解决,而保护隐私和保护用户对于个人数据的积极使用容易构成平台维护自己竞争利益的借口。因此,隐私利益和积极利用数据的利益构成了这篇文章之后的论述对象。对于隐私期待而言,由于不同用户有不同的隐私偏好,因此我们只能追求“场景式正义”,不可能采取“通知-同意”规则那样的一刀切做法,否则将面临要么因为授权范围太窄而阻碍了数据的二次合理开发使用,要么因为授权范围太过宽泛从而被实质上架空的尴尬局面;对于个人数据利用期待,文章认为,微信社会网络与之前的社会网络相比的特殊之处在于,这个网络的产生,是双方合作的结果,用户和平台都付出了成本和劳动,它既离不开用户积极拓展人脉的行为,也离不开平台技术的推动。因此,双方都有各自的收益预期。用户希望通过微信开拓和维系社会网络,而平台希望能积极利用这张关系网,获得增值服务提成等直接收益与市场份额扩大等潜在收益。问题的关键在于,如何建构一套关于社会关系链数据财产的权属分析框架,一方面让各方的重大利益期待都能够得到满足,另一方面又能够确保平台和用户群体之间的互利合作能够持续展开。文章认为,只有在平台利益期待和用户利益期待发生冲突时,且双方没有有效合意时,讨论何者优先才变得有必要。此时应当践行人文关怀,在保障用户现有重大利益期待优先满足并不断剥离未来可能的重大利益期待的前提下,将数据财产的剩余索取权分配给企业。这样,既能保障用户参与平台活动的基本利益期待,又能保持企业的持续性投资动力,实现双赢。同时,在数据流转过程中,还应考虑数据迁移可能引发的市场替代效应,从而对原平台的商业机会稀释成本进行二次定价,予以补偿。

可以说,这篇文章切合热点,以小见大,视角新颖。这篇文章虽然结合“头腾大战”的时事热点,但它绝不仅仅是迎合热点而写出来的文章,它所选取的社会关系网络是大数据时代数据的一个典型代表,这些数据不再是仅仅由用户产生并传送给平台的数据,而是用户和平台共同劳动而产生的结果,用户和平台对此都有自己的利益期待,当利益期待产生冲突时就会产生问题。因此这个问题具有一般性,这篇文章巧妙地利用社会网络这一个小的切入点,以小见大,较好地论述了一种数据权利界定的新视角。这篇文章最大的亮点在于,它没有陷入空洞化的理论探讨,而是看到了不同立场背后的利益纠葛,并结合商业实践进行利益权衡,选择了一个恰当的理论工具(经过改进的权利束理论)解决问题。

但是,这篇文章是在物权界定的视角下讨论数据保护的,它前面还有若干前提问题。离开这些前提问题的讨论而单单讨论如何界定数据的物权,容易使得讨论变成无源之水、无本之木。

第一个问题是,数据问题都是互联网时代、大数据时代的特有问题吗?这个问题事关真问题的筛选,毕竟没有真问题,就是假学问,真问题的筛选对于网络法的研究至关重要。在某些纠纷中,互联网只是不法行为的工具,因此在这些纠纷中,问题的实质不是网络法的问题,而是背后真正的法律关系,这种纠纷可以称之为“工具性”纠纷。而仅存于虚拟世界的问题才是网络法所应该关心的真问题,这些问题存在于“虚拟性”纠纷中。我们都知道,在日常生活中,“信息”一词经常与“数据”一词交替使用,但两者实际上不是同义词。信息不一定以数据作为载体,比如图书和档案上的信息便不是数据;数据不一定都是信息,数据解码后产生的对人类有利用价值的才能算信息;只有信息以数据为载体,数据经解码产生有利用价值的信息时,二者才是同义词。也就是说,“信息”一词和“数据”一词不是相等关系,不是包含关系,而是交叉关系。就这篇文章所论述的数据而言,由于大数据分析技术极大地加速了数据的积极利用,这些都是网络时代才有的问题,因此属于“虚拟性”纠纷。但是,除了这些可以解码成个人信息的数据之外,还有网页编码、软件代码、音视频编码等数据,因这些而起的纠纷,因为没有网络时代的特殊性,因此属于“工具性”纠纷,这些数据不应当成为网络法中数据问题的研究对象。因此,网络法中研究的“数据”,应当限定于“可解码成个人信息”的数据。

第二个问题是,数据本身是值得保护的客体吗?有学者指出,数据不具备唯一性、特定性、独立性和公示性等客体所固有的基本特征,因而不是客体。数据因其流通和复制的便利性无法为主体所独占,会使客体处于变动不居的状况,这直接与客体确定性的要求相违背;同时也给数据权属的转移公示造成了障碍。前文所述的数据与信息的异同也表明,数据不经过解码是没有独立的价值的。综上,数据本身不构成值得保护的客体。

笔者不同意这种看法,认为这种看法欠缺对网络运作机制的了解。只要对TCP/IP协议做一个简单的了解我们便可知道,数据是封装在数据包中,通过TCP/IP协议模型中各层的通讯与控制进行传输的,数据包具有相当的特定性。而且,随着区块链技术的发展,我们可以做到数据的不可篡改、全程留痕、全程可追溯,数据的公示和特定性问题由此得到解决,而且随着技术的进步,这一个问题必将进一步得到解决。至于数据的独立价值,数据的确需要解码成信息才能体现价值,但是如果抛开数据的大量获取,大数据分析就成为了无源之水、无本之木。因此,数据应当属于值得保护的客体。

第三个问题是,应当用什么权利来保护数据?目前有三种观点:物权说、债权说、知识产权说。这三种观点各有利弊,学界目前对于采用哪种观点还没有共识。物权说的优点,按照莱斯格教授的观点,主要有两点:第一,财产制度能较好地适应不同用户对于隐私的不同判断。与财产制度相对应,责任制度的保护显得不那么个性化,而财产制度允许权利人对自己的数据进行差异化定价。或许会有人质疑(如这里评析的这篇文章),认为差异定价会使得识别成本、谈判成本不合理地增加。莱斯格教授认为,随着代码的进步,差别定价的“交易成本”将显著降低,因此这个问题可以通过代码的改进获得解决。第二,它能加大隐私保护力度,因为它需要用户获得隐私的所有权,从而进行预先保护。但是,物权说的弊端也很明显,由于数据财产化利益具有绝对性和排他性,这种界分是非此即彼的,它使得个人信息财产权与数据从业者对数据的合理利用发生冲突,并使得人格利益过于商品化。而债权的保护方式具有很好的包容性,双方可以通过意思自治对权利作出自己的安排,并且,针对欧洲和美国的个人信息保护理论分别起源于人格利益和隐私利益保护的历史演变历程,利用侵权之债作为侵犯人格利益的救济非常合适。针对对于其他利益(比如竞争利益)的侵犯,由于侵犯这些权益同样在平等主体之间产生损害赔偿请求权,因此也可以归入债权保护的范畴。但是,债权说的弊端同样明显,首先,债权的期限性、相对性不符合大数据时代的数据利用实际;其次,债权的相对性显然难以支持和保障数据开发和数据资产化经营的动力。而知识产权的保护方法,同时兼顾人格利益和财产利益,同时由于知识产权授予的垄断带有促进信息流通的价值取向,其设定了法定许可和合理使用的豁免,优势明显。而知识产权说的劣势在于,其垄断权的来源不明显,毕竟,著作权的垄断来源于作品的独创性,而工业产权的垄断来源于新颖性。如果需要采用知识产权说,则需要明晰垄断来源,或许对特定个人的可识别性可以成为这里的垄断来源。由此可见,对于数据的保护路径,尚有很大的讨论空间,而对于某一观点的改良,有利于这种观点的采纳。而讨论至此,文章的讨论才有意义。就这篇文章而言,作者显然赞成物权说,而其提出的权利束理论,有助于改良物权说的弊端。

此外,本文的讨论仅限于民法层面。我们应该看到,互联网所受的规制是法律、准则、市场和架构四者之和,且四者相互作用,而这四者分别对应法学、社会学、经济学和代码四个方面,因此,对于数据的保护,需要不同领域的通力合作。

另外,这篇文章根植于权利束理论,让我们看到了财产权理论的弹性,但是我们需要避免进入另一个极端,使得法律成为“零敲碎打”。在增强财产权理论的弹性的同时,我们也要看到现有理论体系的实用价值,这也是私法的新思维运动者对权利束理论的批判理由之一。尤其是在中国特色社会主义法治理论尚在完善,司法机关工作人员专业化水平还有提升空间的背景下,强调现有体系的价值有其必要性。

发表评论