大数据时代国家数据主权问题研究

作者:杜雁芸 来源:国际观察 发布时间:2016-06-04 阅读量:0

摘要:人类业已进入大数据时代,大数据的广博性、关联性和战略性引发世人的关注。与此同时,由于国家独享“绝对主权”时代的终结,传统理念已无法适应国家管控海量数据传送和集聚的现象,数据主权随之应运而生。本文通过对已有数据主权概念的辨别分析,厘清数据权、个人数据权利、信息主权、网络主权与国家数据主权的关系,从国家视角进一步界定数据主权概念。鉴于国家间的数据主权博弈、数据的跨境流动、大国的数据霸权及数据处理本身的特征等因素,各国有效行使数据主权的能力十分有限,国家的数据主权面临威胁和挑战。本文提出了中国应对挑战、捍卫数据主权的几项举措:构建中国的国家数据战略、提高对核心数据的控制能力、实现数据的自由流通与跨境管控之间的合理平衡。

关键词:大数据 国家数据主权 国家信息主权

中图分类号:D80 文献标识码:A 文章编号:1005-4812(2016)03-0001-14+本文是全军军事科研计划项目“网络空间国际冲突与安全机制研究”(项目编号:14QJ004-114)和湖南省社科基金项目(项目编号:13YBA043)的阶段性成果。

随着移动互联网、云计算、物联网等新科技的飞速发展,遍布全球的传感器成为数据的来源和载体。此外,承载数据信息的智能手机、平板电脑和个人计算机的普及率不断攀升,大量数据迅速生成和聚集,催生了数据规模的爆炸式增长,标志着人类已进人大数据时代。由于大数据发展超越了先前以国土疆界为界限的安全概念,数据主权逐步引起各国的重视。与此同时,由于一国不能有效地管控其主权范围内的数据及本国居民跨境流动的相关数据,数据主权面临巨大的挑战。本文通过厘清数据主权和数据权、数据主权与信息主权等几对关系,挖掘数据主权的内涵,进而分析国家数据主权面临的挑战,并提出中国捍卫数据主权的应对之策。

一、理解大数据的三个维度

大数据是指PB级以上的数据集合,由于信息量过大,传统的存储设备无法对之进行搜集、存储和处理,人类开始运用新兴技术对数据进行管理。①本文将从大数据的广博性、关联性和战略性三个维度对之加以分析。

(一)大数据的广博性

首先,大数据体量庞大,且其规模呈不断扩大的趋势。当前,大量数据的规模已然超出传统计算机处理数据量的级别。数据体量从GB(1GB=1024MB)升级为TB(1TB=1024GB)、PB(1PB=1024TB),甚至EB(1EB=1024PB)和ZB( IZB=1024EB)。201 1年,国际数据公司(IDC)的一份研究报告认为,今后十年,大数据将递增50倍。截至2020年,全世界的数据量将高达35.2ZB。②

其次,大数据种类繁多,来源广泛。从类型上看,它包括结构化数据、半结构化数据和非结构化数据。结构化数据系传统数据库收集的数据,它能够用数据或统一的结构加以表示,包括互联网世界中人与人的交互信息、物联网世界中的商品和物流信息以及企业内部的经营和交易信息等。非结构化数据来自社交网络和物理传感器,包括话语、图片、影像以及电子探头数据等。近年来,随着智能设备和视频器材的普及,大数据的来源日益广泛,非结构化数据不断涌现,每年以60%的速度持续增长。截止到2012年底,非结构化数据已占全部数据量的75%以上。从来源上看,大数据可分为四类:一是由用户自主输入和提交的数据;二是由采集器终端采集的数据;三是卫星收集的全球数据;四是在使用过程中形成的“元”数据。这些数据已经超过了ZB,即万亿GB的水平。任何能够有效使用这些数据的行为体,将获得巨大的经济收益、政治影响力和安全能力。

再次,大数据使用的程度多样化,使用的状态多元化。美国信息存储资讯科技公司( EMC)按照使用的程度和状态将大数据划分为三种:活跃数据,即被有效地标识并已经使用的数据;唤醒数据,即已被标识但并未有效使用的数据;沉睡数据,即既没有被标识也未得到有效使用的数据。EMC公司在题为《数字宇宙》的报告中指出,沉睡数据的比例高达80%。由此可见,人类对数据的使用仍处于非常初级的阶段,庞大的沉睡数据有待于人类挖掘利用。

(二)大数据的关联性

大数据的“大”不仅指其“量”的庞大,还深刻地揭示了数据生态系统相互关联的特征。由于数据显性化和网络隐形化的相互结合,数据之间的复杂关联无所不在。“关联性”系两个或两个以上变量的取值之间存在某种规律性。大数据的价值来源于数据之间的相互关联,如个体内部不同信息之间的关联、不同个体相互之间的关联、不同群组之间的关联、甚至是信息本身的结构关联等。大数据的关联分析沿革了统计学的特点,并不是立足于因果关系的逻辑推理研究,而是对数量巨大的数据进行统计性的搜索、比较、聚类、分类等分析归纳,目的是找出隐含于数据之中的相互关系网(关联网),而相关性通常由支持度、可信度、兴趣度等参数反映。例,数据A和B具有关联性,可以看出,A和B在取值时相互影响,但并不代表有A-定有B,或有B必然有A。因此,大数据处理是一种能力,即用关联方法从看似没有价值的数据中挖掘出有用信息的能力。

运用大数据的关联性揭示事物的规律性是十分重要的。对于简单封闭的系统而言,小数据的因果分析简单易行,这是一种基于有限数据样本而不得不对客观世界进行简化的结果。但对于开放复杂的巨系统,传统的因果分析难以奏效,因为大数据处理的是流式数据,价值密度低,数据规模不断变化,变量间的因果关系具有时效性,往往存在此一时、彼一时的情形。系统中的各个组成部分由于时间关系相互影响,可能互为因果,因果关系隐藏于整个系统中。现在的“因”可能是过去的“果”,此处的“果”也可能是别处的“因”,因果关系本质上是一种相互纠缠的相关关系,相关性分析是为了间接地认识因果关系。这便需要我们运用相关性来揭示大数据背后的规律性。日常生活中,个人、群体和国家都会在不经意中留下各种各样的“数据脚印”。例如,阿里巴巴公司根据客户的购买行为、手机全球定位卫星数据以及在可穿戴设备上产生的数据,挖掘出客户的相关“推测数据”。这些数据若是经过系统的联系、处理和归纳总结,就会揭示个体和群体有价值的规律性,影响个人、群体乃至国家的生存和安全。上文提出,近10年来增长最快的数据是网络上传播的各种非结构化或半结构化数据。网络数据的背后是相互联系的各种人群,根据相关数据可以洞察到近期国家信息空间是否安全和社会是否稳定。①因此,大数据的关联性分析,是揭示事务本质、搜取信息规律性的关键所在。

(三)大数据的战略性

大数据是社会高度信息化的必然产物,事关国民经济运行的安全和社会的稳定。“大数据堪称智能交通、智能电网、智慧城市等国民经济运行和社会发展高度依赖的信息基础设施‘血液’。这些重要的信息系统、基础设施网络化智能化程度越高,安全也就越脆弱;速度越快,风险也就越大。”②人类越来越倚重以大数据为支柱的基础设施,大数据的安全与否已关乎社会稳定和国家安全,若社会的“血液”出现问题,则将对“肌体”造成难以预估的影响和损失。2011年,索尼发生重大数据泄密事件,用户的姓名、电子邮箱地址、密码、信用卡号等均被曝光,7700万用户受到牵连,其成本损失高达1.71亿美元,PSN服务关闭23天。③

大数据是与自然资源、人力资源同样重要的战略资源,是一个国家数据主权的体现。④大数据将成为国家主权行使的权力基础,数据成为社会权力的重要来源。大数据蕴含着最新科技、社会动态、市场变化、国家安全威胁征兆、战场态势和军事行动等政治、经济、文化、安全等方面的各种信息。⑤信息权力不仅是主权国家控制其国内社会的基础,而且是外交力量的倍增器。⑥因此,在数据为王的大数据时代,谁掌握大数据,谁就能占有庞大的数据“宝藏”;谁能最大限度地挖掘大数据中的价值,谁就能拥有“未来新石油”的控制权。大数据已经成为国家核心竞争力的重要组成部分。

二、国家数据主权的概念辨析

随着科学技术的发展,传统国家主权的范围逐步扩大,主权概念的内涵与外延也相应扩充。由于“大数据时代”的到来,国家独享“绝对主权”的时代已经终结,既有的信息主权无法适应国家管控海量数据传送和集聚的状况,导致数据主权应运而生。目前,国内外学术界对数据主权概念的界定各有侧重,并未形成统一认识。通过厘清各种关系,正确辨析国家数据主权的概念,是研究数据主权的逻辑起点。

(一)由传统的主权概念沿袭而来的界定

传统的主权概念将国家主权定义为对内的最高统治权和对外独立权。博丹在其《主权论》中明确指出:国家主权是一个国家的固有属性,是一种以国家为范围的对内最高统治权和对外独立权。国家主权以国家的地理疆界为界限,不可转让、不可分割、不受限制。可以看出,博丹认为,无论是对内最高统治权还是对外独立权,都具有最高的权威性和排他性,不受任何外部实体的制约和影响,是国家利益的核心成分之一。

目前,一些学者沿袭传统的主权概念,将数据主权的界定回归到传统主权的含义中。有学者从对内最高统治权的角度进行界定,认为数据主权的主体是国家,是一国独立自主地对本国数据加以管理和利用的权利。也有观点表示,数据主权除包含对内控制权外,还应涵盖对外独立性这一层次。其将数据主权定义为:国家对数据和与数据相关的技术、设备、服务商等的管辖权及控制权,体现域内的最高管辖权和对外的独立自主权、参与国际事务的合作权。齐爱民将捍卫数据主权上升为一种原则,即数据主权原则——对内体现为一国对其政权管辖地域内任何数据的生成、传播、处理、分析、利用和交易等拥有最高权力;对外表现为一国有权决定以何种程序、何种方式参加国际数据活动,并有权采取必要措施,以保障本国的数据权益免受其他国家的侵害。不难看出,数据主权是国家主权内涵的延展和扩充,数据主权的定义本应回归传统主权概念的应有之义,但以上界定并未凸显数据主权的特殊性。

(二)据数据主权行使的内容作出的界定

目前,与数据主权相关的概念种类繁多,如广义数据权、狭义数据权、数据权利、数据权,以及数据所有权和使用权等等。它们相互交织、错综复杂,只有厘清其彼此间关系,才能准确地辨析数据主权的概念。

从主权行使的范围看,有学者将数据主权分为狭义数据主权和广义数据主权。狭义数据主权仅指国家数据主权,广义数据主权包含国家数据主权和个人数据主权。顾名思义,国家数据主权的主体是国家,个人数据主权则以公民为主体。多数西方学者提及的数据主权多指个人数据主权,而中国学者主要强调国家数据主权。两者间的关系可以表述为:个人数据主权只能置于国家数据主权的框架下、在国家数据主权的范围内运作,唯有如此,前者方能得到有效的保障。美国学者乔尔·荃齐曼(Joel Trachtman)曾指出,个人数据主权的实现需要以国家数据主权为基础和前提,而国家数据主权的维护又基于个人数据主权的支撑和表达。①

从主权行使的主体看,数据权包括数据权利和数据主权两个方面。2009年以来,美、英、澳等国纷纷开展“数据民主”运动,把此前政府专享的公共数据放在政府数据的门户网站上,英国首相卡梅伦正式提出“数据权利”的概念,认为这是信息社会的一项基本的公民权利,并承诺要继续将之在全社会推向深入。②由此可以看出,数据权利被等同于个人数据主权,是对应于公民的数据采集义务而形成的对数据的使用权,即用户对其数据的自决权和自我控制权。③其具体包括对个人隐私权、生命财产的数据保护、对企业资产的数据保护和对本国公民和境内其他行为体在国际社会中的数据保护等。④而数据主权系指大数据时代的国家主权,很多欧美国家更多强调的是网络空间中的国家主权。数据主权和数据权利共同构成了数据权,因此,数据权相当于广义数据主权所含内容。

从主权行使的方式看,有学者认为,数据主权是数据所有者占有、使用和处理其数据的能力。⑤也有学者提出,这一界定未能体现主权国家的治权,即对本国疆域内的数据进行管辖的权力。⑥本文认为,一国公民在境外形成的数据也属于该国管辖的范围。曹磊将数据主权概括为数据所有权和数据管辖权两个方面,其中前者指主权国家对于本国数据排他性占有的权利,后者为主权国家对本国数据享有的管理和利用的权利。蔡翠红指出,数据主权意味着数据即使被传输到云端或远距离服务器上,仍然应受其主体控制,而不会被第三方所操纵。②综合以上观点,本文认为,数据主权应包括数据的所有权、控制权、管辖权和使用权。

(三)与信息主权、网络主权相比较而进行的界定

随着互联网的兴起和发展,主权概念从实体空间蔓延到虚拟空间,人们开始热议信息主权和网络主权。而随着大数据时代的到来,数据主权延展了国家主权的内涵。鉴于信息主权、网络主权和数据主权三者间的关联,可借鉴信息主权、网络主权等概念,通过对比分析,探究数据主权的独特性质。

数据主权与信息主权一脉相承,均自国家主权概念演化而来,乃国家主权的重要组成部分,是一个国家对本国网络、数据中心、信息系统中数据进行自主管理的权力。但从本质上看,数据主权和信息主权存在很大差异。首先,两者产生的背景不同,“大数据时代”已经取代了信息时代这一提法。在当今世界数字化、信息化、网络化、全媒体化的总体环境下,作为信息技术发展产物的数据资源呈爆发式、多样化的增长,其影响业已超过信息技术本身。其次,数据主权体现出更多的技术性。随着移动终端的普及,数据主权在廉价存储设备、高速宽带、云计算和物联网等技术对传统信息通讯工具的变革中应运而生,它涉及数据的生成、收集、存储、分析、应用等环节。再次,数据和信息的界定有着本质区别——数据是按一定规则排列组合的物理符号,其表现形式为数字、文字、图像和计算机代码;信息数据则是经由一定的工具加工整理而成的。⑤人们在生活中及互联网虚拟空间里留下大量的数据,这是一种无意识的数据行为。而数据须经过加工和解读才成为能被人们使用的信息,这显然是一种有意识的信息行为。汪晓风认为:“如果把数据理解为矿产资源,信息就是采掘出来的原材料,进一步加工就成了产品,即知识。那么数据主权相当于国家对自然资源和领土的所有权。从这个意义上而言,数据主权比信息主权更有价值,因为国家可以对矿产资源拥有主权,但在市场体系中国家对于生产资料和产品只有分配权和收益权。”①可以看出,大数据时代的数据概念已不同于信息时代的信息,数据是信息的原生态,在数据主权中,数据所涵盖的范围远远超出信息的范畴。

网络技术的发展赋予国家主权以新的内涵,由此诞生的网络主权即为一国国家主权在网络空间中的自然延伸和表现。对内,它系指国家独立自主地发展、监督、管理本国的互联网事务;对外,则指防止本国互联网受到外部入侵和攻击。②数据主权与网络主权的交叉融合较多,一些欧美国家认为,前者是指网络空间中的国家主权。③然而,数据主权不能被简单地等同于网络主权,网络不能涵盖数据主权行使的区域。在大数据时代,网络空间无疑是行使数据主权的最重要场域,但信息的发送和接收并不仅仅限于互联网,还可通过电报、遥感技术、卫星传播等路径实现。因此,单纯以网络空间界定数据主权的行使范围显得过于狭窄。此外,网络主权主要体现为国家对网络信息技术的监管,包括为网络物理设施的运行提供安全保障,以及采用技术手段对网络信息安全进行维护。④这为数据主权的界定提供了借鉴,无论是网络主权抑或数据主权,都体现出国家对信息及相关技术、设备等的管理权和控制权。换言之.在大数据时代,一国对数据的管辖范围不限于数据本身,还包括与之相关的技术、设备,乃至提供技术服务的主体等。⑤当前,网络主权意识逐步提升在中国已被提升到战略高度。相应地,数据主权意识也应被提到与网络主权意识同样的高度。

通过对以上概念的比较分析,可将数据主权概括为,在大数据、云计算背景下,一国对本国的数据及本国国民的跨境数据拥有所有权、控制权、管辖权和使用权,是国家数据主权和个人数据权利的总和,体现为对内的最高数据管控权和对外的数据处理权。

三、国家数据主权面临的威胁和挑战

数据主权的提出是主权国家维护其权威和合法性的必然要求。⑥但鉴于国家间的数据主权博弈、数据的跨境流动、大国的数据霸权和数据处理本身的特征等因素,各国有效行使数据主权的能力相对有限,其存储、管控数据的能力相应弱化,这主要反映在:

(一)国家间的数据主权博弈日益激烈

为争夺数据信息网络的主导权,各国间的数据主权博弈日益加剧。各发达国家相继提出“数据治国”的目标并制定相关发展战略,争取赢得先机。美国率先将大数据提升到国家战略层面,将之视为重要的战略资产。2012年3月,奥巴马政府公布“大数据研究和发展倡议”。美国还确立了基于大数据的信息网络安全战略,其国家创新战略、国家安全战略、国家产业发展战略及国家信息网络安全战略都以大数据为重要依托。不难看出,美国已将大数据研究上升到国家层面,使之成为国家意志,在全球范围内首次将重视大数据的发展写入国家政策。同时,欧洲国家也在战略层面上对大数据备加重视,并已积极进行战略布署。欧盟对科学数据基础设施的投资已超过1亿欧元,并将数据信息化基础设施作为“地平线2020计划”的优先领域之一。

随着大数据的重要性日益凸显,各国的数据资源竞争愈发激烈,数据主权成为各方争夺的焦点。2000年12月,美国商业部与欧盟签署《安全港协议》,该协议规定,美国公司在从其欧盟附属公司传输数据时,将受到特定限制。按协议要求,收集个人数据的企业必须通知本人其数据被收集,并告知数据处理的结果。企业必须得到允许才能把信息传递给第三方,必须允许个人访问被收集的数据,并保证数据的真实性和安全性。同时,双方应采取措施,确保这些条款得到遵从。“9·11”事件后,为防范恐怖主义,美国总统小布什(George W.Bush)签署了《爱国者法案》。该法案扩大了美国联邦政府搜集和分析全球民众私人数据信息的权力,间接扩张了美国警察机关的权限,警察机关可搜索电话、电子邮件通讯、医疗、财务和其他种类的记录等。⑤美国情报机构还可直接进入微软、雅虎、谷歌等互联网公司的服务器和数据库,以获取欧洲数据中心的数据。虽然《爱国者法案》与之前签署的《安全港协议》存在较大分歧和矛盾,但美国认为,《安全港协议》的法律效力不及前者,因此它并未受此项协议的束缚,仍随意调取9家互联网公司的数据信息。①针对美国的行为,2012年欧盟委员会要求改革数据保护法规,以期对欧盟境内的所有云服务提供者和社交网络拥有直接的管理权。

随着“棱镜门事件”的持续发酵,欧盟、俄罗斯等不断加强数据法规和政策的制定。德国总理默克尔表示,欧洲互联网公司应当将相关数据的流动情况告知欧洲,如果与美国情报部门分享数据,首先必须经过欧洲人的同意和认可;德国本国公民的数据行为须遵守德国的法律。③2014年3月,欧盟议会高票通过《欧盟个人数据保护条例(草案)》,促进了欧盟数字统一市场的形成。俄罗斯也依靠立法限制数据流动的范围,提高数据控制力。俄罗斯议会于2014年7月通过的《个人数据法》规定,俄罗斯公民的个人数据必须保存在俄境内的服务器上。④

由此不难发现,欧洲国家在数据控制中处于劣势,其争夺数据主权的意愿更为强烈,而美国在网络空间和数据控制中总体上占据优势,但其控制数据的欲望不会减弱。今后对数据的占有和利用将成为大国间竞争和博弈的重要领域。

(二)数据跨境流动对国家数据主权形成冲击

数据主权提出的前提是数据的跨境流通。联合国跨国公司中心对跨境数据流动的界定是:对储存在计算机中的机器可读的数据进行跨越国界的处理、存储和检索。一般而言,跨境数据流动可分为两类:一类是跨越国界的数据传输和处理;另一类是数据即使没有跨越国界,也被第三国的主体访问。由于数据的跨境流动,数据主权的维护面临更多难题。

第一,数据跨境流动涉及不同的主体,各主体的管辖权交叉重叠。在大数据时代,数据流动至少涉及信息的创造者、接收者和使用者,信息的发送地、运送地及目的地,信息基础设施的所在地,信息服务提供商的国籍及经营的所在地等。⑤信息的创造者、接收者和使用者在采取跨境数据行为时,均主张对己方有利的数据信息主权,这势必形成主权的交互重叠甚至冲突。

第二,关于云计算、云存储中数据的主权归属争议很大。当前,数据处理和存储设备由固定的硬件系统转变为“云”,即由网络为数据的计算和存储提供资源和服务。跨国公司,如谷歌、亚马逊、苹果、英特尔、国际商业机器公司,国内公司,如阿里巴巴和百度,都提供了云服务产品。而就这些云计算、云存储中的数据属于哪家公司或哪个国家,国际上争议很大。同时,出于满足客户需要和降低成本的考虑,网络公司往往将其提供的服务部分外包,因此经常会出现这样的结果:不同的国家同时管控同一条数据。例如,A国采集的数据存储在B国C公司的数据中心,B国C公司又将数据服务外包给D国,而该数据最终被E国的用户使用。在如此情境下,各国数据主权该如何主张?倘若出现纠纷,各国数据主权又当如何维护?依据哪个国家的法律进行维权?

第三,国际上未曾制定跨国数据流动的相关规则,数据主权纠纷频发。当下,国际社会并未对各国数据主权的管控范围予以划定,数据主权在国际法的制定中尚属空白。数据在无政府状态下运行,各国基于理性自保的需要,积极加强对本国数据的管控和支持本国国民在他国的数据主权主张,这必然导致主权交叉重叠的管辖状况。同时,在多重管辖权的情形下,将会出现服务提供商挑选法律的现象,致使网络服务商通过信息转移逃避对数据保护的国内规制,①从而加剧数据管控的复杂性。

(三)数据霸权加剧大国对他国数据主权的侵犯

在信息化、数字化和全球化发展的大背景下,出现数据强国与其他国家之间权力不平等的态势,数据强国竭力实行数据垄断,谋求数据霸权。“数据主权”的提出反映了各国对大国滥用权力进行限制及维护本国主权的现实要求。

借助于国际互联网、大众传媒等信息生产和流动平台的辐射,美国霸权在全球范围内迅速扩展。这种不对称的信息和数据流动所产生的吸引力和影响力,增强了美国的力量,扩大了它的影响,在美国的全球战略中发挥了其硬实力无法起到的作用。如今,美国凭借其各大网络数据公司的力量,再次站到了大数据创新的潮头浪尖。据2012年12月国际数据公司对“数字地球”分布所作的统计,各国在“数字地球”中的占比分别为:美国32%,西欧总和32%,中国13%,印度4%,其他国家19%。从中可见,美国占有全球数据的1/3,具有绝对优势。①

美国不仅占据数据强国的地位,而且利用自身优势,不遗余力地推行数据霸权政策。早在小布什执政时期,美国即通过监听电话获得个人数据;奥巴马政府时期,则通过网络和卫星等技术优势攫取境内外数据,严重侵犯他国的数据主权与安全。美国于“9. 11”事件后出台《爱国者法案》,不但通过国内立法实现其对域外数据的控制,还借助国家安全部门收集并分析他国所管辖的数据。“棱镜门”事件是美国安全部门窃取他国数据信息的强有力证据。斯诺登曾向媒体爆料,美国政府通过棱镜项目直接从微软、谷歌、雅虎等9家公司的服务器中收集信息,窃取了包括苹果手机在内的所有主流智能手机的用户数据,包括电子邮件、通讯信息、网络搜索信息等。②同时,美国利用间谍软件和加密技术进行监控的情形也屡见不鲜。2014年,《纽约时报》曾披露,全球10万台计算机都在美国的监控范围内,美国国家安全局是通过间谍软件“量子”实施监控的。③美国还牢牢掌控着“云”端的数据信息。当前,全球实力最强的云处理服务都由诸如谷歌、微软、亚马逊和脸谱等美国的互联网公司提供。按照《爱国者法案》的规定,无论是不是美国公民,只要在美国互联网公司提供的“云”中存储数据,美国政府便有权对该数据进行收集和处理。美国的网络霸权地位为其数据强权的扩张提供了保障,数据霸权是美国网络霸权的深化与延展。

(四)数据处理的特征弱化数据主权的维护

与传统方式相比,大数据和云时代的数据处理所具有的新特点,弱化了国家对数据主权的维护。

第一,数据量的巨大使国家难以对数据实行管控。云时代数据量的庞杂令数据在跨境传输时被泄露和窃取的情况屡有发生;此外,一国不可能完全掌控本国的数据,但其若承认自己的掌控能力有限,即等于对不完全主权的承认。

第二,大数据以复杂关联的数据网络形式存在,使国家难以控制数据。数据的共性、网络的整体特征隐藏在数据网络中,而网络空间所具有的去中心化和全球可进人性、网络交流的交互性和随时性、互联网的设计结构和包转换机制都导致信息难以定向拦截。①由于互联网地址和物理地址无法一一对应,因而在网络空间中,不仅主权国家难以知晓数据是否在跨境传输,即便信息数据传输者本人可能也并不知晓。

第三,国家在数据主权管控与数据的跨界流动之间进退维谷。数据的适度开放和跨境流动有助于各国间的友好交流和经贸往来,这也是各国积极倡导制定大数据战略的重要原因。而大数据的独立性和开放性逐步侵蚀国家主权的有形和无形疆界,致使主权国家的地理边疆在数据流动中日渐虚化。随着云技术的推广,数据流动在技术层面得到空前扩展,数据流动的速度远远超出主权国家数据管控技术和制度的更新速度。如何管控数据的跨境流动,使之既不损害国家主权又不妨碍国际合作,是摆在各国面前的两难问题。

结语

大数据是一把“双刃剑”,其蕴含的战略价值已为各国所重视,但国家数据主权又遭受着多重威胁和挑战。当前,人口数量位居全球第一,用户群体如此庞大,数据应用市场复杂多变,使中国成为世界上数据储量最丰富的国家,也令中国的数据主权和安全面临巨大的冲击。如何在充分、有效地运用大数据的同时,捍卫中国的数据主权,是摆在我们面前的一个亟待解决的问题。首先,要制定国家数据战略。2015年8月19日,国务院常务会议通过了《关于促进大数据发展的行动纲要》,这意味着促进大数据发展正式成为国家的行动方略,但仍需进一步辅之以相应的制度安排和法律规范:其次,要提高核心数据控制能力。由于西方大国长期掌控互联网的实际管理权,中国应健全大数据综合安全保障体系和提高数据的独立性,以此实现对核心数据的控制。再次,要实现数据自由流通与数据跨境管控之间的合理平衡。对有益于国际交往合作的数据应鼓励积极流通、不受限制,而对危害国家主权、安全,侵害个人数据权利的数据跨境流动则当严格管控。

(作者简介:国防科学技术大学国际问题研究中心研究员;人文与社会科学学院讲师,博士,长沙,410074)

收稿日期:2015年11月

(责任编辑:赵裴)