数据交易与数据价值挖掘
在数字经济时代,大数据的广泛采集和应用对人类的生活方式、城市管理、企业运营实现了全方位、智能化的重构。作为核心经济资源,数据蕴涵的经济价值无限巨大、前景无限光明。但是,真正实现数字经济的内涵价值,需要洞察数据交易和数据价值挖掘的深刻关联,完成从数字资源到数字资产和数字资本的历史性飞跃。
数据资源只有通过流通和交易才能转化为数字资产
很多人认为,没有数据买卖我们也在天天使用数据,数据依然具有使用价值,为什么一定要推动数据流通和交易呢。
回答这个问题,我想先讲个小故事。
90年代中期,我曾在国家财政部工作,集体宿舍在公主坟。当时中国还没有房地产市场,企业和公务员房屋都是分配的,每个月的租金很便宜,但也没有产权。那时中国城市家庭的主要资产基本上只有储蓄存款,一般只有几万元到几十万元。到了美国留学之后,我看到耶鲁大学教授的房子都是几十万美元的价格,心想这么贵的房子中国人什么时候才买的起啊,估计这辈子都买不起。但是,98年之后,中国政府开启了房地产改革,单位和企业不再分配房子,原有的房屋明确产权后,成为个人房产,同时建立了房地产市场进行交易,巨大的资产价值一下子就被市场挖掘出来。现在只要在北京的三环以内有套公寓,动则就价值数百万甚至千万,回头再看耶鲁教授的房子,其实很便宜,北京中产家庭的房产价值已经远居其上。
这种价值挖掘带来的变化难以想象,影响极其深远。通过核心要素改革,中国家庭的资产和财富一下子就跃居世界前列,颠覆了中产家庭的全部生活方式。
仔细想想,这种巨大的变化不是五加二、白加黑干出来的,而是通过经济要素市场改革释放出的巨大能量。
其原理很简单,即通过确权加交易,把一种只有使用价值而没有财富价值的房屋资源,变成家庭可以分配变现的财富资产,进而通过金融创新,提供房屋抵押贷款等金融产品,把这种财富资产变成可以用于企业经营和生活投资的生产性资本。正是这种要素市场的改革,铸就了中国经济成长巨大的推动力。
同理,当前数据作为一种核心要素资源,虽然具有普遍的使用价值,但资产属性还没有充分体现。
只有实现确权、流通和交易后,数据资源才会转变成可以量化的数字资产,进一步通过金融创新,上升为生产性的数字资本,真正释放其内在价值。
从原始数字资源、到数字资产、再到数字资本的不断演进过程,是数字经济发展的核心目标,将为未来中国经济增长提供强大的资本来源,推动真正的供给侧改革。
理论上讲,数据交易完全可以在个人之间、企业之间一对一进行,程序上更加简便,不需要通过第三方的平台。
但我们相信,大规模、常态化的数据交易需要通过专业平台进行,这是更加经济理性的选择,有几方面原因:
一是通过交易平台可以增加互信,提高交易的成功率。这就像在陌生人之间进行的私下房屋交易,以及90年代在中关村大街上买到的盗版光盘一样,虽然便捷,但具有巨大的交易风险。数据交易平台可以为数据的售买双方起到风险隔离的作用,通过专业合规平台进行的数据交易更容易得到法律保护,交易的争端也更容易得到解决。
二是降低交易成本,缩短交易时间。就像房屋出租和买卖,虽然个人之间也有可能进行零星的直接交易,但是搜索和交易成本很高,像链家与我爱我家这样的房屋中介,通过为售买双方提供信息撮合服务,大大减少了搜索的时间,提高了房屋租售的效率。同理,数据交易平台可以通过交易前后提供标准化合同和标准化服务,降低交易双方的沟通成本,通过对数据的清洗、脱敏、加工,提升其市场价值。
三是有利于强化对核心资源的管理,提高社会的公共福利水平。数据和信息已经成为社会的核心经济资源,必须要保证成本低廉,才能降低整个社会的经济运行成本。数据交易不应以买卖的差价和销售的利润大小为经营目标,如果任由少数企业垄断数据价格,将会导致整个社会的经济效率降低,社会总体福利下降。早在春秋时期,齐国管仲就曾主张像盐铁等社会资源行业,不应私相买售,应该建立“官山海”等专营机构进行管理。同理,主导数据交易的平台,应兼顾经济属性和社会属性,由具有公信力和公益性的机构管理,同时加大和互联网企业的技术合作,降低数据和信息的交易成本,扩大数据价值挖掘的受益人群。
当前数据交易平台发展的现状及挑战
近年来随着大数据的广泛普及和应用,数据资源的价值逐步得到重视和认可,数据交易需求也在不断增加。2015年8月,国务院印发《促进大数据发展行动纲要》,明确提出“要引导培育大数据交易市场,开展面向应用的数据交易市场试点,探索开展大数据衍生产品交易,鼓励产业链各环节的市场主体进行数据交换和交易,促进数据资源流通,建立健全数据资源交易机制和定价机制,规范交易行为等一系列健全市场发展机制的思路与举措”,由此拉开了国内大数据交易平台建设的序幕。
从近年来的发展情况看,主要呈现如下特点:
一是平台设立速度较快,但商业运营相对滞后。普遍存在“两重两轻”现象,即:重设立、重宣传、轻经营、轻实用。
二是数据来源多样,但有效数据汇聚难度较大。国内大数据交易平台通过政府开放共享、数据所有者对外发布、互联网爬取等渠道,获取了教育、环境、法律、医疗、交通、商业、工业等多方面数据。但是,依然存在政务数据有效供给不足、网络获取渠道收窄、数据割据现象严重等问题,从而导致平台经营受限。
三是交易模式多样,但高价值产品仍然缺乏。各平台对居间撮合、数据经纪、数据销售等交易模式进行了积极探索,但大多通过API调用或数据包销售等提供数据下载、查询、验证等基础服务,而数据定制、分析决策、综合方案等“精加工”增值产品相对匮乏,更鲜有联合建模等创新类应用产品。
这些数据交易平台按照发起建设方的不同,主要可以分为以下四种类型:
政府主导型。自2015年初贵阳大数据交易所成立以来,多地政府纷纷牵头建设大数据交易平台(交易所、交易中心、交易公司),目前已达20多个,成为国内大数据交易平台的主力军。平台坚持“政府指导、企业参与、国有控股、市场运营”的原则,多由地方国企作为控股股东或第一大股东联合相关大数据公司设立,实行严格的会员制度。
产业联盟主导型。主要包括中国大数据产业生态联盟、中关村大数据产业联盟、上海大数据联盟,以及交通、金融等行业性大数据交易平台。通过打通产业链上数据资源,为联盟成员及相关方提供优质、快捷、精准、低价的数据服务,在数据资源流通交易中发挥着重要作用。平台大多属于开放的第三方数据网上商城,本身不存储和分析数据,仅对数据进行必要的脱敏、清洗、审核和安全测试,通过API接口提供数据交易服务。
数据服务商主导型。主要是自身拥有大量数据资源或具备数据技术优势的数据服务商,如数据堂、数据宝、发源地、九次方、天眼查、企查查、天元数据等,以专业性、优质性、实用性为主要特征,实行大数据“采产销”一体化运营,兼具数据供应商、代理商、服务商、需求方等多重身份。
互联网企业主导型。主要依托国内大型互联网公司设立,如京东万象数据服务商城、百度智能云服务平台、阿里数据服务平台等,利用先进互联网技术,采集、挖掘、存储、开发公司生态体系内外的数据,服务内部业务发展和外部用户。随着智能化技术的开发应用,数据的开发、共享、交换、流通将成趋势,数据交易将成为挖掘数据价值的重要驱动力。尽管市场对海量且瞬息万变的大数据已经有了相当的实际需求,但受制于数据权属界定、估值定价和资源投入等方面难题,我国大数据交易还处于起步探索阶段,面临众多挑战:
权属界定不清,交易成本上升。数据合规交易的基础是清晰的产权归属,但数据所有权拥有者是产生数据的个人还是记录数据的企业,业界、学界和司法界莫衷一是,而以所有权为基础的使用权、处置权等更难以界定。此外,2017年发布的《中华人民共和国网络安全法》和《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》,在加大对个人信息侵犯打击力度的同时,明确了数据交易环节再次授权、个人数据匿名化处理两个标准,进而增加了数据交易成本。
产品估值较难,技术创新不足。鉴于数据属于新型生产要素,针对数据品类、完整性、精确性、时效性、稀缺性等价格影响因子的研究尚不成熟,且可参照的历史公开交易规模较小,未能形成统一的定价标准。与此同时,现有平台在数据安全保障、权属界定、价值挖掘、创新应用等核心领域,应用AI、区块链、联邦学习、多方安全计算等先进技术创新依然不足,无法满足多样化的现实需求,导致“脱媒”交易现象严重。
平台投入不足,综合实力较弱。国内大数据交易平台普遍存在资金投入少、专业人才少、经营经验少等问题,据调查,大多数平台公司注册资本金在1,000-6,000万元之间,数据来源较为单一且股东普遍缺乏数据交易经验,很难凭借自身实力打通数据资源、开展高频交易、支撑平台发展。
破解大数据交易难题的方向和思路
1、通过建立数据托管平台和完善信托契约,划分数据资产的所有权、使用权、管理权、收益权
现在互联网企业采集的个人行为与企业经营数据,其所有权是属于数据主体还是属于采集平台呢?
很多人对这个问题的认识并不一致。其实,我们可以举个小例子帮助理解。
例如,一个房地产开发商,在房子建成出售给客户之后,是否可以指令小区的物业机构,在公寓门口记录每一家的人数、上下班的时间,男女主人的着装偏好和订购快递的品种,然后利用预先索取的身份信息,进行组合,卖给社区周边的商家进行牟利呢?这样的行为肯定是违规的。虽然小区的物业人员对住户家庭情况进行个人判断无可厚非,但是制作成数据商品进行商业化牟利就要有严格的授权和相应的资质了。
同理,如果房地产商不能随意销售住户的信息,互联网平台也不应允许随意销售客户的数据。 互联网上产生的行为数据,其所有权依然是客户的,如果互联网平台根据这些数据进行客户画像,开展商业化的应用或出售给第三方,就要同时具备明确的授权和必要的资质。
如果数据的所有权是属于客户主体的,那如何才能进行合理的开发使用和价值挖掘呢?
实际上,只要有制度支持,资产的所有权、使用权、管理权、收益权可以在主体授权或法律许可的基础上适当分离,这种事例并不鲜见。例如,托管银行对个人投资者在基金和证券领域的投资进行托管,保证投资机构对资金的使用合法合规,托管合同明确了所有权、使用权和管理权的划分。与此类似,信托公司的主要业务是“受人之托,代客理财”,通过金融的工具设计,将资金的使用权和收益权进行成功分离。因此,通过数据托管和交易平台的制度设计,数据的权属完全能够进行明确的区分。具有合格资质的受托人可以对数据资产进行开发利用,所得的收益根据预先约定的契约,在所有者和挖掘者之间合理分配,这将为数据价值的挖掘开辟广阔的空间。
2、通过完善上市审核流程和分级分层交易体系,保证数据交易主体和交易流程的合法与合规性。
目前,大部分交易平台对于数据交易的模式是“农贸市场”模式。这类交易模式非常粗放,为了在短期内扩大交易规模,对上市的数据和购买数据方都缺乏尽调审核,数据定价、数据确权等难题没有制度性的破解,存在较大的合规风险。 虽然名称多为交易所或交易中心,但实际上更像“农贸市场”。未来的数据交易,应该从松散管理的“农贸市场”模式向合规管理的交易所模式转变,实现数据“上市有审核、采买有资质”。
首先要对数据源的合法性进行审核,重点关注数据采集时是否具有数据主体的授权,或上位法规是否对数据采集行为有许可。数据上市之前,数据提供方需要出具合规承诺,数据法律服务机构和投资服务机构应进行合规性审核,并提供必要的上市指导。建立实名注册的会员制,对数据交易参与主体的买售资质进行评估。
其次,根据敏感度对数据进行分级分类,按照数据不同性质采取多种交易模式。这就像证券市场根据投资风险的适配能力,分为主版、中小版、新三版一样,设定了不同的投资者准入门槛。针对不同敏感度的数据,也要保证购买的机构具有相应的使用资质。常规开放的公共数据和明文交易的数据可以面向一般的商贸类企业便捷提供;特定领域数据,如金融财税数据则面向商业银行等金融机构合规提供;高价值个人数据只能向具备公信力和相关特定资质的持牌机构如个人征信机构审慎提供。
最后,要加强售后的管理。数据交易完成之后,购买方要根据合同约定的使用范围进行使用,不能擅自复制扩散转售数据进行商业牟利。因此,数据的售后使用要建立台帐记录,定期披露,并由独立的专业机构进行审计。
在数据交易过程中,一家企业既可能是数据的购买方,也可能是数据的提供方。
例如,经过监管部门准入审批的全国性个人征信机构具有较高的应用资质,可以通过交易平台购买互联网企业采集的个人行为数据,并对客户进行信用画像,然后做成数据征信产品合规提供给金融机构,提高授信放贷的效率和精准度。在这个过程中,交易平台发挥了“风险防火墙”的作用。一方面可以填补监管部门要求数据“断直联”之后,数据采集机构和银行放贷机构之间产生的数据鸿沟,满足普惠金融机构助贷的痛点需求;另一方面,通过交易市场进行风险隔离,持牌征信机构可以避免针对每一个数据来源,都花费大量经济资源独自审核所有数据的合法性,并避免承担数据交易产生纠纷之后的机构声誉风险。
从这个意义上讲,由交易市场作为数据信息中介,是比由持牌机构作为信息中介更为安全经济的选择。二者的有机结合,将会构建更为完善的数据交易体系。
3、通过预先授权、数据脱敏和隐私加密技术,保护个人隐私和高价值数据的所有权
首先,数据的采集一定要合法,遵循“合法授权”、“最简够用”的原则。对个人数据的采集要告知客户主体,并明确采集的目的和范围,不能捆绑式、垄断式授权,或者用晦涩难懂的法律文书和停止服务的霸权条款来诱导、强迫客户签订授权协议。授权的范围一定要和服务功能相匹配,不应要求和业务功能无关的隐私数据。对个人生物特征和生活行为数据的采集和识别要特别审慎,必须要有上位法的支持。
其次,在交易中尽量不提供与数据个人主体强关联的原始数据。除了具有法律要求和少量专业持牌机构之外,大部分出售的数据应该经过脱敏处理,降低和个人身份的强耦合关联,尽量进行代码化、指标化处理,同时控制模型风险,保持数据标签使用的有效性和隐私保护的合理平衡。
最后,针对一些高度敏感的高价值数据,应该发展安全可靠的隐私加密技术,包括以联邦学习、差分分析为代表的明文加密技术,以多方安全计算为代表的密码学加密技术,和以可信执行环境为代表的硬件加密技术。
通过隐私加密计算技术推动高价值数据进场交易,将数据的所有权与使用权分离,权属主体保留数据所用权,交易过程中仅交易使用权。在保护数据不对外泄露的前提下,实现“数据可用不可见,用途可控可计量”,交易平台为供需双方提供可信的数据融合计算环境。在这个方面,要注意综合考虑计算成本和加密需求的平衡,并不是所有的敏感数据都需要复杂的加密处理,这只是交易模式中的一种选择。
4、通过完善法律制度、监管规则、处罚机制,确保数据公平、公正交易。
首先,需要构建全面平衡的交易法规体系。
目前,各国都在制定数据的保护法规,对数据的管理和使用进行严格的限定。但是,我们要认识到,对数据权属的保护要有全面准确的理解,不可偏颇,法规不仅要保护数据的所有权,也要保护使用权和收益权。房地产市场就是很好的例证,我们不能光保护房屋的出售方,也要保护房屋的购买者,建立明晰的产权登记体系,房产才能有序的流动交易。数据立法也一样,如果片面强调所有者权利和严格限制使用范围,有可能会抑制数据参与方的交易意愿和市场应用创新,相关的法规制度应该全面且平衡。
第二,应完善对交易流程进行监管的基本规则。
这些交易规则必须是公开透明的,被交易参与各方所理解和接受,并在过程中严格执行。监管规则实施初期不可避免要制定一些“一刀切”的要求,但后期随着市场发展,相应规则应与时俱进,适应数据交易模式的创新和交易规模的增长。
三是对交易违规行为应该加大处罚力度,厘清各方责任。
如果是数据来源违法,应对数据提供方严厉处罚,严重者实施市场禁入;如果是中介机构尽职调查不严,应该进行市场公示,视情节严重进行停业处罚;如果是数据售后使用过程违规,应该处罚数据购买方,并及时进行社会披露。但这些处罚只针对责任方,不牵连其他交易方。权责明晰之后才能防止道德风险,实现市场的优胜劣汰。
通过对上述问题进行讨论,我们认识到数据价值挖掘和交易创新虽然挑战众多,但前景广阔。
在可以预期的未来,我们将看到在数字交易领域一系列新技术得以推广应用,包括非同质化数据标识与跟踪,边缘计算、隐私加密、区块链与智能合约的执行与记录等新技术。我们也会看到一系列金融创新蓬勃兴起,从数据资产交易,到抵押杠杆融资,进而实现资产证券化,不断支持社会数字经济实际应用的发展。同时,数字经济发展也会催生一系列新型中介机构诞生,涵盖数据托管、数据审计、数据评估等各个创新领域。
面对这样激动人心的未来,我们要具有风险意识和底线思维,牢记金融创新兴于技术,成于制度,科技创新是“桨”,金融价值观是“舵”,风险管理制度是“压舱石”。一些新技术和新模式可以通过设立试点项目审慎推进,积极争取列入“监管沙箱”,先完善配套法规制度,等成熟之后总结经验,再进行推广。这其实就是中国一直采取的“摸着石头过河”和“特区加试点”的模式,也是中国改革开放四十年取得巨大成功的宝贵经验。
大数据交易的创新探索者--北京国际大数据交易所
伴随首都数字经济发展的提速,特别是“两区”建设的加快推进,北京国际大数据交易所(简称“北数所”)的设立提上日程,并于2021年3月31日正式成立。北数所旨在通过打造数据交易和数据流通的基础设施,发挥市场在数据要素资源配置中的基础性作用,提升数字经济产业发展动力,构建北京新发展格局,努力建设全球数字经济标杆城市。北数所从技术、模式、规则、生态等方面,突出“一新三特色”,着力破解数据交易的痛点,努力打造全国数据交易平台的样板。
1、大力推动数据交易底层技术创新。
针对数据权属界定不清、信息容易泄露等风险,北数所运用隐私加密计算技术,将数据所有权与使用权分离,实现“数据可用不可见,用途可控可计量”,为供需双方提供可信的数据融合计算环境。实践中,利用自主可控的多方安全计算、联邦学习、区块链等技术,可在保护数据不对外泄露的前提下,实现数据的安全互换、联合分析、联合建模等,进而实现数据要素的高效配置和深度利用。
与此同时,应用隐私计算技术,有效限制敏感数据被无限复制,防止数据泄露和滥用,技术上保障数据交易的合法合规,进而弥合“信任鸿沟”,可增强数据的共享意愿,激励数据市场价值挖掘,消除“数据孤岛”。利用区块链技术整合数字身份、价值标定、溯源追踪等能力,为数据主体签发证书,在数据确权登记、访问、分析、计算、交易过程中,将完整操作过程上链存储,保障数据的来源可追溯、内容防篡改、主权可确认、利益可分配。
此外,利用机器学习等智能技术,建立采集、清洗、组织、建模、标签、加工等环节的自动化、智能化数据加工处理能力,进一步提升数据的利用和交易价值。
2、大力打造交易所运营管理三个特色。
一是创新数据交易方式和模式。
北数所从解决数据交易标准化程度低、监管缺失等问题入手,积极创新数据交易模式。首先,严把准入关,通过实行实名注册的会员制,对数据来源进行合规性审核,对数据交易行为进行规范管理,将数据交易从“农贸市场”转变为交易所模式,前者是“随意上架、随意购买”,后者是“上市有审核、购买有资质”。其次,坚持“合法合规、数据安全、技术创新、过程可控”原则,根据敏感度对数据进行分级分类,综合应用免费开放、授权调用、共同建模、联邦学习、加密计算等模式,促进数据融合使用。同时,搭建数据确权、定价的基本框架,分层分级管理数据权属界定和流转,根据行为确权、使用用途和数量频次,对计算结果及数据服务等进行市场化定价,探索从数据、算法定价到收益分配的全生命周期的价格体系,形成覆盖数据全产业链的数据确权框架,构建公平、高效和激励相容的数据价值分配体系。此外,积极推动大数据产业链的创新发展,培育从事数据来源合规审查、数据资产定价、争议仲裁等业务的大数据产业中介机构,建立数据登记、评估、定价、交易跟踪和审计机制,健全管理制度,严格管理程序,确保交易全流程的透明高效运营。
二是建立坚实的规则制度与安全保障。
金融创新兴于技术,成于制度,北数所注重从制度上构建合规安全交易的坚实基础。制定了《北京数据交易服务指南》,围绕数据交易架构、交易标的、交易方式、交易机制、交易安全、服务规范、跨境流动等,制定了数据交易服务细则,作为交易规则的基础。同时,主动做好与监管部门的沟通,在交易所设立、交易规则制定、应用场景拓展等方面全面接受监管部门的管理和指导,并积极争取将数据创新融通应用纳入到“监管沙盒”中,引导和推动数据要素资源在合规前提下的汇聚和融合利用。在构建数据交易市场风险防控体系方面,建立数据安全备案机制和数据市场安全风险预警机制,提升数据安全事件应急响应能力。强化关键领域数字基础设施安全保障,保护专利、数字版权、商业秘密、个人隐私数据。积极研究地方性法规和标准规范,推动数据交易地方性法规和标准规范制定,探索建立大数据资产评估定价、交易规则、标准合约等政策体系,推动城市数据、政务数据、社会数据在合规安全的前提下开展流通交易。
三是打造丰富的数据合作生态。
构建集数据资源、技术支撑、场景应用、交易服务等四位一体的数据流通新生态。作为大数据交易所,关键是发挥数据中介功能,因此,组织成立了北京国际数据交易联盟,让数据开放、应用开放、服务开放等各个环节上的机构都能参与进来。同时,依托北京市金融公共数据专区,发挥政务数据共享融通的示范引领作用,促进形成数据源机构多方参与、高效联动、信息共享的互通机制。在此基础上,综合运用多方安全计算、联邦学习等技术形成安全融合技术体系,搭建数据安全融合基础设施,落地试点场景应用。建立完善市场化数据采集综合体系,整合、统筹面向社会化机构的数据采集和信息报送渠道,降低数据领域新技术、新业务和创新型企业准入门槛,探索建立政府、平台型企业、数据市场主体和个人多方参与、协同共治的新型合作机制。积极探索推动数据跨境流动,试点跨境电商、生物医药、人工智能等领域和企业数据跨境流动,以管得住放得开为原则,建立数据跨境流动试点专区,推动北数所成为我国数据出入境的核心枢纽。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。