
大数据开放面对的瓶颈究竟是什么
大数据无影无形却又无所不在,这个听起来冰冷的词汇,如今已经被商机包围。你上网搜索的关键词、你网上购物的记录,你在社交平台分享的消息,你去超市买口香糖的频次,甚至你在八达岭高速上拨出的一个电话,可能都极具“价值”,成为别人洽谈桌上的筹码。
被“窥视”的无奈
对于许多在网上购物的顾客来说,总能在网页上看到与他们浏览记录相似的产品广告, 这似乎让数据变得贴心起来,但大家也逐渐意识到这并不是巧合。网络浏览记录、交易记录、手机通话记录、收发邮件 记录、社交网络记录,你在网络上的每一个“足迹”都会以数据的形式记录并存储下来,它们精准、事无巨细。
不可否认,大数据为监测和预示人们的生活提供了极大的方便,然而个人隐私也随之暴露在无形的“第三只眼”之下。无论是电子商务、搜索引擎还是微博、微信等互联网服务商都对用户行为数据进行挖掘和分析,以获得商业利益,这一过程不可避免地威胁到普通人的隐私。大数据有可能是大机会、大发展、大创新,也可能是大危机、大破坏、大淘汰。
一直以来,大家普遍认为,只要我们在网络中匿名就可以避免个人信息的泄露,但是大数据告诉我们,数据的交叉检验会使得匿名化失效。我们的隐私数据每天被记录,随时有可能被泄露。
“用户在使用微信的时候,免费使用并打开一些关联链接,但是平台拿到了你的信息并窥视了你的隐私,这代表我们享受了这种服务就牺牲了隐私,由于我国法律并没有对数据使用进行相关约束,也没有信用评估的机构进行监管,使得目前很多数据使用还游走在法律的边缘,数据拥有者如何用它、用到什么程度,没有清晰的界定,有触碰隐私的交易也没办法干涉。”中国联通网络技术研究院首席专家唐雄燕告诉记者。
当数据交易还处在不成熟时期时,哪些领域更应该注重数据隐私的保护和规避?大数据产业联盟会长董力明告诉《经济》记者,交易数据获取收益,就有可能涉及个人隐私,比如说在互联网广告领域。“这时就要做数据脱敏以保护隐私,目前在贵州建立的大数据交易所,更多的是和政府相关的数据,这就必然要对数据进行脱敏。”
目前,比较成熟的数据交易方式是通过数据报表交易,报表不涉及隐私,反映的是社会、产业、消费者群体的趋势,隐私数据不能开放不代表不能有数据生态,脱敏后的数据能够流通起来并创造很高的社会效益。
对此,唐雄燕也表示认同,他认为,个人数据最小,但是也最敏感。数据脱敏会把敏感信息进行编码,让这个编码代表唯一的一个人,但又不与他人重复。
追逐利益不能违反规则
作为掌握诸多数据的运营商、企业,如果深入挖掘这些数据,带来的收益非常可观,基于企业、运营商等对数据交易的需求,除去一些非法交易,数据交易今后怎么做?
唐雄燕表示,“由于行业壁垒重、法律不健全以及涉及顾客隐私,现阶段很多的数据还不能轻易进行交易。大家也在探索,作为运营商首先会考虑今后交易一些统计性数据。”
当国内一些大数据领域的互联网公司在数据交易上违反国家的法律和商业道德时,作为数据平台的专业人士,中金标准数据公司总经理郝文嘉认为,要从国家的层面立法打击,毕竟个人的隐私通过互联网被售卖以获取商业利益,这本身就违反了国家《民法》和《经济法》的规定,“国家立法机关要跟上基层进步的步伐”,在全球,隐私交易行为都是不被允许的,这种行为触碰了商业道德底线,想要建立起平等、公平的市场环境就要遵守规则。
可能有一些掌握信息的商业性机构或是管理机构,不注意数据保密,把信息泄露出去,利用信息去追求商业目的,全国政协委员、中华全国律师协会会长于宁向《经济》记者称,虽然国家在隐私保护法律上能找到相关条款,但在大数据领域涉及隐私保护的法律条文还没有跟上。
信息发达和发展带来新变化,这也引起了国家立法机构的重视,《民法》、《刑法》也渐渐地开始体现对隐私的保护,专家学者在反映,法律也在创制、调整,但是具体涉及国家立法的计划,还需要人大常委会的立法机构和法律专业人士进行引领和商讨。
但董力明认为,对某个领域如果监管太多,可能会抑制其活力。
就算利用法律去强制控制,法律和规则有的时候也难以规定得太过具体,所以中间肯定会存在灰色地带,唐雄燕表示,大数据在运营的过程中,“一些问题可能会随着时间逐步显现并规范,大家会形成共识,在一些问题还没显现的时候,不能先出现法律去遏制它的发展。目前的数据交易的平台也在尝试发现问题的过程中,然后去改善。”
别让政策阻碍了数据开放
数据只有连接起来才能创造价值,那么大数据市场真的得到开放了吗?董力明认为,离真正的数据开放还有很远的路要走,“美国和英国数据开放的第一步是跟生物相关的数据,政府希望通过开放这些数据,来增加社会效益,但是在与企业有关的数据上,大多数企业还保持谨慎态度,因为这是数据资产,不可能轻易地开放出来。另外与人相关的数据涉及隐私保护这个敏感地带,所以更是难以得到开放的。”目前社会上开放的,往往是与宏观、经济、政府的一些公共部门,比如说天气、地质相关的数据,这些数据不涉及如军事等相关的敏感信息。
如果技术不是阻碍大数据发展的瓶颈,那还有什么遏制了它的发展?数据开放面对的瓶颈究竟是什么?中国通讯协会常务副理事长兼秘书长张新生说,“是政策上的”,如果不把对各层面利益的分配架构打好,数据开放还是较为漫长的过程,但是也不要把政策看得太重,不盈利也要将大数据做起来。他表示,“别期望政府走在前面,这会遏制创新和产业的快速发展,企业要先动起来,探索的过程永远是未知大于已知。”
那么,数据的把控权利移交政府会否对数据安全有更好的把控?“我觉得政府很难完全控制大数据,只是能够制定一些规则,只有商业机构更清楚地知道数据的价值,政府主要还是保护数据的安全。”唐雄燕说。
大数据并不神秘,但是在国内这种环境下,真正运用大数据的很少,它还面临着认识和能力上的问题。郝文嘉说:“每一种数据都是有缺陷的,因为数据来源于互联网,同时互联网数据的发布也是海量的,这就会存在一些数据发布的参数、量质不符合应用和计算的状况,数据的价值有缺陷就影响发挥,这是任何行业都不可避免的,所以盲目地去相信大数据也不对,正是由于大数据的缺陷性,数据公司就更要努力把缺陷补足。”
目前这个阶段,还处于大数据发展的初级阶段,郝文嘉还认为,经过数据平台对数据的不断补足,对社会数据应用的提高,这个过程中,数据积累到一定程度达到成熟,就会推动整个社会成指数型进步,这也是走向人工智能化的一个基础。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29