京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的难解悖论:隐私与货币化何以两全?
人生的乐趣在于不确定性。如果大数据作为一种技术,(数据分析师)在未来统治了人们的工作和生活,那么我们每个人将都是赤身裸体的连皮肤可能都要是失去了!我们将进入一个确定的、可预测的世界。这是我在昨天参加完百度BIG Talk第三期《大数据开启大未来》的科技对话活动之后,最为直接的想法。来自美国的彭特兰教授是这次对话的灵魂人物,此君名声在外,不只是因为他自己自 身是MIT媒体实验室的负责人,在大数据领域属于一流的学者,他的学生也都是人中翘楚,其中就包括谷歌眼镜的发明人。
去之前,稍微做了点功课。因为我始终对大数据技术那种宣称的无所不能持有怀疑和谨慎的态度。因为我认为过度的技术浸入人类的生活和工作,并非完全利 好。尤其可穿戴产品,人类的所思所想所行,都变得越来越透明。以至于很多商人在欢呼,传统的消费者行为学理论终于可以寿终正寝,在他们看来,作为消费者的 我们不再是黑盒子。
因此,我比较关注彭特兰教授有关隐私方面的演讲。因为在大数据统治的数字化社会,我并不认为做一名数字透明化的顾客会是多么幸福的事情。
彭特兰教授在演讲中提到的一个观点,我认为值得整个社会深思,他说我们不应该把个人的数据交给一个以盈利为目的的商业公司。在彭特兰教授的观点中,他认为作为个人而言,在大数据时代,应该具有四种权力:
1)被通知权:能够明确的知晓自己的数据在何时、何地、以何种方式会被采集
2)知情同意权:个人明确的知道数据将会被如何利用,并且必须经由本人同意
3)审核:在这里主要是指政府法律机构负责审核
4)撤销权:个人随时可以销毁自己的个人数据资产。
通俗的说,就是彭特兰教授称之为“数据上的新决议”三原则:你有权利拥有你的数据、你有权利掌握数据的使用、你有权利摧毁或者贡献你的数据。
所以在他的解决方案中,他提出了一个可信网络的概念,借用的是SWIFT(环球银行电信协会)在全球银行间建设的银行间通信和实时清算系统。同时, 他还提出了一个“开放个人数据商店”的模型,"数据分析师"在这个模型中,这是一个唯一的存储个人数据的地方,在面对外部访问请求的时候,给出的最终答案,而不是数据本 身。
当然,运营和管理这样的一个个人数据商店,并非简单和容易的事情,尤其是在全世界范围内统一起来更是几无可能。在这里面既涉及到各国政府管理和服务 本国公民的问题,也涉及到全球的国际公司巨头们的巨大商业利益问题。所以笔者对彭特兰教授的这个开放个人数据商店能否真正解决个人的数据隐私保护持有保留态度。
教授的理想是个人的数据资产不能交给商业公司。
但是冷酷的现实则是,除了商业公司对我们的个人数据资产抱有浓厚的兴趣之外,恐怕很难找到一个跳出五行外不在佛门中的人和机构,对此持有持续的兴趣和动力。(当然,政府机构也对此抱有极强的兴趣,但是那是另外一回事)
所以对于个人而言,更为现实的问题,则是如何合理的货币化自己的个人数据资产的问题。这一点,彭特兰教授在演讲中,也有提及。他指出,建立一种机制,鼓励人们分享和贡献数据,既能给自己,也能给他人和整个社会带来好处。
对此,我深表同意。比如如果每个司机人都愿意实时的分享自己驾驶车辆的速度、位置、刹车、加速的情况,这样整个城市的路网,都实现了动态的监控和运营,或许对于改善所有司机的出行效率都有好处。
但是重要的问题是,要有足够的经济激励,刺激个人在信任安全可靠的前提下,有意愿分享自己的数据。显然,有机构或者组织愿意直接出资购买个人的这些数据是一种最为直接的商业模式,但是在现实生活中,第三方付费的模式则更为普遍。
不过有次带来的新问题则是,如果人们知道自己的数据能够给自己带来收益,则可能会影响其有意识的偏离正常的行为模式,从而使得数据的真实性又产生新的问题。这一点,其实在目前互联网世界中,第三方付费的商业模式中,案例比比皆是,虚假繁荣的数据由利益而生。
不过,有激励的机制,显然整体绩效要高于没有激励的机制,这一点,我认为是大数据时代,如果向获得完整和真实的数据,所必须考虑的一点。
目前来了,大数据的出现还主要是为了提高生产力,提高营销的效果,改善我们的交通、环境、健康、城市的境况。但是随着生物科技、信息通信技术的发 展,物联网、互联网的融合发展,我们的世界或许将不可避免的进入一个“全数据化”的世界——在这样的世界,任何不可数据化的东西,都将与不存在一样。
在这样的世界,将是由大数据统治的世界,每一个人都是一串二进制编码,透明而简单,一切都是确定的,都是可预测的,都是按部就班的,你喜欢吗?反正我不喜欢,没有不确定性的人生能有多大意思呢?数据分析师
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29