京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的隐私与货币化悖论
人生的乐趣在于不确定性。如果大数据作为一种技术,在未来统治了人们的工作和生活,那么我们每个人将都是赤身裸体的连皮肤可能都要是失去了!
我们将进入一个确定的、可预测的世界。这是我在昨天参加完百度BIG Talk第三期《大数据开启大未来》的科技对话活动之后,最为直接的想法。来自美国的彭特兰教授是这次对话的灵魂人物,此君名声在外,不只是因为他自己自身是MIT媒体实验室的负责人,在大数据领域属于一流的学者,他的学生也都是人中翘楚,其中就包括谷歌眼镜的发明人。
去之前,稍微做了点功课。因为我始终对大数据技术那种宣称的无所不能持有怀疑和谨慎的态度。因为我认为过度的技术浸入人类的生活和工作,并非完全利好。尤其可穿戴产品,人类的所思所想所行,都变得越来越透明。以至于很多商人在欢呼,传统的消费者行为学理论终于可以寿终正寝,在他们看来,作为消费者的我们不再是黑盒子。
“个人的数据资产不能交给商业公司”
因此,我比较关注彭特兰教授有关隐私方面的演讲。因为在大数据统治的数字化社会,我并不认为做一名数字透明化的顾客会是多么幸福的事情。
彭特兰教授在演讲中提到的一个观点,我认为值得整个社会深思,他说我们不应该把个人的数据交给一个以盈利为目的的商业公司。在彭特兰教授的观点中,他认为作为个人而言,在大数据时代,应该具有四种权力:
1)被通知权:能够明确的知晓自己的数据在何时、何地、以何种方式会被采集
2)知情同意权:个人明确的知道数据将会被如何利用,并且必须经由本人同意
3)审核:在这里主要是指政府法律机构负责审核
4)撤销权:个人随时可以销毁自己的个人数据资产。通俗的说,就是彭特兰教授称之为“数据上的新决议”三原则:你有权利拥有你的数据、你有权利掌握数据的使用、你有权利摧毁或者贡献你的数据。
所以在他的解决方案中,他提出了一个可信网络的概念,借用的是SWIFT(环球银行电信协会)在全球银行间建设的银行间通信和实时清算系统。同时,他还提出了一个“开放个人数据商店”的模型,在这个模型中,这是一个唯一的存储个人数据的地方,在面对外部访问请求的时候,给出的最终答案,而不是数据本身。
当然,运营和管理这样的一个个人数据商店,并非简单和容易的事情,尤其是在全世界范围内统一起来更是几无可能。在这里面既涉及到各国政府管理和服务本国公民的问题,也涉及到全球的国际公司巨头们的巨大商业利益问题。所以笔者对彭特兰教授的这个开放个人数据商店能否真正解决个人的数据隐私保护持有保留态度。
教授的理想是个人的数据资产不能交给商业公司。
如何合理的货币化自己的个人数据资产
但是冷酷的现实则是,除了商业公司对我们的个人数据资产抱有浓厚的兴趣之外,恐怕很难找到一个跳出五行外不在佛门中的人和机构,对此持有持续的兴趣和动力。(当然,政府机构也对此抱有极强的兴趣,但是那是另外一回事)
所以对于个人而言,更为现实的问题,则是如何合理的货币化自己的个人数据资产的问题。这一点,彭特兰教授在演讲中,也有提及。他指出,建立一种机制,鼓励人们分享和贡献数据,既能给自己,也能给他人和整个社会带来好处。
对此,我深表同意。比如如果每个司机人都愿意实时的分享自己驾驶车辆的速度、位置、刹车、加速的情况,这样整个城市的路网,都实现了动态的监控和运营,或许对于改善所有司机的出行效率都有好处。
但是重要的问题是,要有足够的经济激励,刺激个人在信任安全可靠的前提下,有意愿分享自己的数据。显然,有机构或者组织愿意直接出资购买个人的这些数据是一种最为直接的商业模式,但是在现实生活中,第三方付费的模式则更为普遍。
不过有次带来的新问题则是,如果人们知道自己的数据能够给自己带来收益,则可能会影响其有意识的偏离正常的行为模式,从而使得数据的真实性又产生新的问题。这一点,其实在目前互联网世界中,第三方付费的商业模式中,案例比比皆是,虚假繁荣的数据由利益而生。
不过,有激励的机制,显然整体绩效要高于没有激励的机制,这一点,我认为是大数据时代,如果向获得完整和真实的数据,所必须考虑的一点。
目前来了,大数据的出现还主要是为了提高生产力,提高营销的效果,改善我们的交通、环境、健康、城市的境况。但是随着生物科技、信息通信技术的发展,物联网、互联网的融合发展,我们的世界或许将不可避免的进入一个“全数据化”的世界——在这样的世界,任何不可数据化的东西,都将与不存在一样。
在这样的世界,将是由大数据统治的世界,每一个人都是一串二进制编码,透明而简单,一切都是确定的,都是可预测的,都是按部就班的,你喜欢吗?反正我不喜欢,没有不确定性的人生能有多大意思呢?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19