京公网安备 11010802034615号
经营许可证编号:京B2-20210330
正确看待大数据的另一面
最近有微博网友爆料称,某旅行网站预订酒店服务有“杀熟欺生”的嫌疑:当遇到举棋不定的新用户或消费较保守的老用户时,会抛出一个相对有诱惑力的价位,诱导网友注册和消费,先成功获客再说;而对已经稳定的“回头客”,系统会开出一个相对较高的价格。媒体调查显示,这种根据用户的消费习惯提供“针对性”价格服务的现象,涉及打车、购票、订房、订餐等各种常见的网络平台消费。
这就是大数据的另一面。在互联网世界的话语体系里,大数据通常被形容为无所不能,所谓“比你更了解你自己”,用精确的算法给用户画像,继而提供“投食”般的服务。主流看法认为,大数据创造了一种新业态、新模式,给人们提供了前所未有的便捷,甚至在网上政务建设方面也大有作为,然而这并不意味着它就是无可指责的。大数据固然波澜壮阔,但也隐藏着许多风险,“杀熟欺生”是一种,“隐私泄露”也一直受到关注。某媒体曾报道称,700元就能买到同事行踪,包括乘机住宿上网吧等11项记录,甚至可查看电商网站、移动支付等所有痕迹;几天前,美国一个网站被爆泄露了5000万的用户数据,始作俑者是一个第三方小插件。这些活生生的例子表明,大数据不是法外之地,必须有足够明确的规范,才能保证其行稳致远。
大数据和个体隐私之间存在明确界限,但这一点正在被有意无意地忽略。日前,百度CEO李彦宏公开表示,“多数情况下,中国人愿意用隐私交换便捷性,他们没那么敏感”,结果引起轩然大波。究其根本,人们发现持这类观点的互联网企业不在少数。以数据收集为例,一个手电筒软件都恨不得读取你的地理位置和通讯录,一个图片软件也要登记你的电话号码,否则就不能用。在数据利用方面,人们更是被“绕过”了,某些网站收集用户信息,隔三差五就通过短信、电话等方式进行“精准营销”,在一个购物软件里搜过的东西,打开某视频软件,竟然也能看到相关广告。去年,有媒体对50家互联网企业发起隐私调查,结果只有30家制定独立隐私政策,18家存在于用户协议中,2家没有。
大数据的收集和利用没有规范,表面上有企业不够自律的原因,但也与它们缺乏规范化的动力有关。目前,无论是《网络安全法》,还是“两高”对个人信息的司法解释,虽然明确惩治侵犯公民个人信息犯罪活动,但更多还是集中于买卖环节的“灰色产业链”上,对大数据一笔带过。相对而言,大数据许多细节还有待界定,比如从采集到应用的各个环节,包括数据质量、数据隐私以及数据采集界限等方面。举个例子,在欧盟制定的专门保护个人数据权利的法律中,提出了“被遗忘权”的概念,体现在某种事实层面上,就是软件可以选择注销,然后企业删除数据,将你“遗忘”。但在我们这里,“遗忘”是件奢侈的事情,很少软件提供注销功能。这件小事并无技术难度,然而足见隐私意识的匮乏,法律惩戒力的不足。
随着越来越多企业加入竞争,大数据已经被看作一种核心资产和商业模式,被程度不一地进行挖掘。这既是创新力的表现,也意味着复杂的挑战,除了寄望于企业形成良好的自律意识,更需要进行有效的引导和管理。今年全国两会,多名代表委员提出的“个人信息安全法”是一个很好的办法,市场主体对于个人信息的使用究竟该遵循哪些强制规定,信息泄露后相关追责机制如何完善,最终还是有赖于建立起完善的个人信息安全监管机制。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27