京公网安备 11010802034615号
经营许可证编号:京B2-20210330
正确看待大数据的另一面
最近有微博网友爆料称,某旅行网站预订酒店服务有“杀熟欺生”的嫌疑:当遇到举棋不定的新用户或消费较保守的老用户时,会抛出一个相对有诱惑力的价位,诱导网友注册和消费,先成功获客再说;而对已经稳定的“回头客”,系统会开出一个相对较高的价格。媒体调查显示,这种根据用户的消费习惯提供“针对性”价格服务的现象,涉及打车、购票、订房、订餐等各种常见的网络平台消费。
这就是大数据的另一面。在互联网世界的话语体系里,大数据通常被形容为无所不能,所谓“比你更了解你自己”,用精确的算法给用户画像,继而提供“投食”般的服务。主流看法认为,大数据创造了一种新业态、新模式,给人们提供了前所未有的便捷,甚至在网上政务建设方面也大有作为,然而这并不意味着它就是无可指责的。大数据固然波澜壮阔,但也隐藏着许多风险,“杀熟欺生”是一种,“隐私泄露”也一直受到关注。某媒体曾报道称,700元就能买到同事行踪,包括乘机住宿上网吧等11项记录,甚至可查看电商网站、移动支付等所有痕迹;几天前,美国一个网站被爆泄露了5000万的用户数据,始作俑者是一个第三方小插件。这些活生生的例子表明,大数据不是法外之地,必须有足够明确的规范,才能保证其行稳致远。
大数据和个体隐私之间存在明确界限,但这一点正在被有意无意地忽略。日前,百度CEO李彦宏公开表示,“多数情况下,中国人愿意用隐私交换便捷性,他们没那么敏感”,结果引起轩然大波。究其根本,人们发现持这类观点的互联网企业不在少数。以数据收集为例,一个手电筒软件都恨不得读取你的地理位置和通讯录,一个图片软件也要登记你的电话号码,否则就不能用。在数据利用方面,人们更是被“绕过”了,某些网站收集用户信息,隔三差五就通过短信、电话等方式进行“精准营销”,在一个购物软件里搜过的东西,打开某视频软件,竟然也能看到相关广告。去年,有媒体对50家互联网企业发起隐私调查,结果只有30家制定独立隐私政策,18家存在于用户协议中,2家没有。
大数据的收集和利用没有规范,表面上有企业不够自律的原因,但也与它们缺乏规范化的动力有关。目前,无论是《网络安全法》,还是“两高”对个人信息的司法解释,虽然明确惩治侵犯公民个人信息犯罪活动,但更多还是集中于买卖环节的“灰色产业链”上,对大数据一笔带过。相对而言,大数据许多细节还有待界定,比如从采集到应用的各个环节,包括数据质量、数据隐私以及数据采集界限等方面。举个例子,在欧盟制定的专门保护个人数据权利的法律中,提出了“被遗忘权”的概念,体现在某种事实层面上,就是软件可以选择注销,然后企业删除数据,将你“遗忘”。但在我们这里,“遗忘”是件奢侈的事情,很少软件提供注销功能。这件小事并无技术难度,然而足见隐私意识的匮乏,法律惩戒力的不足。
随着越来越多企业加入竞争,大数据已经被看作一种核心资产和商业模式,被程度不一地进行挖掘。这既是创新力的表现,也意味着复杂的挑战,除了寄望于企业形成良好的自律意识,更需要进行有效的引导和管理。今年全国两会,多名代表委员提出的“个人信息安全法”是一个很好的办法,市场主体对于个人信息的使用究竟该遵循哪些强制规定,信息泄露后相关追责机制如何完善,最终还是有赖于建立起完善的个人信息安全监管机制。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01