
大数据时代,无处不在的第三只眼_数据分析师
最近,有一个关于大数据在人们日常生活中具体表现的段子,很火,频繁出现在各大社交网站和相关论坛,虽然有夸张的成分,但也不无道理,让我们开始思考从未留意过却无时无刻不存在的问题,甚至在一定程度上会影响我们未来的生活习惯。这个段子全文如下:
某比萨店的电话铃响了,客服人员拿起电话。
客服:XXX比萨店。您好,请问有什么需要我为您服务?
顾客:你好,我想要一份……
客服:先生,烦请先把您的会员卡号告诉我。
顾客:16846146***。
客服:陈先生,您好!您是住在泉州路一号12楼1205室,您家电话是2646****,您公司电话是4666****,您的手机是1391234****。请问您想用哪一个电话付费?
顾客:你为什么知道我所有的电话号码?
客服:陈先生,因为我们联机到CRM系统。
顾客:我想要一个海鲜比萨……
客服:陈先生,海鲜比萨不适合您。
顾客:为什么?
客服:根据您的医疗记录,你的血压和胆固醇都偏高。
顾客:那你们有什么可以推荐的?
客服:您可以试试我们的低脂健康比萨。
顾客:你怎么知道我会喜欢吃这种的?
客服:您上星期一在中央图书馆借了一本《低脂健康食谱》。
顾客:好。那我要一个家庭特大号比萨,要付多少钱?
客服:99元,这个足够您一家六口吃了。但您母亲应该少吃,她上个月刚刚做了心脏搭桥手术,还处在恢复期。
顾客:那可以刷卡吗?
客服:陈先生,对不起。请您付现款,因为您的信用卡已经刷爆了,您现在还欠银行4807元,而且还不包括房贷利息。
顾客:那我先去附近的提款机提款。
客服:陈先生,根据您的记录,您已经超过今日提款限额。
顾客:算了,你们直接把比萨送我家吧,家里有现金。你们多久会送到?
客服:大约30分钟。如果您不想等,可以自己骑车来。
顾客:为什么?
客服:根据我们CRM全球定位系统的车辆行驶自动跟踪系统记录。您登记有一辆车号为SB-748的摩托车,而目前您正在解放路东段华联商场右侧骑着这辆摩托车。
顾客当即晕倒。
。。。。。。
通过这个段子,我们看到,现如今已经进入了大数据时代,各种数据的广泛应用,给人们带来了诸多便利和人性化的服务,可同时也面临着个人信息的过度曝光,隐私不被保护,让人没有安全感。
大数据的核心是预测,企业只有在掌握海量数据的基础上,通过科学软件进行用户分析、产品分析,预测市场走向,挖掘出有巨大的价值的产品和服务,才能够在市场竞争中处于不败之地。但大数据是把双刃剑,它在方便用户社交和商家预测分析的同时,使个人信息安全在新时代新形势下面临着前所未有的威胁和挑战。
信息是无处不在的,它并不需要你说出来,这一切都会表现在我们的社交行为上,而你自己却毫无知觉,并且很主动的提交了这些信息。用户在使用QQ、微信聊天的过程中,实际上是把最为私隐的信息交给了腾讯;在畅享网络购物同时,就将账号、地址和电话信息交给了淘宝;在刷微博时娱乐时,就将兴趣、爱好和私信交给了新浪;在使用搜索服务时,就将自己的网络行为轨迹交给了百度。
PPV课小编Bobo认为,在大数据时代,我们几乎无处遁形,拿互联网领域来讲,顺着社交网络的这一张大网,总会找到我们的蛛丝马迹。我们通过电脑、手机等电子设备在网络上进行的每一个操作,都被服务器记录了下来,而且这些被记录的个人信息将面临着二次利用。在未来,大数据应用会扩散到各个领域,覆盖日常生活的方方面面,如用水,用电等信息都会被电气公司采集到并加以利用。现在,大数据的价值不再单纯来源于它的基本用途,而更多的源于它的二次利用,因为很多数据在收集的时候并无意以作他用,而最终却产生了很多创新性的用途,然而,糟糕的是我们对这些并不知情。
凡是你走过的地方,身后都留下一片数据。一旦这些数据被泄漏,被倒卖,就成为了商家牟利的有力武器,甚至有可能被不法分子获取,威胁到人身和财产安全,而你同样一无所知。支付宝的用户数据包含大量用户隐私,如电话、地址、身份证号、购物习惯、账户余额等。如果这些资料被不法分子掌握,理论上他们可以用来实施很多犯罪行为,威胁到用户个人财务安全。
用户的账户和隐私信息安全问题,已经构成了大数据时代最大的威胁,而且用户对个人信息的控制权也在逐渐减弱,因为当今社会,每个人都会有多个社交账号,而且会在它们之间设置一个关联授权,个人信息很容易被访问、收集和传播。在这样一种情况下,想通过技术方法来保护个人信息,似乎是不可能的,只要拥有足够大的数据,无论如何也实现不了完全的匿名化,Bobo如是说。
所以,在这个越来越信息化的大数据时代,用户的个人信息安全问题,受到社会各界越来越多的关注。如果不能解决安全问题,那么会产生两个结果:一,用户不信任。例如运动手环、所有个人的心跳、血糖都被记录下来,可能许多人不会再使用;二,也会有消费者无知无觉,只顾着使用这些先进的设备,但完全没有意识到自己把安全开放给了这些厂商,一旦出现安全事件,就将是巨大的问题。
另外,美国白宫也在关注用户的数据安全问题,并出台了相关规定,建议政府出台政策限制公司通过网络收集信息客户私人信息并加以使用”,“硅谷的企业家们将之看作政府着手对公司如何利用数据获利(数据包括从邮件中以及用户浏览网页的习惯中获取的信息)进行整顿的开端。
在大数据时代,我们需要设立一个不一样的个人信息保护模式,这个模式应该着重于数据使用者为其行为承担责任,而不是将重心放在数据收集之初要取得个人同意上,Bobo这样建议。将责任由民众转移到数据使用者很有意义,因为没有人比数据使用者更清楚他们想要干什么,所以他们理应对自己的行为负责。
总之,没有隐私的大数据是很危险的,甚至会是一场灾难,在没有过硬的隐私保护的当下,我们要学会自己保护自己,与人身和财产安全有关的数据信息,谨慎为之!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23