
不要因为你的误解,对大数据进行妖魔化了
近日,一篇题为《15家数据公司被调查,数据行业面临大清洗?》的微信文章刷爆朋友圈,短短几日,平均阅读1w+的公众号“一本财经”打造出一款10w+的爆文;从该文评论也可以看出大众的不忿和担忧,不知从什么时候开始,我们很难想象“大数据”这个充满科技感的名词会触及到我们的个人隐私。在大数据时代,我们真的还有隐私可言吗?
试想一个场景;“当你在网上购物的时候,你的信息已经悄然地被存储起来、当你在微信里刷朋友圈的时候,你的活动已经被跟踪、当你敲击电脑键盘的时候,电脑程序记录下你的键盘操控过程、当你走在大街上的时候,有无数监控摄像头正冷冷地盯着你....”我们可以想的更加大胆一些;当你一直不清在酒酣耳热之后讲的那些愚蠢的话,转眼间就会在网络上被人疯传。我的天啊!!!如果这一天真的来到,我恐怕只能安慰自己说“你的隐私只剩零了,想开点吧。”
难道“大数据”就真的这么恐怖?我不否认现在很多大数据公司,披着大数据的外衣,干着倒卖个人信息的勾当。“在2016年8月,山东考生徐玉玉遭遇电信诈骗,9900元学费被骗走后不幸离世、2017年2月16日,信息贩子公然叫嚣,只要一个手机号码就能查到最私密的个人信息,且范围覆盖全国。”这类现象比比皆是,社会舆论直指个人信息泄露。
当社会对大数据公司开始慢慢地妖魔化,我想这未免对这个大数据行业有了很深的误解。社会大众可能并不知道大数据公司到底在做什么?上面提到的隐私泄露、黑市交易等现象都不是真正意义上的大数据公司。
大数据公司究竟在做什么?
对于“大数据”,研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。维基百科的定义,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。简单来说,大数据具有4个特点特点:大量、高速、多样、价值。
可能抽象的定义很难去理解大数据,至于大数据公司究竟是干什么的更是没有明确的定义。下面是利用“大数据”去分析的一个小案例。在这一场景下,我们根本不会涉及到个人信息。
这是“一本财经”在黑市内发现的车管所数据,我们一起大胆猜想一下这些数据有哪些用途:保险公司会定时给你推销各种品类的保险;销售公司会判断你大概什么时间要换车了,时间一到,立马会为你推销汽车广告;中介可以将数据卖给征信风控企业等一系列个人信息被泄露的现象。这些是某些大数据公司披着大数据的外衣,干着倒卖个人信息的勾当。这是个别的特例,是整个大数据行业所鄙视的行为。
一家大数据公司真正做的是把车主的信息进行脱敏处理的,我们不需车主的姓名,身份信息,手机号,保险到期时间等关键信息,只通过车辆型号,所有者年龄、性别等信息,利用大数据技术得到车主的整体画像。
如上,我们得出的数据分析报告是某个时间段内自主品牌汽车行业的相关情况,完全不会涉及侵犯个人隐私。我们利用“脱敏后的数据”进行分析,得到的是整个宏观的数据分析结果,这个数据报告将会对汽车厂商的设计、生产、营销推广均有不同程度的指导作用。
通过上面两个图片的对比,我们不难看出,利用大数据做的是一个不断优化的生态系统,大数据的真正价值在于挖掘,也就是洞察数据之间的关联,通过对比、交叉、相关、聚类等等方法,得出可视化的分析结果。基于结果洞察到新的机会点、预测未来趋势,得出一套科学合理的解决方案”。
所以开篇所提到的那15家数据公司所做的“公民隐私信息交易问题”,在整个数据分析中是根本不会涉及的。我们利用大数据想要的是一个宏观的趋势,而不是仅仅局限在个人的隐私上面。我相信在《网络安全法》正式实施之后,数据行业的风气将为之一新,以往在“灰色”领域不具备竞争优势的企业,将会脱颖而出,迎来绝佳的发展机会。
数据安全
“随着物联网的发展,在未来一切东西都会智能化、都在线上,社会上对于数据安全的呼声越来越高,需求也是越来越强烈。”今年5月,新型“蠕虫”式勒索病毒席卷全球,网络安全已成为政府部门、企业机构、社会大众共同关注的热点话题。27日,“大数据网络应用安全技术高峰论坛”在贵阳国际生态会议中心举行。业界专家大咖汇聚一堂,聚焦大数据基础系统,为营造安全和谐的网络环境建言献策。
6月1日,《中华人民共和国网络安全法》的正式实施,成为我国网络空间法治建设的重要里程碑,在确立安全在整个信息系统建设中的核心和关键地位的同时,对保护公众个人信息安全也起到积极作用。
由此可见,不管是从国家层面,还是个人层面,数据安全问题都是发展的核心问题。在风起云涌的大数据时代,我们每个人都很难做到独善其身,在推动数据应用时所面临的风险与挑战,需要国家和企业一起努力。
大数据浪潮势不可挡
数据已成为国家基础性战略资源和商业创新源泉,深化大数据应用成为世界各国和产业界的一致选择。全球数据规模持续迅猛增长,数据被认为是新时代基础生活资料与市场生产要素,成为了全球“互联网+”变革浪潮下的基础“能源”,战略价值不亚于工业社会的石油。
工信部发布的《中国大数据发展调查报告(2017年)》中显示,2016年中国大数据市场整体规模为168.0亿元,较2015年增速达45%,预计2017-2020年增速将保持在30%以上,意味着在未来3年,我国大数据市场的整体规模将来到500亿。
同样在报告的调查中显示,59.2%的受访企业已成立数据分析相关部门,35.1%的企业已经应用了大数据,大数据应用得到进一步普及;目前大数据应用最为广泛的三个领域分别为营销分析、客户分析和内部运营管理。
目前,我国大数据市场的供给结构已经初步形成,大数据创新应用深入经济社会各领域。大数据成为服务经济社会民生的重要支撑和引领产业转型升级的核心力量。在广大现有和新兴细分市场中,大数据市场融合技术与服务,正形成迅猛的发展势头。未来几年大数据市场仍将呈现强劲的增长,风头势不可挡。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08