京公网安备 11010802034615号
经营许可证编号:京B2-20210330
75.9%受访者发现存在“大数据”滥用现象
电子科技大学互联网科学中心主任、《大数据时代》中文翻译者周涛认为,企业有没有“大数据”能力,分析报告是否包含“大数据”成分,要看是否具备两个特征:一是数据本身要具有一定规模,肯定不同于以前社会科学控制实验中几十几百人的规模;二是数据分析结果要能够提供深刻洞见,不是简单的统计分析,譬如“某社交网络1000万用户中45%是男性”、“全国春运最热航线是北京到上海”,这些都不是“大数据”。
近年来,从技术界走出来的“大数据”逐渐受到社会各界的高度关注,在社会管理、企业营销、青年就业创业等方面都发挥出很大作用。但到底什么是“大数据”,很多人对此还有疑惑。同时,“大数据”被迅速广泛引用也引发人们对滥用的担忧。
近日,中国青年报社会调查中心通过民意中国网和手机腾讯网对2315人进行的一项调查显示,43.6%的受访者认为“大数据”分析意义很大,但80.0%的受访者也确认自己不清楚什么是“大数据”,75.9%的受访者发现目前存在“大数据”被滥用的现象。
80.0%受访者不清楚什么是“大数据”
调查中,听说过和没听说过“大数据”的受访者各占一半。80.0%的受访者直言不清楚什么是“大数据”,表示“非常清楚”和“比较清楚”的受访者分别仅占8.3%和11.6%。
北京大学信息工程学院计算机应用技术专业研一学生卿,这学期正在学习一门关于调研“大数据”的课程。谈及如今的“大数据”热,卿显得有些激动。他说,“大数据”可以帮助人们了解平时注意不到的信息,还可以预测未来,比如可以根据机票涨降情况确定最佳购票时机,根据人们的搜索记录更早地预测流感传播。
卿表示,如今很多企业都在说“大数据”,其中不乏“跟风”现象。有些数据分析贴上“大数据”标签,瞬间就显得“高大上”,其实并没有真正的“大数据”分析。
统计学专业毕业的王京也认为,现在有些标榜“大数据”的报告,一方面数据量不大,另一方面也不是“大数据”的思维。“大数据”讲究效率、针对个人,但很多类似于“大数据教你谈恋爱”这样的说法,更多是一种噱头。
调查中,75.9%的受访者发现“大数据”存在被滥用的现象。
电子科技大学互联网科学中心主任、《大数据时代》中文翻译者周涛说,的确有一些企业在商务智能时代没有学好商务智能,到了大数据时代才刚刚学会商务智能,就说自己是“大数据”。
周涛认为,一个企业有没有“大数据”能力,一个分析报告是否包含“大数据”成分,要看是否具备两个特征:一是数据本身要具有一定规模,肯定不同于以前社会科学控制实验中几十几百人的规模;二是数据分析结果要能够提供深刻洞见,不是简单的统计分析,譬如“某社交网络1000万用户中45%是男性”、“全国春运最热航线是北京到上海”,这些都不是“大数据”,只是非常简单的分析方法在稍微大一点的数据集上的应用。举个例子,通过分析春运人口迁移路线、迁移方式(体现了经济水平)以及购票人的身份证信息(体现了年龄和籍贯),来对中国劳动人口的流动现状进行刻画,并对未来中国劳动力流动与分布形态进行预测,这就有一点“大数据”的影子了。
王京觉得,我们的传统比较偏重人文主义、缺乏数据思维,这些“大数据”的说法虽然存在问题,在专业性上过不了关,但对于推广数据化思维、养成用数据说话的观念是有意义的。
35.6%受访者觉得一些“大数据”分析空有大量数据
南京大学计算机专业博士高坤(化名)说,现在“大数据”还存在很多问题,比如数据的所有权问题、隐私问题、安全问题等,都需要尽快解决。
周涛认为,很多人分不清安全和隐私。安全问题一直都有,主要是指攻击方通过一些手段盗取信息或破坏信息。使用数据的企业,在接触敏感甚至涉密信息时,应该有安全资质的认证。这在我国的运营商体系和金融体系里都有明确要求。
“经常和安全问题混为一谈的,是数据隐私的问题。”周涛说,一方面,隐私数据直接泄露,或者有不法人士售卖这些信息,另一方面,一些隐私信息通过技术手段遭到破译。这样就可能给个人或商家带来伤害,比如一些招聘网站的个人求职信息被破译之后,会对个人造成伤害,也会让招聘企业无法阻断信息,失去盈利空间。
“除去法律层面、道德层面,科学技术层面上也还有很多问题需要解决。”高坤说,有这么多数据,具体怎么处理,还需要更好地研究。现在很多“大数据”只是存储下来,缺少进一步分析,但是把海量数据存储下来本身也是技术进步,是“大数据”工作的一部分。
王京说,一方面,没有有效的方法来分析数据,另一方面,很多平台没有打通,比如说一个人上网不只买东西,还会聊天,聊天对买东西是有影响的,但是聊天的数据和买东西的数据无法对接起来,无法产生商业价值。
调查中,35.6%的受访者觉得现在一些“大数据”分析空有大量数据,30.8%的受访者认为缺乏数据安全,11.1%的受访者提出缺乏科学性,9.3%的受访者指出分散数据没有有效整合,7.8%的受访者认为存在“大数据”与传统分析概念混淆的情况。
43.6%受访者认为“大数据”分析意义很大
调查显示,43.6%的受访者认为“大数据”分析的意义很大,7.0%的受访者认为不太大,9.5%的受访者觉得“大数据”分析没什么意义,39.8%的受访者表示不好说。
90后北大研究生刘环是在一次讲座上了解到了“大数据”。刘环认为,“大数据”确实还存在很多问题,但不可否认生活、学习中的很多细节也因“大数据”而改变,比如现在用的翻译工具越来越智能化,一些输入法更人性化,这些都归功于“大数据”分析,相信“大数据”会有更大发展空间。
王京说,虽然“大数据”现在还在试验、探索阶段,但是“大数据”很重要,跟我们每个人生活都息息相关。原来的数据生产是由专业机构去做,现在我们每天都在生产数据,只要有媒介的地方就会产生数据。“数据科学家的文本分析、行为分析,都是能带来价值的,比如现在的微博、微信等,通过数据分析就能带来商业价值”。
周涛表示,“大数据”分析的意义主要体现在:一、挖掘数据中潜藏的关联关系甚至因果关系;二、对数据整体中缺失的信息进行预测;三、对数据所代表的系统走势进行预测;四、支持对数据所在系统功能的优化,或者对决策起到评估和支撑作用。
高坤认为,“大数据”本身是一种新的科学手段,虽然目前还不成熟,但已经开始受到科学家的关注。“大数据”对于经济、国防,都是最重要的科技手段。青年应该更多地关注科学技术的发展,从科技的角度来理解“大数据”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10