京公网安备 11010802034615号
经营许可证编号:京B2-20210330
75.9%受访者发现存在“大数据”滥用现象
电子科技大学互联网科学中心主任、《大数据时代》中文翻译者周涛认为,企业有没有“大数据”能力,分析报告是否包含“大数据”成分,要看是否具备两个特征:一是数据本身要具有一定规模,肯定不同于以前社会科学控制实验中几十几百人的规模;二是数据分析结果要能够提供深刻洞见,不是简单的统计分析,譬如“某社交网络1000万用户中45%是男性”、“全国春运最热航线是北京到上海”,这些都不是“大数据”。
近年来,从技术界走出来的“大数据”逐渐受到社会各界的高度关注,在社会管理、企业营销、青年就业创业等方面都发挥出很大作用。但到底什么是“大数据”,很多人对此还有疑惑。同时,“大数据”被迅速广泛引用也引发人们对滥用的担忧。
近日,中国青年报社会调查中心通过民意中国网和手机腾讯网对2315人进行的一项调查显示,43.6%的受访者认为“大数据”分析意义很大,但80.0%的受访者也确认自己不清楚什么是“大数据”,75.9%的受访者发现目前存在“大数据”被滥用的现象。
80.0%受访者不清楚什么是“大数据”
调查中,听说过和没听说过“大数据”的受访者各占一半。80.0%的受访者直言不清楚什么是“大数据”,表示“非常清楚”和“比较清楚”的受访者分别仅占8.3%和11.6%。
北京大学信息工程学院计算机应用技术专业研一学生卿,这学期正在学习一门关于调研“大数据”的课程。谈及如今的“大数据”热,卿显得有些激动。他说,“大数据”可以帮助人们了解平时注意不到的信息,还可以预测未来,比如可以根据机票涨降情况确定最佳购票时机,根据人们的搜索记录更早地预测流感传播。
卿表示,如今很多企业都在说“大数据”,其中不乏“跟风”现象。有些数据分析贴上“大数据”标签,瞬间就显得“高大上”,其实并没有真正的“大数据”分析。
统计学专业毕业的王京也认为,现在有些标榜“大数据”的报告,一方面数据量不大,另一方面也不是“大数据”的思维。“大数据”讲究效率、针对个人,但很多类似于“大数据教你谈恋爱”这样的说法,更多是一种噱头。
调查中,75.9%的受访者发现“大数据”存在被滥用的现象。
电子科技大学互联网科学中心主任、《大数据时代》中文翻译者周涛说,的确有一些企业在商务智能时代没有学好商务智能,到了大数据时代才刚刚学会商务智能,就说自己是“大数据”。
周涛认为,一个企业有没有“大数据”能力,一个分析报告是否包含“大数据”成分,要看是否具备两个特征:一是数据本身要具有一定规模,肯定不同于以前社会科学控制实验中几十几百人的规模;二是数据分析结果要能够提供深刻洞见,不是简单的统计分析,譬如“某社交网络1000万用户中45%是男性”、“全国春运最热航线是北京到上海”,这些都不是“大数据”,只是非常简单的分析方法在稍微大一点的数据集上的应用。举个例子,通过分析春运人口迁移路线、迁移方式(体现了经济水平)以及购票人的身份证信息(体现了年龄和籍贯),来对中国劳动人口的流动现状进行刻画,并对未来中国劳动力流动与分布形态进行预测,这就有一点“大数据”的影子了。
王京觉得,我们的传统比较偏重人文主义、缺乏数据思维,这些“大数据”的说法虽然存在问题,在专业性上过不了关,但对于推广数据化思维、养成用数据说话的观念是有意义的。
35.6%受访者觉得一些“大数据”分析空有大量数据
南京大学计算机专业博士高坤(化名)说,现在“大数据”还存在很多问题,比如数据的所有权问题、隐私问题、安全问题等,都需要尽快解决。
周涛认为,很多人分不清安全和隐私。安全问题一直都有,主要是指攻击方通过一些手段盗取信息或破坏信息。使用数据的企业,在接触敏感甚至涉密信息时,应该有安全资质的认证。这在我国的运营商体系和金融体系里都有明确要求。
“经常和安全问题混为一谈的,是数据隐私的问题。”周涛说,一方面,隐私数据直接泄露,或者有不法人士售卖这些信息,另一方面,一些隐私信息通过技术手段遭到破译。这样就可能给个人或商家带来伤害,比如一些招聘网站的个人求职信息被破译之后,会对个人造成伤害,也会让招聘企业无法阻断信息,失去盈利空间。
“除去法律层面、道德层面,科学技术层面上也还有很多问题需要解决。”高坤说,有这么多数据,具体怎么处理,还需要更好地研究。现在很多“大数据”只是存储下来,缺少进一步分析,但是把海量数据存储下来本身也是技术进步,是“大数据”工作的一部分。
王京说,一方面,没有有效的方法来分析数据,另一方面,很多平台没有打通,比如说一个人上网不只买东西,还会聊天,聊天对买东西是有影响的,但是聊天的数据和买东西的数据无法对接起来,无法产生商业价值。
调查中,35.6%的受访者觉得现在一些“大数据”分析空有大量数据,30.8%的受访者认为缺乏数据安全,11.1%的受访者提出缺乏科学性,9.3%的受访者指出分散数据没有有效整合,7.8%的受访者认为存在“大数据”与传统分析概念混淆的情况。
43.6%受访者认为“大数据”分析意义很大
调查显示,43.6%的受访者认为“大数据”分析的意义很大,7.0%的受访者认为不太大,9.5%的受访者觉得“大数据”分析没什么意义,39.8%的受访者表示不好说。
90后北大研究生刘环是在一次讲座上了解到了“大数据”。刘环认为,“大数据”确实还存在很多问题,但不可否认生活、学习中的很多细节也因“大数据”而改变,比如现在用的翻译工具越来越智能化,一些输入法更人性化,这些都归功于“大数据”分析,相信“大数据”会有更大发展空间。
王京说,虽然“大数据”现在还在试验、探索阶段,但是“大数据”很重要,跟我们每个人生活都息息相关。原来的数据生产是由专业机构去做,现在我们每天都在生产数据,只要有媒介的地方就会产生数据。“数据科学家的文本分析、行为分析,都是能带来价值的,比如现在的微博、微信等,通过数据分析就能带来商业价值”。
周涛表示,“大数据”分析的意义主要体现在:一、挖掘数据中潜藏的关联关系甚至因果关系;二、对数据整体中缺失的信息进行预测;三、对数据所代表的系统走势进行预测;四、支持对数据所在系统功能的优化,或者对决策起到评估和支撑作用。
高坤认为,“大数据”本身是一种新的科学手段,虽然目前还不成熟,但已经开始受到科学家的关注。“大数据”对于经济、国防,都是最重要的科技手段。青年应该更多地关注科学技术的发展,从科技的角度来理解“大数据”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02