京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据应用的10大神话和误区
英国科技新闻媒体V3日前针对大数据应用,列举了10大有关神话和误区。
1、大数据是新技术
大数据是新的术语,但其海量数据分析的概念并不新。许多人,包括Teradata首席技术官Stephen Brobst在内认为,对于那些刚开始认识到数据价值的用户,大数据有一些误导。Brobst表示:“大数据是一个长期项目,而不是12个月内,是24~36个月的世间情。”
2、大数据是一种商品
初次接触大数据概念,会认为它是一种特殊形式数据,独立于其他低端数据格式。但事实并非如此。
“你能买一个数据库数据吗?”Gartner杰出分析师Donald Feinberg说,“是的,你可以买到100台服务器,但是你可以购买大数据吗?因此,这不是一个市场。它只是IT市场的一部分。它价值10亿美元?是的,但它不是一个市场,它甚至不是一种商品,而且还不是新的。”
3、大数据是一个问题
这是一个近似半斤八两性质的公开辩题,但基于其基本形式,大数据具有巨大潜力,即使其没有被正确使用,或者甚至根本没有被使用。
因此,只要数据存在,并且可在未来用一种有效的方法加以处理,就应该有机会存在。也是一个价格昂贵的机会,也许,但仍然有机会。
数据问题是如何通过分析将其转化为清晰和实用的内容,这对企业是一个巨大的挑战。
4、你的数据只对你有用
据Gartner的统计,30%的企业会在未来几年会找到一种方式来套现其所持有的数据。将用户数据出售给出价最高者会引起担心和恐慌,但十有八九都会受到保证或者威胁。

5、人们不关心你如何使用他们的数据
很多人并不喜欢针对性或相关性的广告,但基于大数据驱动的市场营销接下来的重点,这事事实。但当你进入一家商铺,你的手机开始震动,告你在竞争对手店可以更低价格买到同样的产品时,这个时候你就会想到所签约的服务商。
即使是遭受恶评的利用人行为的无害化尝试也是具有一定价值的,其中伦敦的WiFi Smartbin就是一个典型的例子,它保持跟踪人们智能手机MAC地址,在广告风箱显示具有针对性的广告。不久伦敦城市管理公司意识到事情发生后,禁止了该行为,但这也不禁让我们联想到了Facebook所面临的2000万美元的集体诉讼。
6、大数据不会降落在监狱里的你
在这一点上,我们正在涉及一个颇具争议的话题。但Gartner公司的Feinberg确信,将会有相当的数据采集会涉及该领域。
“CIO会有多少人会去坐牢?如果觉得我在开玩笑,那么我就做另外一个大胆性假设:我认为Facebook总裁会在他离开Facebook之前去坐牢。我不知道什么时间,但它会发生。”Feinberg说,无论夸张与否,这都值得思考。
7、政府对你的社交媒体数据不感兴趣
许多人喜欢在Twitter上谩骂政客——反正他们也不会看到,对吗?也许是,但这对于了解选民的意向具有一定的参考价值,Feinberg说。
“奥巴马关心,因为他当选了,如果你看怎样当选的,他的团队使用社交数据和情感分析找出他不能胜出的目标对象。我不是说这他当选的唯一原因,但对于政府部门,社会资料和数据已经变得非常重要。”Feinberg说。
8、你需要新的数据进行分析
当你有一个业务目标之后,且数据仓库被0和1填充满了之后,你就可以分析使用你的数据了。有研究表明,大多数企业已经开始使用大数据获取信息,一旦他们想到了一个问题,就试图通过大数据分析来解决问题。
就像全球物流公司DHL早些时间像V3的记者所解释的那样,尽管此前在包裹投递的每一个阶段都有追踪,但是分析系统建立之前,没有办法利用这些数据。
9、有很多人以使用大数据
错了。这是一个世界性的难题。
Gartner统计数据表明,熟练的数据分析科学家如此缺乏,公司存在75%以上的大数据分析职位空缺。竞争惨烈,换句话说,这是一个很棒的职业。
话虽如此,这也取决于你如何定义一个数据分析科学家。Tesco公司的Duncan Apthorp,一位大数据分析师表示,他所存在公司并不要求名牌院校,这意味着普通毕业生也很有机会。
10、大公司都知道他们在做什么
显然不是。根据Gartner对数百家企业案例的研究:“在2016年,财富500强85%企业将无法利用大数据获得竞争优势。”
Teradata的高级副总裁Tasso Argyros表示:传统商业智能是从一个明确定义的问题开始,对于大数据发现,你有一个起点,但它不是一个业务问题,它是一个业务目标。问题在于你不知道要问什么问题或要使用什么数据,只是说’看这些数据,让我们开始,这通常很容易会失败。
所以,问题的答案是“不”,不是每个人都知道他们在做什么,很难制定出高效使用大数据的策略。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01