京公网安备 11010802034615号
经营许可证编号:京B2-20210330
高速膨胀 大数据引发技术革命
随着互联网、云计算、移动通讯技术发展,数据成为人们不可缺少的重要资产,对人们生活起着重要作用。大数据(Big data)分析从各种各样结构化和非结构化数据中获取有价值信息,帮助企业进行商业决策。哈佛大学量化社会科学院院长Gary King表示,大数据正在引起一场技术革命,没有哪个领域不会受到影响。
大数据是企业、机构和互联网用户产生的结构化和非结构化数据统称,如电力公司客户数据库、商业客户数据库、互联网广告、搜索索引、博客和电子邮件等。网络新闻杂志CMS Wire报导说,由于包含客户喜好和购买打算等重要资讯,大数据越来越受到企业和机构重视。
但是,由于大量化、多样化和快速化的特点,大数据的抓取、处理、管理和整合颇具挑战性。《环球邮报》报导说,加拿大IT公司Fuseforward向市场推出云计算大数据平台ICE,提供大数据获取、分析和整合应用程序,帮助大公司和政府机构优化能源系统,如削减城市基础设施系统的电力能源消耗。
高速膨胀 大数据影响广泛
市场谘询公司IDC的研究数据显示,全球数据每2年翻一番,每天生产相当于17.5万个美国国货图书馆的数据。2010年,互联网所产生的数据量超过之前所有年份的总和。2011年,全球大数据达到1.8万亿GB,互联网生产4.8万亿个在线广告,107万亿个电子邮件。
预计2013年,互联网数据将达到7,162亿GB。IDC预计,未来10年全球数据量将以超过40%的速度增长,2020年全球大数据将达35万亿GB,为2011年的19.4倍。
2010年,IBM和微软等公司的数据管理和分析软件开发的开支为15亿美元。谘询公司Data Corp预计,大数据工业产值2015年将达到169亿,比2010年增长428%。
美国德州IT谘询公司Gartner副主席David Newman认为,数据将成为人们不可缺少的重要资产,企业开发产品和拓宽市场等商业决策将依赖于大数据。
数据分析技术匮乏 困扰企业
研究公司Aberdeen最近发表调查报告数据显示,90%的公司被大数据困扰,苦于没有合适的分析软件。企业亟需能够及时而准确分析客户消费需求和购买意向的大数据应用软件。
Aberdeen资深研究员Trip Kucera认为,大数据面临的另外一个挑战是,如何把从杂乱无章数据中获取的有价值信息整合到其他商业应用软件系统之中,帮助企业进行自动化商业决策。
根据Aberdeen调查报告,45%的企业表示,技术或数学模型的缺乏使得大数据分析结果很难与公司其他商业软件系统进行整合应用,公司往往是人工使用大数据分析结果。只有26%受调查企业认为没有困难使用大数据,这一比例在受调查的大企业中也不到一半。
另外,分析软件准确度取决于数据来源和质量,商用交易和行为数据有较高质量,而互联网和社交网数据具有较低质量。
根据Aberdeen调查报告,商用客户交易和行为数据能够比较准确的反应顾客消费需求和购物意向,而互联网和社交网用户数据在这方面的准确性较差。 63%-81%的企业使用商用客户交易或行为数据进行客户分析,只有24%-41%的企业使用互联网或社交网数据进行客户分析。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12