京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据不能“光大”,还要“深发展”
自从深发展银行推出那条知性的广告语“只想与你深发展”后,银行业内人士又自编出了更知性的姊妹篇:“光大是不行的”。算作一种调侃,偶尔娱乐一下也就作罢。然而如果用到对大数据的描述,这句话也恰到好处,大数据“量”上的比拼意义已不大,光大是不行的,只有深发展深层次挖掘分析后才能释放出应有的价值。
《大数据》一书的作者、信息管理专家涂子沛定义大数据时讲到大数据之“大”,并不仅仅在于“容量之大”,更大的意义在于:通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。
大数据持续升温
大数据又被称为巨量资料,指所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
国家统计局总工程师郑京平说‘大数据战略’将成为下一个‘石油战略’;美国数据科学家维克托·迈尔·舍恩伯格表示,大数据已成为21世纪的决定性资源,是“新的黄金”。
在百度谷歌上搜索“大数据”关键词,IBM、微软、英特尔等巨头公司的竞价排名广告赫然出现,搜索引擎中的相关结果也早已超过1亿条。
上到政府机关、巨头公司,下到创业公司、互联网从业人员,从各个角度都能看出对大数据的重视程度,也都瞄准了大数据的前景和钱景,“大数据”已成为2013年使用频率最高的技术热词之一,而即将到来的2014年,大数据势头依旧不减。
大数据应用案例丰富,商业化前景广阔
大数据掀起的风暴已经席卷各个拥有海量数据的行业。其中一个有趣的案例被津津乐道:微软公司通过大数据分析处理,对新一届奥斯卡金像奖作出“预言”,结果除“最佳导演”外,其余13项大奖全部命中。
此外,大数据在其他领域也发挥着其威力。微软必应搜索通过集成以往的飞机票价画出未来票价走势;谷歌利用用户搜索记录判断出美国流感疫情的现状,并 比疾控中心快一两周;对冲基金通过剖析社交网络推特的数据信息来预测股市的表现;亚马逊和网络影视光盘租赁公司根据用户在其网站上的类似查询来进行产品推 荐……当然,同样的技术也可以运用到疾病诊断、推荐治疗措施,甚至是识别潜在犯罪分子上。
全球零售业的巨头沃尔玛也通过大数据获益。公司在对消费者购物行为进行分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是推出了将啤酒和尿布捆绑销售的促销手段。如今,这一“啤酒尿布”的数据分析成果也成了大数据技术应用的经典案例。
随着各行业对大数据领域的研究、分析和商业化应用,在不久的将来,大数据的应用案例将会越来越多。
大数据太大的挑战
1 TB = 1,024 GB = 1,048,576 MB
1 PB = 1,024 TB = 1,048,576 GB
1 EB = 1,024 PB = 1,048,576 TB
1 ZB = 1,024 EB = 1,048,576 PB …….
网络上每一笔输入、每一笔搜索、网站上每一笔交易都是数据,每个人都是数据的创造者和贡献者,在经历了KB、MB、GB的小时代,TB、PB、EB甚至 DB的大时代也如期而至。数据的规模、速度和种类在2014年将会继续呈指数级发展。
当数据大到不能用简单的大来形容时,就会成为非常难以制服的老虎。管控大数据技术跟不上数据增长速度将会拖延其实用性演进的进程;收集到的数据不足以转换成有意义的洞察力,将会让数据的价值不能完全体现;数据过渡集成对用户隐私造成的干扰都将成为大数据时代前行的门槛。
身处大数据时代,让数据更大,让数据研究往纵深发展 ,枯燥的数据便会成为指引决策的依据,大数据的价值会逐步释放,到时候我们可以说大数据不仅可以取之于民,更可以用之于民。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01