京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据是一种有着真正未来的趋势_数据分析师
我们是从什么时候开始进入大数据时代的?也许是从第一台智能手机被研发出来之日开始,也许是从Facebook、Twitter等社交网站诞生之日开始,也许是从大容量存储设备的制造成本降低之日开始,也许是从非结构化数据的有效分析模型的构建之日开始……我们无从确认,但我们可以理一理这一系列事件的发展顺序,也许我们能从中发现点什么。随着科技环境的巨变,首先是个人电脑的全球普及,然后是移动智能终端的盛行,随之而来的是社交网络的爆炸式发展,还有物联网在政府、企业组织的积极倡导下迅猛的发展,当然,传感技术在其间功不可没,数以千万计的联网传感器节点分布在交通、汽车、工业、公用事业和零售部门。还有存储技术的发展等,这些都让数据的生产和收集的能力和速度都得到大幅的提升。然后还有非结构化/半结构化数据的有效分析模型的构建,相关软硬件的支撑,让数据的分析能力得到大幅的提升。数据多了,形式复杂了,数据的获取正在变得越来越细致,也越来越个人化。与此相对立的,数据的传送、分享和访问能力也得到彻底变革。
中国有句古语“雁过尚且留声,人生岂能无痕“,出于对利益的追逐,出于对市场的占领,出于对客户的洞察,过去人们使用各种终端的难以被描述的自以为毫无意义的行为在今天被他们事无巨细地详尽地记录、保存了下来,而且这不是某一时刻的单一行为,而是持续性的实时行为,同时,网民、手机用户在增加,终端数量、终端类型在增加,网站、应用在增加,与此同时,社会上的各行各业,从电信、IT业,到金融、证券、保险、航空、酒店服务业等,地球上的各种存在,从每个人到每棵树、每朵花乃至每粒沙子,无一例外地都在成为大数据的生成者。于是,在量和面上的双重积累,数据从产生的源头开始进入爆炸式的增长阶段。
也许以上所述未必能让你直观地了解大数据时代的形象,以下是我在网上找到的一些比较直接的数字:无所不在的移动设备、RFID、无线传感器每分每秒都在产生数据,数以亿计用户的互联网服务时时刻刻在产生巨量的交互,全球资料量在十年间就增加了60倍以上,一分钟内Twitter上新发的信息数超过10万,在Facebook上有超过600万的浏览量,每天产生的数据为2.5 quintillion。信息量每年正以最少59%速度在递增,到2020年世界上的数据存储总额将达到35 ZB。而更关键的是,这些信息不再是单纯的数字和文字,它包括比文字更复杂的图片、音频和视频。
好吧,回到最开始的问题,要界定“我们是从什么时候开始进入大数据时代的”或许比较困难,但如果哪一天你在浏览网页时发现页面推出的个性化广告框里的商品正是你数天前在视频中曾经与你朋友说起过的某样你很喜欢的物品时,你就可以确认你已经陷入了大数据时代。
现在,我们都知道“大数据”已经来了,但是我们还存有疑问:大数据究竟只是一个时髦的概念,还是一个无可逆转的趋势?这么多年来我们经历了太多的科技热点,而真正有着未来的只是小数,我们需要分辨出哪些是未来的趋势,哪些是时髦的概念。这是一个谨慎的问题,事关行业的巨额投资,事关企业的成本投入,甚至事关很多人的职业选择。关于这个问题,我想可以从以下几个关键点进行判断:第一,能否产生价值;第二,是否具有生命力;第三,是否不容易被替代。
关于大数据的价值,之后会有单独的篇章来论述,在此不详细展开来谈,只作“能/否”的判断。了解客户的需求,这对任何行业任何企业来说都是至关重要,如何了解?必经的方法是通过数据分析。现在数据越来越大,越来越复杂,增长越来越快,而竞争的压力,创新的需求,业务规划的需求对数据处理的实时性、有效性又提出了更高要求,过去传统的数据分析技术已经跟不上数据发展的步伐,在这样的背景下,大数据技术就应运而生了。通过大数据,人们可以对非结构化/半结构化数据进行实时监测和分析,从而制定相应的产品和服务推广方案,因此,我们可以判断,大数据是能产生价值的。
是否具有生命力关键在于看其立足的土壤是否能保证足够的养分供给或能量补充,以及是否有足够的生长空间。对大数据而言,其立足的土壤是指投入到大数据中,为大数据的发展提供动力的众多企业,如大数据的重要倡导者 – IBM、EMC,生成大数据的源头 – 苹果,生成大数据的介质 – Facebook、Twitter,大数据的汇集地 – 亚马逊,还有Google这样的大数据集大成者,当然大数据的“土壤”远远不止这些,还有包括众多的大数据技术的开发者,大数据分析服务提供商,大数据可视化服务提供商,大数据众包模式参与者等等,这个队伍还在逐渐的发展壮大。随着众多公司的加入,源源不绝地提供给大数据发展所需的养分,其他行业的发展(如传感技术,存储技术)也给大数据提供相当给力的能量补充。
生长空间对大数据而言是指应用大数据的企业和组织。根据IBM的调查发现,83%的CIO认为商业智能分析逐渐成为企业的最高战略。而国际研究顾问机构Gartner则表示,大数据将带动2012年280亿美元的全球IT支出,2013年带动之IT支出规模可望进一步增至340亿美元。越来越多企业意识到大数据对于企业发展的重要性,也越来越多企业愿意将成本投放到大数据的应用上,决策将日益基于数据和分析而作出,而并非基于经验和直觉。因此,我们可以认为大数据具有庞大的生长空间。
综合以上两点,我们可以得出大数据具有蓬勃的生命力的结论。
考量一个事物是否会被轻易替代,关键在于看其是否具有同类型的竞争者,其核心竞争力是否鲜明,其与竞品的边界是清晰还是模糊。举个例子,上网本之所以被市场迅速淘汰,原因在于其与同类型竞争者(笔记本电脑,平板电脑)相比核心竞争力较弱,而区分的边界相对模糊,在功能上趋近笔记本电脑而又弱于笔电,在便捷程度,娱乐性方面趋近平板电脑而又弱于平板电脑,因此其被淘汰是在情理之中。回到大数据上,大数据与数据虽然只是一字之差,但其内涵则是相差迥异(大数据与数据的区别下篇会重点提到,在此不详述),相互不具有替代性。而目前在处理巨量复杂数据上,尚未出现竞争者(由于目前大数据还是一个内涵庞大的概念,可以预料将来必然会分裂,细化,届时将出现大数据框架内的竞争双方)。根据Gartner的预期,目前大数据的领先企业到2015年底会开始把大数据的经验,深入应用于其架构和业务中,到2018年,当传统解决方案亦具有新特色和功能以更灵活地因应不同容量、种类和速度的需求,大数据解决方案的领先优势会逐渐减少。然而,大数据解决方案目前具备的技术、实行方法和工具仍会延续,因为领先企业已具体落实设计原则和取得必要的技术以将解决巨量复杂数据的问题视为惯常的弹性。因此,我们可以初步判断,大数据在之后相对长的一段时间内不容易被替代。
综合以上三个关键点,我们可以判断大数据不是一个时髦的概念,而是一个具有真正未来的趋势。
除此之外,或许我们还需要一些佐证,以下两个案例均可从另一个角度说明大数据是一个趋势(案例来源于网络)。
佐证1:美国政府认识到了一个国家拥有数据的规模,活性及解释运用的能力将成为综合国力的重要组成部分:今年3月奥巴马宣布以2亿美元投资大数据领域,美国政府将数据定义为“未来的新石油”,未来对数据的占有和控制甚至将成为继陆权、海权、空权之外另一个国家核心资产。
佐证2:IBM较早预见到了大数据的商业机遇并果断布局,进而成功地完成从PC厂商向商业智能服务商的转型。纵观IBM近5年来的大手笔收购多与大数据有关:07年IBM收购了商务智能软件供应商Congnos;09年IBM收购著名的统计分析软件SPSS;10年IBM收购数据库分析供应商Netezza……这一系列布局,为IBM业绩带来了稳定高速的增长。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10