京公网安备 11010802034615号
经营许可证编号:京B2-20210330
从What到How,大数据实战攻略秘笈_数据分析师培训
为什么大数据专案的失败率高达55%?你是每两个中就失败的那一个吗?看大数据实战攻略秘笈,自我诊断你是否还深陷大数据迷思不可自拔,一起破解大数据获利方程式。
马云、白宫、释昭慧和猫下去餐厅有什么共通点?答案是大数据。今年3月,阿里巴巴集团创办人马云来台的演讲中提到:「未来已不是IT时代,而是DT(Data Technology)时代!」揭示大数据对阿里巴巴集团的重要性。一个星期后,白宫宣布任命PayPal和eBay的前任执行长帕帝亚(DJ Patil),为全美国第一个首席数据科学家,帮助政府善用大数据,并巩固美国在数据科学领域的领先地位。而日前慈济内湖开发案闹得沸沸扬扬,释昭慧上谈话性节目时,竟也引用大数据,暗喻慈济遭教会保守势力暗算。台北市知名餐厅猫下去小馆在3月宣布取消订位服务的同时,也不忘提到大数据证明自己取消订位服务后,营业额不降反升。
无论这些大数据到底是不是真的「大」数据,都说明了一件事:大数据发展至今,几乎已经成为全民常识。从科技大佬、政治名人到市井小民,随口都可以说上几句大数据的大道理,大数据的热门程度可见一斑。但是你真的懂大数据吗?或者是说,你真的会用大数据吗?
从What到How
大数据变了,它变得更成熟也更主流了,以前你对大数据一知半解,依稀知道大数据可以干嘛,但现在这已经远远不够了。「两年前,客户会问大数据是什么?现在会问要怎么切入大数据、有什么题目可以做?一些进阶企业甚至会问,如何用更新的工具,让效率更快或价值更高?大家问的题目变具体了。」IBM软体事业处总经理贾景光说。
市场研究机构Gartner去年8月发布的「科技成熟度报告」显示,大数据已经从过热高峰期过渡到幻灭谷底期。报告中指出,「市场对大数据的兴致未减,但由於市场上开始出现越来越多样的大数据应用,各式尖端数据处理技术和应用陆续推陈出新,这让大数据开始挥别期望过热期,步入幻灭低谷期。」这说明大数据并非即将灭亡,相反的,大数据越来越成熟。交大产业加速器暨专利开发策略中心产业分析师黄秋华认为,幻灭才是成长的开始,大数据应用在未来只会越来越多,而且越来越多元,市场已普遍对大数据有所认识,各大企业也都已导入大数据专案。
每年都会在部落格上发布大数据产业地图的FirstMark Capital营运总监特克(Matt Turck),在2014年发布的大数据产业板块图中,数据应用的势力越来越大,跟2012年一比,数据应用已占整个产业板块近四分之一强。种种现象皆说明,大数据已经过了纸上谈兵的阶段,进入短兵相接时期。那问题来了,你该怎么做?
「大数据即将在5年内消失!」去年被Exebank选为全美排名第4首席技术长的Teradata技术长宝立明(Stephen Brobst),在接受《数位时代》专访时表示,「很多人以为大数据就是指大量的数据,事实上,我认为这是大数据中最无趣的部分。我们真正在寻找的是非传统的、未曾被挖掘过的数据,并且从这些数据中去提炼出价值。我相信在5年内,我们就不会再使用大数据这个词了,到头来大数据就只是数据而已。」
要用大数据,先打破迷思
宝立明意指,大数据将成为每家企业的DNA和未来能否保持竞争优势的关键,因此大数据本身已经不重要了,怎么用大数据才是重点。他认为亟需被打破的迷思,就是大数据很大这件事。事实上,大数据是个非常差劲的命名,因为这让人们直接联想到数量,但其实数据的量从来都不是重点,如何将数据转换成商业价值才是关键。
阿里巴巴副总裁车品觉在接受《数位时代》专访时,也有类似观点:「忘掉大数据吧!如果大数据已经成为常态元素了,你何必特别讲出来呢?」车品觉认为,大数据只是创新决策的一种新工具,不用把它想得太万能,不是所有的问题都是数据问题,也不是所有的问题,大数据都能解决,「不用太神化它,太多的行外人把它讲得很神,反而我们业内人不敢说得太神话,因为知道兑现不了。」
关於大数据迷思,第一个你要知道的就是:大数据不是神,更不是万灵丹,以及大不大根本就不是重点。那重点是什么呢?
协助解决商业问题
「Big Data这个名字事实上是有点误导,真正赚钱的是,从大数据萃取出来的大智慧(Big Intelligence)。」和沛科技创办人翟本乔说。翟本乔以今年甫获得奥斯卡奖的《模仿游戏》(The Imitation Game)为例,说明大数据价值链中的关键角色:世界二次大战中,电脑之父图灵(Alan Mathison Turing)带领英国情报局打败德军,潜水艇的无线电波传来传去,听起来像杂音,这里头嘟嘟嘟的声音叫做数据(Data)。就算你知道它是摩斯密码里面的某一个字,可是这又怎么样?做机器的不是最有价值的,做那个破解密码的机器也不是最有价值的。你如果能把它破解出来,知道德国潜水艇在什么时候去哪里攻击你的舰队,然后根据这个情报做出反应,消灭德国舰队,这才是最有价值的。
大数据若只有技术,但缺乏商业眼光和解决问题的能力,那其实不叫大数据,而更像一场大灾难。根据2013年大数据公司InfoChimps的报告,大数据专案的失败率远高於一般IT专案,大数据专案的失败率高达55%,而一般IT专案是25%,等於每两个大数据专案就有一个会失败。
大数据专案的失败率为什么这么高?企业主的思维没有调整过来、缺少商业眼光、过度重视技术以及操之过急,都是导致大数据专案比一般IT专案更容易失败的原因。但其实打从一开始,大数据就不应该只是IT专案。「技术和平台只是一个工具,它还需要很多策略执行面的配套,大数据的成效才会发生。技术造成大数据不成功的机率很低,因为大家的技术成熟度都非常高,不管是大数据、中数据还是小数据,都是要解决业务上的问题。」贾景光表示。
企业主过度相信经验,是导致大数据专案失败的一大原因,事实上,这可能是影响最重大的一项,毕竟企业主若没有体认到数据决策的重要性,那么企业谈再多用大数据变现都是枉然。商业分析软体大厂赛仕电脑(SAS)副总经理高芬蒂表示,任何企业不管大小,只要懂得运用数据做决策,胜出机率一定比较大。但如果只是凭着经验拍脑袋,没有跟别人做出差异化,便比较容易失败。
大企业纷用大数据拚转型
无论企业新旧大小,大数据已开始全面进入各行各业,而且不同产业对大数据的关注点都不一样。例如便利商店强打即时方便,特别注重导购和促销。金融业则因其商品特性较为敏感且个人化,特别注重与顾客之间建立信任关系。电信业坐拥大量数据,但受限於法规,目前聚焦於用大数据提升服务品质。
大数据商业模式没有所谓一体适用的通则,但却有各产业都会遇上的共同困扰:大数据团队的管理问题。大数据亟需跨部门的整合协作,因此几乎所有成功的大数据案例,皆有设立专门统筹数据并和其他部门协调的单位,而且设置层级越高越好。例如IBM负责掌管大数据的市场智慧(Marketing Intelligence)部门,就直接隶属於总经理办公室。而远传电信的大数据智慧部也强调跨部门合作,让数据技术人员和行销、业务等部门互通有无,交换想法,好让数据分析更贴近实际业务需求。
小型企业也能玩大数据
最后,大数据是否成功,与企业大小并无直接关系,任何懂得善用数据做决策和创新的企业,都称得上是拥有大数据思维的企业。即使没有大数据,也不用妄自菲薄。如果你是中小企业,不要急着大兴土木建设大数据环境,不妨先盘点看看企业内部的数据是否开放透明,而且彼此相容。然后小规模地测试模型是否可行,确认想法是可复制的,再行大规模布署。另一方面,无论企业大小,先问对问题,事情就解决了一半,好问题会决定整个大数据专案的数据蒐集策略和种类。
中研院资科所研究员陈昇玮说:「大家都在忙着打造锅子、厨房和刀子,但好的厨师比较没有那么多,台湾厂商总觉得一定要把厨房准备好才能做菜,第一步就打造技术团队或是买技术平台,但其实绝大多数的企业都不需要这样做,因为台湾厂商真正拥有大数据的并不多。」
在大企业之外,其实新创企业也在整个大数据价值链中扮演重要角色,发挥小兵立大功的力量,值得关注。例如才成立不到1年的科智,以制造业数据管理平台服务夺得台湾第一座英特尔APEC挑战赛冠军奖盃。还有自诩为大数据矿工手中铲子的云深创新,其大数据推荐系统让HiNet新闻社群的黏着度提升了20%,同样令人惊艳。
从大企业到小新创,大数据,你学会了吗?
数据解读大数据
1.企业的大数据现况
过去一年,在美国已经展开数据主导计画的组织成长了125%,但其中有42%还在讨论如何实行。
80%大企业及63%中小企业正开展数据主导的计画
2.最普遍的数据来源
63%客户数据库
61%电子邮件
53%交易数据
51%工作清单
48% Word文件
3.未来一年的大数据预算规划
36%计画增加
41%没有增减
企业平均花费740万美元,采取数据相关的初步行动
大型企业:1,380万美元
中小企业:160万美元
4.大数据计画时间表
30%目前没有规划
27%已经展开大数据计画
14%正在进行大数据概念验证
12%未来1年内会启动大数据计画
8%有规划但没有明确时间表
8%考虑未来13~24个月施行计画
5.大数据预算的三大领域
58%数据分析
42%数据可视化
38%数据采矿
6.大数据专案的目标
61%增进决策品质
57%帮助预测及规划
51%增加决策速度
7.大数据的三大挑战
48%技术人员的能力限制
47%预算的限制
40%旧数据的处理能力
注:今年3月IDG Enterprise揭露了最新的大数据调查报告,主要是针对美国、英国、澳洲1,139间企业进行的调查结果。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02