
从What到How,大数据实战攻略秘笈_数据分析师培训
为什么大数据专案的失败率高达55%?你是每两个中就失败的那一个吗?看大数据实战攻略秘笈,自我诊断你是否还深陷大数据迷思不可自拔,一起破解大数据获利方程式。
马云、白宫、释昭慧和猫下去餐厅有什么共通点?答案是大数据。今年3月,阿里巴巴集团创办人马云来台的演讲中提到:「未来已不是IT时代,而是DT(Data Technology)时代!」揭示大数据对阿里巴巴集团的重要性。一个星期后,白宫宣布任命PayPal和eBay的前任执行长帕帝亚(DJ Patil),为全美国第一个首席数据科学家,帮助政府善用大数据,并巩固美国在数据科学领域的领先地位。而日前慈济内湖开发案闹得沸沸扬扬,释昭慧上谈话性节目时,竟也引用大数据,暗喻慈济遭教会保守势力暗算。台北市知名餐厅猫下去小馆在3月宣布取消订位服务的同时,也不忘提到大数据证明自己取消订位服务后,营业额不降反升。
无论这些大数据到底是不是真的「大」数据,都说明了一件事:大数据发展至今,几乎已经成为全民常识。从科技大佬、政治名人到市井小民,随口都可以说上几句大数据的大道理,大数据的热门程度可见一斑。但是你真的懂大数据吗?或者是说,你真的会用大数据吗?
从What到How
大数据变了,它变得更成熟也更主流了,以前你对大数据一知半解,依稀知道大数据可以干嘛,但现在这已经远远不够了。「两年前,客户会问大数据是什么?现在会问要怎么切入大数据、有什么题目可以做?一些进阶企业甚至会问,如何用更新的工具,让效率更快或价值更高?大家问的题目变具体了。」IBM软体事业处总经理贾景光说。
市场研究机构Gartner去年8月发布的「科技成熟度报告」显示,大数据已经从过热高峰期过渡到幻灭谷底期。报告中指出,「市场对大数据的兴致未减,但由於市场上开始出现越来越多样的大数据应用,各式尖端数据处理技术和应用陆续推陈出新,这让大数据开始挥别期望过热期,步入幻灭低谷期。」这说明大数据并非即将灭亡,相反的,大数据越来越成熟。交大产业加速器暨专利开发策略中心产业分析师黄秋华认为,幻灭才是成长的开始,大数据应用在未来只会越来越多,而且越来越多元,市场已普遍对大数据有所认识,各大企业也都已导入大数据专案。
每年都会在部落格上发布大数据产业地图的FirstMark Capital营运总监特克(Matt Turck),在2014年发布的大数据产业板块图中,数据应用的势力越来越大,跟2012年一比,数据应用已占整个产业板块近四分之一强。种种现象皆说明,大数据已经过了纸上谈兵的阶段,进入短兵相接时期。那问题来了,你该怎么做?
「大数据即将在5年内消失!」去年被Exebank选为全美排名第4首席技术长的Teradata技术长宝立明(Stephen Brobst),在接受《数位时代》专访时表示,「很多人以为大数据就是指大量的数据,事实上,我认为这是大数据中最无趣的部分。我们真正在寻找的是非传统的、未曾被挖掘过的数据,并且从这些数据中去提炼出价值。我相信在5年内,我们就不会再使用大数据这个词了,到头来大数据就只是数据而已。」
要用大数据,先打破迷思
宝立明意指,大数据将成为每家企业的DNA和未来能否保持竞争优势的关键,因此大数据本身已经不重要了,怎么用大数据才是重点。他认为亟需被打破的迷思,就是大数据很大这件事。事实上,大数据是个非常差劲的命名,因为这让人们直接联想到数量,但其实数据的量从来都不是重点,如何将数据转换成商业价值才是关键。
阿里巴巴副总裁车品觉在接受《数位时代》专访时,也有类似观点:「忘掉大数据吧!如果大数据已经成为常态元素了,你何必特别讲出来呢?」车品觉认为,大数据只是创新决策的一种新工具,不用把它想得太万能,不是所有的问题都是数据问题,也不是所有的问题,大数据都能解决,「不用太神化它,太多的行外人把它讲得很神,反而我们业内人不敢说得太神话,因为知道兑现不了。」
关於大数据迷思,第一个你要知道的就是:大数据不是神,更不是万灵丹,以及大不大根本就不是重点。那重点是什么呢?
协助解决商业问题
「Big Data这个名字事实上是有点误导,真正赚钱的是,从大数据萃取出来的大智慧(Big Intelligence)。」和沛科技创办人翟本乔说。翟本乔以今年甫获得奥斯卡奖的《模仿游戏》(The Imitation Game)为例,说明大数据价值链中的关键角色:世界二次大战中,电脑之父图灵(Alan Mathison Turing)带领英国情报局打败德军,潜水艇的无线电波传来传去,听起来像杂音,这里头嘟嘟嘟的声音叫做数据(Data)。就算你知道它是摩斯密码里面的某一个字,可是这又怎么样?做机器的不是最有价值的,做那个破解密码的机器也不是最有价值的。你如果能把它破解出来,知道德国潜水艇在什么时候去哪里攻击你的舰队,然后根据这个情报做出反应,消灭德国舰队,这才是最有价值的。
大数据若只有技术,但缺乏商业眼光和解决问题的能力,那其实不叫大数据,而更像一场大灾难。根据2013年大数据公司InfoChimps的报告,大数据专案的失败率远高於一般IT专案,大数据专案的失败率高达55%,而一般IT专案是25%,等於每两个大数据专案就有一个会失败。
大数据专案的失败率为什么这么高?企业主的思维没有调整过来、缺少商业眼光、过度重视技术以及操之过急,都是导致大数据专案比一般IT专案更容易失败的原因。但其实打从一开始,大数据就不应该只是IT专案。「技术和平台只是一个工具,它还需要很多策略执行面的配套,大数据的成效才会发生。技术造成大数据不成功的机率很低,因为大家的技术成熟度都非常高,不管是大数据、中数据还是小数据,都是要解决业务上的问题。」贾景光表示。
企业主过度相信经验,是导致大数据专案失败的一大原因,事实上,这可能是影响最重大的一项,毕竟企业主若没有体认到数据决策的重要性,那么企业谈再多用大数据变现都是枉然。商业分析软体大厂赛仕电脑(SAS)副总经理高芬蒂表示,任何企业不管大小,只要懂得运用数据做决策,胜出机率一定比较大。但如果只是凭着经验拍脑袋,没有跟别人做出差异化,便比较容易失败。
大企业纷用大数据拚转型
无论企业新旧大小,大数据已开始全面进入各行各业,而且不同产业对大数据的关注点都不一样。例如便利商店强打即时方便,特别注重导购和促销。金融业则因其商品特性较为敏感且个人化,特别注重与顾客之间建立信任关系。电信业坐拥大量数据,但受限於法规,目前聚焦於用大数据提升服务品质。
大数据商业模式没有所谓一体适用的通则,但却有各产业都会遇上的共同困扰:大数据团队的管理问题。大数据亟需跨部门的整合协作,因此几乎所有成功的大数据案例,皆有设立专门统筹数据并和其他部门协调的单位,而且设置层级越高越好。例如IBM负责掌管大数据的市场智慧(Marketing Intelligence)部门,就直接隶属於总经理办公室。而远传电信的大数据智慧部也强调跨部门合作,让数据技术人员和行销、业务等部门互通有无,交换想法,好让数据分析更贴近实际业务需求。
小型企业也能玩大数据
最后,大数据是否成功,与企业大小并无直接关系,任何懂得善用数据做决策和创新的企业,都称得上是拥有大数据思维的企业。即使没有大数据,也不用妄自菲薄。如果你是中小企业,不要急着大兴土木建设大数据环境,不妨先盘点看看企业内部的数据是否开放透明,而且彼此相容。然后小规模地测试模型是否可行,确认想法是可复制的,再行大规模布署。另一方面,无论企业大小,先问对问题,事情就解决了一半,好问题会决定整个大数据专案的数据蒐集策略和种类。
中研院资科所研究员陈昇玮说:「大家都在忙着打造锅子、厨房和刀子,但好的厨师比较没有那么多,台湾厂商总觉得一定要把厨房准备好才能做菜,第一步就打造技术团队或是买技术平台,但其实绝大多数的企业都不需要这样做,因为台湾厂商真正拥有大数据的并不多。」
在大企业之外,其实新创企业也在整个大数据价值链中扮演重要角色,发挥小兵立大功的力量,值得关注。例如才成立不到1年的科智,以制造业数据管理平台服务夺得台湾第一座英特尔APEC挑战赛冠军奖盃。还有自诩为大数据矿工手中铲子的云深创新,其大数据推荐系统让HiNet新闻社群的黏着度提升了20%,同样令人惊艳。
从大企业到小新创,大数据,你学会了吗?
数据解读大数据
1.企业的大数据现况
过去一年,在美国已经展开数据主导计画的组织成长了125%,但其中有42%还在讨论如何实行。
80%大企业及63%中小企业正开展数据主导的计画
2.最普遍的数据来源
63%客户数据库
61%电子邮件
53%交易数据
51%工作清单
48% Word文件
3.未来一年的大数据预算规划
36%计画增加
41%没有增减
企业平均花费740万美元,采取数据相关的初步行动
大型企业:1,380万美元
中小企业:160万美元
4.大数据计画时间表
30%目前没有规划
27%已经展开大数据计画
14%正在进行大数据概念验证
12%未来1年内会启动大数据计画
8%有规划但没有明确时间表
8%考虑未来13~24个月施行计画
5.大数据预算的三大领域
58%数据分析
42%数据可视化
38%数据采矿
6.大数据专案的目标
61%增进决策品质
57%帮助预测及规划
51%增加决策速度
7.大数据的三大挑战
48%技术人员的能力限制
47%预算的限制
40%旧数据的处理能力
注:今年3月IDG Enterprise揭露了最新的大数据调查报告,主要是针对美国、英国、澳洲1,139间企业进行的调查结果。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28PCU:游戏运营的 “实时晴雨表”—— 从数据监控到运营决策的落地指南 在游戏行业,DAU(日活跃用户)、MAU(月活跃用户)是衡量 ...
2025-08-28Excel 聚类分析:零代码实现数据分群,赋能中小团队业务决策 在数字化转型中,“数据分群” 是企业理解用户、优化运营的核心手段 ...
2025-08-28CDA 数据分析师:数字化时代数据思维的践行者与价值推动者 当数字经济成为全球经济增长的核心引擎,数据已从 “辅助性信息” 跃 ...
2025-08-28ALTER TABLE ADD 多个 INDEX:数据库批量索引优化的高效实践 在数据库运维与性能优化中,索引是提升查询效率的核心手段。当业务 ...
2025-08-27Power BI 去重函数:数据清洗与精准分析的核心工具 在企业数据分析流程中,数据质量直接决定分析结果的可靠性。Power BI 作为主 ...
2025-08-27CDA 数据分析师:数据探索与统计分析的实践与价值 在数字化浪潮席卷各行业的当下,数据已成为企业核心资产,而 CDA(Certif ...
2025-08-27t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26基于 SPSS 的 ROC 曲线平滑调整方法与实践指南 摘要 受试者工作特征曲线(ROC 曲线)是评估诊断模型或预测指标效能的核心工具, ...
2025-08-25神经网络隐藏层神经元个数的确定方法与实践 摘要 在神经网络模型设计中,隐藏层神经元个数的确定是影响模型性能、训练效率与泛 ...
2025-08-25CDA 数据分析师与数据思维:驱动企业管理升级的核心力量 在数字化浪潮席卷全球的当下,数据已成为企业继人力、物力、财力之后的 ...
2025-08-25