京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据部署遭遇瓶颈 下一出口路在何方
如今,大数据应用程序比常规应用程序复杂10倍,开发人员通常需要了解大量的技术,以使大数据能够正常工作。
大数据部署遭遇瓶颈 下一出口路在何方?
大数据的应用仍然太难了。尽管有很多的炒作的成分,但大多数企业仍然努力从他们的数据中获得价值。而Dresner咨询服务公司得出结论:“尽管长时间的意识培养和炒作,大数据分析的实际部署目前并不广泛适用于大多数组织。”
这是人员的问题。尽管有说服力的数据,企业高管们往往宁愿忽略这些数据。但是,大数据复杂性的一大部分是因为所需要的软件。虽然Spark和其他更新的系统已经改善了轨迹,但大数据基础设施仍然太难了,这是杰西•安德森精明的一点。
实施起来困难
长期以来,人才一直是大数据采用的最大障碍之一。2015年Bain&Co.公司通过对高级IT主管调查发现,59%的受访者认为他们的公司缺乏对数据和业务有意义的能力。调查机构Gartner公司分析师尼克•荷德科特别指出,“到2018年,由于技能和集成的挑战,70%的Hadoop部署将无法满足成本节省和收入目标。”人员的技能很重要,换句话说,相关人才供不应求。
随着时间的推移,人员的技能差距将会减少,当然,但是了解平均Hadoop部署是不平凡的。安德森指出,大数据的复杂性归结为两个主要因素:“你需要掌握10到30种不同的技术,只是为了创建一个大数据解决方案。而采用分布式系统是比较简单的”。
问题是什么
安德森表示典型的移动应用程序与Hadoop支持的应用程序的复杂性,注意后者涉及“盒子”或组件的数量的两倍。然而,用简单的词语表达,“Hadoop解决方案的‘Hello World’比其他域中到高级设置更复杂。
安德森说,人们面临复杂的困难,是需要了解涉及的广泛的系统。例如,人们可能需要知道10种技术来构建大数据应用程序,但这可能需要熟悉另外20种技术,只需知道在给定情况下使用哪种技术即可。否则,例如,你将如何知道使用MongoDB而不是Hbase?还是Cassandra?或neo4j?
此外,在分布式系统中运行有其复杂性,而大数据的技能短缺依然存在。
简单的出路
企业正在努力尽量减少在大数据构建中所固有的复杂性的一种方法是转向公共云。根据最近的Databricks对Apache Spark用户的调查,Spark到公共云的部署在过去一年中增长了10%,达到了总体部署的61%。云计算代替了那些繁琐以及不灵活的内部部署基础设施,可以提供灵活性。
然而,它并不能消除所涉及的技术的复杂性。关于此或数据库或消息代理的相同选择仍然存在。这种选择,以及其中的复杂性,不会很快消失。像Cloudera和Hortonworks这样的公司已经尝试简化这些选择,将它们整合到堆栈中,但是它们仍然基本上提供需要被理解以便有用的工具。Amazon Web Services公司通过其Lambda服务进一步发展,这使得开发人员能够专注于编写应用程序代码,而AWS负责所有底层基础架构。
但下一步是完全为最终用户预先制作应用程序,这是华尔街分析师彼得•戈德马克所说的销售基础设施组件的更大的机会。用他的话来说,一个主要类别的“获奖者”是应用和分析供应商,它将基础技术的复杂性抽象为一个用户友好的前端。企业用户的可寻址的受众将比程序员的市场致力于核心技术。
这是市场需要去的地方,而且是快速的。人们几乎没有做过。对于每个能够掌握所有的相关的大数据技术公司,包括那些高端产业的企业,只是想只是希望重塑自己,需要有人使他们的数据更具可操作性,人们现在需要这类供应商出现。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11在CDA(Certified Data Analyst)数据分析师的实操体系中,统计基本概念是不可或缺的核心根基,更是连接原始数据与业务洞察的关 ...
2026-02-11在数字经济飞速发展的今天,数据已成为核心生产要素,渗透到企业运营、民生服务、科技研发等各个领域。从个人手机里的浏览记录、 ...
2026-02-10在数据分析、实验研究中,我们经常会遇到小样本配对数据的差异检验场景——比如同一组受试者用药前后的指标对比、配对分组的两组 ...
2026-02-10