京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据分析的三大演进方向
最近Gartner发布了2013年度BI和数据分析的魔力四象限图,同时Wikibon也发布了2013年大数据市场预测,两份报告都明确指出,随着数据分析正在成为企业IT的核心,昔日的BI-ETL-EDW分析范型已经完全落伍,不再适用。
2013开年不久,一连串的重大事件的发生标志着大数据和数据分析领域正在加速演进,对于数据分析师专业人士和企业管理者来说,2013年是大数据进入企业应用的关键一年。
近日Alteryx公司总裁乔治马修(George Mathew,Twitter帐号@gkm1)与大数据领域的著名专家Mayank Bawa、Mike Olson和Scott Yara就数据分析的传统范型(BI-ETL-EDW)即将被新的分析范型取代达成共识,几位专家认为全新的数据分析平台将消除当前分析软件在设计和实施方面的延迟和低效率,从根本上重新思考和定义三大阻碍企业数据分析应用的关键问题:数据管理、分析透明度以及用户应用。
以下是马修在博客中对新数据分析范型三大演进方向的解读,IT经理网编译整理如下:
一、数据管理
Hadoop已经成为企业管理大数据的基础支撑技术。最近随着Greenplum Pivotal HD、Hortonworks Stinger和Cloudera的Impala的发布,Hadoop的技术创新速度正在加快,上述Hadoop项目传递出一个非常明确的信号:主要的Hadoop发行商想要在Hadoop HDFS之上提供实时、互动的查询服务。这个趋势将两个领域的杰作整合到了一起:众所周知的SQL查询处理与具备指数级扩展能力的HDFS存储架构。参考阅读:Hadoop发行版升级,NoSQL的未来是SQL?
二、去黑箱化
预测分析是管理者进行数据化决策的关键。目前预测和统计分析领域已经已经有很多技术可以帮助企业洞察不远的未来。但预测分析眼下面临的的最大问题是“黑箱”化。随着企业领导越来越多地以来预测分析技术做出重大商业决策,预测分析技术需要去黑箱化:包括应用自描述数据沿袭,增加对底层数学和算法解释等。“去黑箱化”有利于企业管理者学会彻底驾驭数据分析工具,不但看到数据分析结果,还知道分析是如何得来的,分析工具的设计原理等,这有助于管理者增加对预测分析的信心,而不是过去那样完全依靠“信仰”。
三、应用普及
即使实现了分析的去黑箱化,企业数据分析应用在企业中的部署依然面临以下几个方面的挑战:发布可复用应用,创建最佳实践、组织范围内的横向协作,无缝重组模型等。在最终用户(员工)中的应用普及是数据分析成功的关键。例如建设一个专门提供分析应用的企业移动应用商店App Store往往能大大加快数据分析的应用普及。
新数据分析范型的重要特征:
新的数据分析范型是目标导向的,不关心数据的来源和格式,能够无缝处理结构化、非结构化和半结构化数据。能够输出有效结果;能够提供去黑箱化的预测分析服务,能够面向更广泛的普通员工快速部署分析应用。
最近Gartner发布了2013年度BI和分析的魔力四象限图,同时Wikibon也发布了2013年大数据市场预测,两个报告都明确指出,随着数据分析正在成为企业IT的核心,昔日的BI-ETL-EDW分析范型已经完全落伍,不再适用。新的数据分析范型正在崛起,以下是我们能看到的未来趋势:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07