京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的价值不在于存储而是在于分析
社会的发展,市场的繁荣,互联网的热闹,让信息数据越来越多,因此大数据时代诞生。大数据被誉为继云计算、物联网之后IT产业又一次重要技术变革。
中国企业已然身处大数据时代,但如何利用大数据技术,成功提升自身价值,无疑仍是企业需要去探索的课题。近日,Teradata天睿公司大中华区大数据事业部总监孔宇华表示,企业需要从分析入手去挖掘大数据价值,作为连续14年获得Gartner公司评选的数据仓库领导者象限企业,Teradata始终站在数据仓库和数据分析的前列,通过不断的积累与创新,帮助客户充分呈现其大数据价值。
分析:大数据价值之所在
孔宇华认为,数据的价值不在于存储,而是在于分析。
现在,很多企业认为把各种结构化数据与非结构化数据都收集起来,放到一个地方进行统一存储就能够把大数据做好。而事实上,通过分析,才能释放出数据的价值。
“我们想告诉客户的是,不一定需要100个PC服务器才能把大数据做好,不一定需要1PB的数据才能把大数据做好。”孔宇华表示,“做大数据的时候,可以从一个应用、一个业务的需求开始,通过不同的数据分析、不同的数据源,把数据应用起来。”
据了解,TeradataAster大数据探索平台可以汇集不同的数据源、结构化的数据、非结构化的数据,并且有着很多不同的分析方法,如SQL、MapReduce,关联分析、路径分析、文本分析等,通过将这些分析方法进行结合,将充分释放数据的的价值。
此外,Teradata的数据探索平台可以在很短的时间内,将数据进行整理、分析,并将数据的价值展现给客户。“当企业看到数据的价值后,再做相关投入,就不会觉得大数据只是一个概念,是对我这家企业本身毫无影响的。让管理者快速看到大数据背后的真正价值,正是Aster平台的价值所在。”孔宇华表示。
Aster:大数据分析的瑞士军刀
“Aster就是大数据分析的瑞士军刀。”在向记者展示TeradataAster平台最新成果时,孔宇华如此描述。
同Hadoop相比,Aster探索平台基于SQL、SAS或R的界面,利用其进行大数据分析会更方便,而且数据永远存在一个地方,进行不同的分析时只需要调用不同的工具就可以完成,避免了数据在不同位置间的移动。
另外,Aster还提供了丰富的数据接口,能够连接到Hadoop、数据仓库以及其他提供API的数据源,使得数据无需转换到特定格式即可以进行调用分析,节省了大量数据转换与适配的时间。由于Aster提供了基于SQL运算引擎的支持,因此也可以连接到其他主流的商业智能(BI)工具,获得丰富的可视化功能。
孔宇华介绍,针对Aster大数据探索平台,Teradata新增了SNAPFramework(无缝网络分析处理框架),实现了分析引擎和文件存储的无缝和同步集成,能够执行并优化跨分析引擎和文件存储的查询。
SNAPFramework除了行存储,还支持列存储、文件存储等多种存储方式。在分析层面,除了传统的SQL和MapReduce之外,还引入了最新的图形分析引擎,能够处理大规模分析图表查询以及预建图形功能,并可以应用到客户流失、产品关联性、欺诈侦测以及推荐引擎等分析场景。
就在上个月,Teradata实现了Aster与R的整合,通过放宽内存和处理能力限制条件,扩展开源R语言分析能力。在数据库内运行R语言,可高速处理海量数据,满足企业分析能力需求。
孔宇华表示,TeradataAsterR为R语言分析师提供企业级就绪的商业分析解决方案,可以帮助R语言分析师从多个数据源访问及整合详细数据,通过更广泛的分析方法获得更准确的结果,具有高度可扩展性、可靠性和易用性。
针对Hadoop,Teradata则选择了合作与收购的方式。通过与Hortonworks的合作,为客户提供Hadoop相关的平台和工具。通过收购Revelytix和Hadapt,进一步完成了对Hadoop的整合。
“未来在Teradata的统一数据架构中,Hadoop将主要作为数据获取和整合平台,Aster主要作为数据挖掘和分析平台。”孔宇华表示。
平台、人员、流程:大数据落地三要素
怎样做才能实现大数据的落地?孔宇华给出的答案是:平台、人员和流程。
首先,需要有一个合适易用,并且能够和企业现有平台轻易进行结合;其次,需要内部人员具备一定的技能;最后,流程制度方面,需要结合大数据需求的敏捷项目管理方法,根据业务需求快速让技术人员利用平台提升数据的价值。
企业如何利用现有人员的技能,找出数据里的价值,恰恰是TeradataAster平台能够赋予客户的。孔宇华表示,通过TeradataAster大数据探索平台,企业可以在很短的时间内,利用原有的技能进行大数据分析,让管理者看到大数据背后的真正价值。
目前,Teradata在全球范围内已经积累了大量的成功案例,与超过十个行业的用户进行了合作,从传统的优势行业,如电信、金融、保险,到电商、医疗、制造与零售等,TeradataAster能够对各种场景进行深入分析,并通过丰富的可视化形式进行展现。
据悉,Teradata在中国成立了大数据技术研发团队,主要负责平台、数据库与分析函数的开发。另外,Teradata在中国还拥有优秀的大数据实施团队和实施合作伙伴,能够帮助客户充分呈现其大数据的价值。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27