京公网安备 11010802034615号
经营许可证编号:京B2-20210330
AI、大数据、云计算深度融合,星环大数据3.0给用户带来啥体验
“伴随着人工智能、云计算、大数据的深度融合,大数据技术已经进入3.0时代。”星环科技创始人兼CEO孙元浩8月14日在2018星环科技大数据3.0研讨会北京站上明确表示。
当前,人类社会快速数据化。一方面,全球使用互联网的人数突破70亿,50亿设备接入网络,拥有的数据量达到40ZB,其中90%为近两年产生的数据,而大数据应用的规模将突破5000亿美元。另一方面,大数据应用向纵深发展,覆盖行业逐步扩展到政府、金融、安全、教育等众多领域。同时,计算模式也在快速变化,IOT边缘计算机、AI、云计算将逐渐成为计算模式中时代内容。
大数据3.0阶段,大数据分析平台将成为一个联系IT系统与从员工、客户、合作伙伴、社会,到设备的一个全生态的核心系统。大数据3.0的影响已经开始变得越来越广泛。而未来星环科技在人工智能、云计算、大数据三大“跑道”竞速,为用户提供大数据基础平台,也让大数据应用体验进入一个新阶段。
融合引领大数据3.0五大态势
孙元浩从技术趋势、开发与维护、数据与业务的关系三个维度说明,大数据已经进入3.0阶段。
星环科技创始人兼CEO孙元浩
从技术趋势的维度看,大数据、云计算和人工智能将走向深度融合,容器编排系统、大数据分析和深度学习能够融合在一起,大数据从技术上而言迈入3.0阶段。在3.0阶段,大数据技术基本上普及化,可以随手获得,绝大部分的人都能够非常便捷地获取大数据分析能力。
大数据平台也经历了三个发展阶段。1.0阶段,大数据应用开发和运维都有非常高的技术门槛,只有少量的高科技企业才能自建和使用;2.0阶段,随着专业的Hadoop生态的出现,大数据应用开发和运维的门槛大幅降低,像财富500强公司,因为拥有自己的IT团队,可以去运维这一复杂的系统;3.0阶段,包括星环以及一些公有云服务商可以提供完整的大数据产品线,也可以提供云化方式服务,把大数据变成PaaS和微服务化,客户可以随时使用
数据与业务的关系也在悄然发生变化。1.0阶段是业务电子化阶段,企业要信息化,业务要能够IT化、数字化,业务需求是主流;2.0阶段是技术支撑业务应用阶段,响应业务部门的业务需求,图形化报表是主要表现形式,科技被动响应服务需求;3.0阶段是业务数据化阶段,数据分析开始成为企业的创新驱动力,大数据以业务部门为主,业务需求能够用大数据技术迅速支撑。
孙元浩认为,大数据3.0时代实现5大融合,具有5大特征:
首先,数据平台的融合,统一了数据湖、数据仓库、数据集市,不再需要混合结构。而借助星环的技术和产品,只需一套引擎,就能够解决数据分析的所有问题,而不需要在不同架构之间换来换去。这也是大数据技术向简单化、应用化方向迈出的重要一步,IT架构可以极度简化。
其次,开发方式融合,只需要一套SQL+R/Python开发语音与接口。未来,进行大数据分析,只需要掌握SQL+R/Python三种语言就够了。R/Python将是预测性分析和机器学习的主流,R专注在统计上面,Python专注在深度学习上。
第三,BI与AI的融合,数据分析工具链走向融合。 BI与AI已经嵌在一起,密不可分,因为AI做数据特征分析需要用到BI,需要可视化。BI通常也会嵌入一些机器学习的算法来做智能分析。
第四,人工智能、大数据、云计算的融合,弹性资源策略让服务随处可见。利用云计算的资源池化,利用容器技术统一管理和调度,支持单行扩展,按需使用,按需付费。星环让业务人员随时使用数据分析平台成为可能。
第五,应用、数据与企业应用生态的融合,数据、服务、应用相互促进,形成闭环,促进企业大数据应用生态的发展。
TDC践行大数据、人工智能与云计算的融合趋势
在2018星环科技大数据3.0研讨会的每一站,星环科技都带着最新的产品和案例,与各地的企业用户与观众分享。
星环科技研发总监、首席工程师刘汪根
接受记者采访的星环科技研发总监、首席工程师刘汪根介绍,经过多年自主研发,星环科技已经建立了包括ABCD+一体机在内的五大产品系列:其中,A是人工智能产品,如智子人工智能平台Transwarp Sophon;B是大数据产品,包括一站式大数据平台Transwarp Data Hub (TDH);C是云计算产品,包括基于容器的智能大数据云平台Transwarp Data Cloud (TDC);D是数据库产品,包括分布式闪存数据库ArgoDB、分布式图数据库StellarDB、交易型数据库KunDB等;一体机则各种超融合一体机,包括超融合大数据一体机TxData Appliance、流处理器一体机、智能识别一体机等。
刘汪根认为,在大数据、人工智能、云计算三者共同蓬勃发展的时代背景下,星环新一代智能大数据云平台TDC作为这三个领域相互融合的代表性产品,推动了服务容器化以及大数据生态上云。TDC在实现大数据技术落地时利用云计算三项核心技术——虚拟化技术、数据中心技术、多租户技术,继承云平台资源弹性伸缩、自动修复、同一平台服务于多租户的能力,满足企业对大数据云平台的多种需求。星环科技产品实现ABC全面融合,可以最大程度地支持大数据3.0时代下企业的多方面需求。
目前,TDC已实现私有云和托管云的部署方式,为不同体量、不同业务类型、不同运作模式的企业提供针对性的服务。TDC可部署在大型企业内部,提供定制化的实现,集中数据资源和计算资源,为各个业务部门和分支机构提供数据分析服务,满足企业对大数据分析云的需求
而在今年下半年,TDC将提供公有云部署方式与服务,提供PaaS平台。在公有云领域,TDC提供各种内部的数据产品和业务,云上的客户可以自主快速的构建集群、创建应用,启动大数据业务,立即创建立即销毁,减少技术中心成本投入。
未来,TDC也可以用于混合云的构架,对于特定的需要对外提供服务的私有云企业,TDC支持接入公有云IaaS服务,从而在业务高峰期提供良好的弹性扩展、精确计费等能力,提高企业的服务响应能力。
北京站会场
自主可控数据库实现终点突破
今年5月,全球最知名的数据管理系统评测基准标准化组织TPC宣布,星环TDH平台通过TPC-DS基准测试,打破了该领域12年来没有厂商通过该项测试的局面,在世界范围内填补了该项技术的空白。刘汪根说,这标志着星环在Hadoop上打造的分布数据库,在功能上已经可以与传统的关系数据库相媲美,同时处理的数据量也比传统关系数据库高几个量级。这说明在大数据基础软件领域,国产技术已经实现弯道超车,星环的分布数据库已经能够取代传统关系数据库做复杂的处理了。
刘汪根认为,作为本土的软件研发企业,星环科技在过去五年中坚持大数据底层基础产品的研发,坚持自主创新,在一些领域如大数据分布式数据库领域实现了技术突破,实现的基础软件的弯道超车。
据介绍,ArgoDB是星环自研的新一代分布式闪存数据库,能够同时满足多维实时检索、准实时分析和海量数据离线分析业务场景。在当前混合业务场景逐渐成为主流的情况下,ArgoDB能够极大的简化数据平台架构、降低实施与运维成本。
Transwarp StellarDB是一款为企业级图应用而打造的分布式图数据库,用于快速查找数据间的关联关系,并提供强大 的算法分析能力。StellarDB克服了海量关联图数据存储的难题,通过自定义图存储格式和集群化存储,实现了传统数据库 无法提供的低延时多层关系查询,在社交网络、公安、金融领域都有巨大应用潜力。
大数据的发展也离不开生态建设。星环已经逐渐形成以星环技术为核心的生态系统,包括免费社区版用户遍布21个省市,累计培训开发者超过2000人,累计为超过400家企业提供培训,累积颁发证书超过1000张。我们期望在大数据3.0时代,星环能给用户带来不一样的体验。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27