京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据催生数据中心设计新思维_数据分析师
预计到2020年,互联设备的数量将达到500亿。而众多的设备在2017年可能就会产生高达7.7 ZB的互联网数据。随着运营商放弃了客户端—服务器以及局域网架构,转而青睐侧重在服务器、存储与网络中采用虚拟化的设计,如此大量的数据处理需求给数据中心生态系统带来巨大挑战。为此,越来越多的公司开始选择基于移动计算、云服务、大数据和社交网络等领先技术的更加灵活且开放的平台。
亚马逊、谷歌与Facebook等创新领袖正在积极构建超大规模的数据中心,以处理海量的带宽需求与工作负载。最近,Facebook在开放计算项目主办的开放计算峰会分享了一个关于其数据中心开发的经典案例。开放计算项目由Facebook创立,旨在通过分享服务器、存储与网络的设计,开发高性能、低成本且节能的数据中心。据Facebook透露,开放平台已经帮助其节省了12亿美元的成本。
最近,许多企业正投入云计算的怀抱,他们一般从第三方购买计算容量,节约运营自身数据中心所需的资本与运营费用。因此,云服务提供商已成为对开放平台超大规模数据中心投资力度最大的投资者之一。以溢价提供高级服务的传统服务器提供商可能将面临来自开放平台提供商的激烈竞争,后者的成本更低且基础架构更灵活、可扩展。
使用开放平台的方法意味着须整体看待数据中心开发项目。虽然服务器是核心技术,但需要考虑包括服务器、存储、网络以及软件在内的整体系统,并以全新方法将这些组件更好地整合在一起,让数据中心实现真正的突破性变革。
虽然开放平台触及的不仅仅是服务器,但在满足下一代数据中心的传输容量、处理速度与节能高效的需求方面,服务器仍发挥着关键作用。在构建服务器时,必须通过一台物理服务器容纳多台虚拟服务器,以便在虚拟化成为业界标准的情况下提高服务器利用率。服务器需要使用既快速又节能的多核处理器,且必须与日益虚拟化的存储及网络系统无缝互动。
许多半导体公司与服务器制造商现在都在开发运行于ARM处理器、而非行业标准x86架构的服务器。ARM处理器普遍用于智能手机、平板电脑及其他便携式设备以及随物联网(IoT)趋势而出现的新兴设备、联网家电、汽车和各种网络传感器。ARM有助于各公司开发拥有创新型多核CPU的处理器,实现真正的服务器级性能,并面向网络、通信、大数据、存储及安全应用提供业界最佳的虚拟化加速器。
现代数据中心还需要更快速的网络连通性,千兆以太网将被10GbE、40GbE并最终被100GbE规模的管网所替代。10GbE结构网络(网络中的流量可流向各个方向)将有利于节能、易管理性以及通过网络虚拟化灵活使用计算资源。
同时,为了提高数据中心内架顶式(ToR)交换机与服务器网卡(NIC)之间的速度,降低两者间以太网连通性成本,最近成立的行业组织25Gb以太网联盟制定了新的以太网规范说明,以允许数据中心网络应用25Gbps或50Gbps以太网链路协议。
为云计算而构建的现代数据中心还通过所谓的存储解聚开创了存储技术新天地。近些年来,存储因服务器计算而聚合在一起,因此数据可以更快速地从存储中检索出来。但是,随着固态硬盘成为新的存储媒介,上述服务器的存储成本开始升高。现在,计算与存储之间的连接速度得到了提升,存储可以与计算再次分开或者解聚及共享。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23