京公网安备 11010802034615号
经营许可证编号:京B2-20210330
作者 | CDA数据分析师
大数据革命引发了数据中心的爆炸式增长,这些中心正在以越来越高的速率消耗能源。本文回顾了两种提高数据中心效率的标准方法,并认为第三种方法-机器学习-是最佳解决方案。
天网,VIKI和HAL 9000就是一些具有机器学习功能的AI的例子。创建它们的目的是解决对人类而言过于复杂的问题,并通过神经网络对其进行控制,以提高效率,安全性和成功率。当然,电影需要对立面,因此这些AI奇迹给了不利的黑暗面——但是这种复杂的机器学习是真实的并且已经成功实现。
自2000年代以来,数据中心已经激增。一个大型电子商务服务数据中心仅用几个19英寸机架来部署所需的服务器,存储器,以及网络设备。如今,超大型数据中心成千上万的硬件设备部署在数千个机架上。它们源自本地办公室的小型服务器,现已发展成为超大型设施,以维护我们的物联网和所有相关数据。美国人使用的数据,流程,连接性和存储量需要大量电力,这意味着数据中心是主要的能源消耗者。占全国年用电量2%的行业和政府专家正致力于提高效率,因为预计数据中心的需求将会增加。
目前,解决此问题的方案主要有两个方面:
但是,它并没有确定解决此困难的解决方案。而真正的解决方案在于实现机器学习系统。通过它们的过程,可以减少数据中心的能耗,并使其效率比以前更高。如今,部署依赖于机器学习的工具的数据中心运营商正在从效率和可靠性方面获得最初的收益,但他们才刚刚开始摸索机器学习将对数据中心管理产生的全部影响。
机器学习是人工智能的子集,有望优化未来数据中心运营的各个方面,包括计划和设计,管理IT工作负载,确保正常运行时间以及控制成本。IDC预测,到2022年,由于具有嵌入式AI功能,数据中心中50%的IT资产将能够自主运行。
容纳大量服务器场的大型,不起眼的容纳器慢慢地在美国兴起。这是全球性现象,因为数据和信息都以数字方式存储,因此需要空间。由于节省了大量资金,我们对人类的模式和趋势有了更复杂的了解。不幸的是,将数据存储在服务器中并不像一个库。他们需要恒定的功率来产生热量,并且热量需要被冷却,从而消耗更多的能量。
2014年,仅美国数据中心就使用了约700亿度电,从这个角度来看,1 kWh将使智能手机充电一年。需要能源以保持数据中心24/7全天候运行,使用大量的冷却系统进行冷却以及在紧急情况下维持冗余电源。也就是说每年维护在大约七十亿美元,能源成本影响着每一个人。消费者,数据库提供者和环境都感受到了如此大量能源消耗的后果,但我们的利用率没有丝毫放缓的迹象。因此,利用和能源效率是适应的主要目标。
图1:数据中心的用电量(十亿千瓦时/年)
美国至少有300万个数据中心,足以容纳该国每100个人中的一个。数据中心的增长非常复杂,大多数服务器和相关设备都是在2000年至2010年期间购买的。但是,随着服务器空间使用效率的提高和对大型数据中心的依赖性增加,统计数据表明存储量将适应而不是增加。
有些人可能认为办公服务器比新的超大规模数据中心更有效率。或在破土动工并不必要地淘汰它们之前,应使用较旧的就地数据中心。这些想法有逻辑上的支持,独立服务器由其所有者处理,并且回收而不是更换,但是它们实际上并不起作用。现场服务器需要数据中心做的所有事情,因此公司在自己的服务器场上花费更多的钱,而不是使用远程中心所需的确切空间。而且,较旧的数据中心在构建时就没有考虑能源效率,因此,即使是看似新的数据中心也可能已过时。
图2:数据中心总用电量(十亿千瓦时/年)
美国能源部鼓励大规模实施能源效率。他们的“更好的建筑”计划邀请企业和数据中心减少能耗或使用可再生能源。诸如Google之类的大型科技公司率先采用了这种方式,通过机器学习系统来减少其数据中心的能耗。
机器学习是AI的过程,能够从场景中学习并做出反应,而不是通过编程的选项做出响应。机器学习系统会获得历史数据,参数(目标),并通过模仿我们自己大脑功能的神经网络进行操作。它们非常适合数据中心,这些数据中心对于以前的系统和专业人员来说已经变得复杂起来,无法有效地进行管理。数据中心每天都会发生近十亿次事件,只有通过直观的系统才能处理这些事件,以实现最大的可操作性。例如:
Google通过输入DeepMind系统,希望将其能降低和保持40%的能源效率,这是一个通用系统,他们希望广泛发布以减少能源使用。Google数据中心团队针对某些操作场景对DeepMind进行了培训,创建了自适应参数,输入了历史数据(例如温度和泵速),并将目标定位为未来的电源使用效率(PUE)。PUE实际上是建筑能耗与IT能耗之比;用于衡量能源效率。
当部署在Google的数据中心时,它可以通过分析难以理解的数据集并建议采取的措施来成功地减少能耗。这听起来与最初提到的AI所承担的任务相差不远。幸运的是,科幻小说与科学之间有清晰的界线。诸如DeepMind之类的系统是一项优势,能够以人类无法掌握的规模降低能耗。随着时间的流逝,更多的系统将实施机器学习,以便它们可以最大限度地提高可操作性,从而为人们节省金钱,更重要的是,为环境节省了资金。
Uptime Institute研究副总裁Rhonda Ascierto说:“这是数据中心管理的未来,但我们仍处于早期阶段。”IDC Cloud to Edge数据中心趋势服务研究总监Jennifer Cooke表示,随着越来越多的公司采用包含云,托管设施和内部数据中心的混合环境,并且将越来越多地包括边缘站点,创建更智能的数据中心变得越来越重要。
何为机器学习?简单来说,机器学习是从例子和经验(即数据集)学习而不是依赖于硬编码和预定义规则的算法。换句话说,不是开发者告诉程序如何区分苹果和橙子,算法被数据“训练”并且自己学习如何区分苹果和橙子。以下是当今数据中心管理中机器学习的五个最大用例:
Ascierto说,当今的组织正在使用机器学习来提高能源效率,主要是通过监视温度和调整冷却系统来实现的。
例如,谷歌在今年早些时候曾发布,它正在使用AI通过分析21个变量来自动管理和优化其数据中心的冷却,例如外部气温,数据中心的功率负载以及后方的气压。发出热气的服务器。该公司表示,Google的机器学习算法可实时自动连续不断地调整冷却装置的设置,从而使冷却每年的能源使用量减少30%。
此外,它可以就设计或配置数据中心的最有效方法(包括IT设备或工作负载的最佳物理位置)提出建议。
机器学习可以帮助IT组织预测需求,因此它们不会耗尽电力,冷却,IT资源和空间。例如,如果一家公司正在整合数据中心并将应用程序和数据迁移到中央数据中心,则算法可以帮助其确定此举如何影响该设施的容量,Ascierto说。
DCIM软件供应商Nlyte Software的首席战略官Enzo Greco说,容量规划是组织建立新数据中心的一项重要服务,该公司最近推出了数据中心管理即服(DMaaS)产品,并与IBM Watson合作对其进行了集成。将机器学习功能纳入其产品。
“您需要使数据中心尽可能准确。您需要多少台服务器?您需要多少冷却?您只需要与服务器数量一样多的散热。”他说。“此外,您需要多少电量?这取决于散热和服务器容量。”
在所有用例中,使用机器学习进行风险分析是最关键的,因为它可以识别异常并帮助防止停机。“机器可以检测出异常,否则将无法发现,” Ascierto说。
例如,施耐德电气的DMaaS可以分析来自关键数据中心设备(例如电源管理和冷却系统)的性能数据,并预测何时可能出现故障。施耐德电气数据中心解决方案架构师副总裁Joe Reele说,当算法检测到异常现象时,系统会警告客户,以便他们能够在设备出现故障之前进行故障排除。
将来,Ascierto看到托管服务提供商使用机器学习来更好地了解他们的客户并预测他们的行为-从购买或添加新服务到续订合同甚至支付账单的可能性。她说,这是客户关系管理的扩展,可以包括通过聊天框自动进行客户互动。
Maya HTT已经分析了客户情绪。Duquette说,它目前没有数据中心客户使用它,但是通过自然语言处理,该公司的软件可以分析电子邮件并记录支持电话以预测未来的客户行为。
Ascierto说,这将数据中心的运营和性能数据与财务数据(甚至包括适用税项在内)混合在一起,以了解购买和维护IT设备的成本。她说:“它模拟了一件设备的总拥有成本和整个生命周期,例如一种冷却系统与另一种冷却系统相比。”
例如,Salesforce在2016年收购了一家名为Coolan的初创公司,该公司使用机器学习来分析IT设备的总体拥有成本,直至单个服务器组件。问题是越来越多的公司将使用机器学习进行预算影响分析的时间。一些私人公司可能会自己做,但是这很复杂,因为它要求以计算机模型可以提取的格式容易获得财务数据。
出于安全原因,DMaaS客户不太可能希望与第三方共享其财务数据。她说:“对于DMaaS服务,在早期,让客户共享他们的财务数据是一个比较棘手的提议。”
这个领域还不成熟,但发展速度很快。人工智能系统正式交付使用还将需要一定的时间,就像数据中心招募的新的工作人员一样,不过类似的机器学习工具终将可以真正的帮助您运营数据中心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07