
随着时间序列分析的普及,LSTM 成为了深度学习中最常用的工具之一。它以其优异的性能和对数据的自适应特征提取而闻名。然而,在实际应用中,我们通常需要通过多变量来预测未来时间序列数据。本文将介绍如何使用多变量 LSTM 模型来进行时间序列预测,并且给出一个例子来预测未来一周的气温。
首先,我们需要准备数据集。在本例中,我们将使用包含多个变量的天气数据。这些变量包括温度、湿度、风速、降雨量等。我们将选取最近一年的数据,将其前80%作为训练集,后20%作为测试集。
接下来,我们需要对数据进行归一化处理。由于不同变量之间的值域差异较大,我们需要将其进行缩放到一个相同的范围内。这里我们将使用 Scikit-Learn 库中的MinMaxScaler函数。
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
train_data = scaler.fit_transform(train_data)
test_data = scaler.transform(test_data)
接下来,我们需要将数据转换成适合 LSTM 模型的格式。在多变量情况下,我们需要将每个时刻的输入向量扩展到包含多个变量。这里我们将以过去 30 天的数据为输入,预测未来一周的气温。
import numpy as np def create_dataset(X, y, time_steps=1):
Xs, ys = [], [] for i in range(len(X) - time_steps):
v = X[i:i + time_steps]
Xs.append(v)
ys.append(y[i + time_steps]) return np.array(Xs), np.array(ys)
TIME_STEPS = 30 X_train, y_train = create_dataset(train_data, train_data[:, 0], TIME_STEPS)
X_test, y_test = create_dataset(test_data, test_data[:, 0], TIME_STEPS)
接下来,我们可以构建 LSTM 模型。在本例中,我们将使用两层 LSTM 和一个全连接层。模型的输入形状应该是(samples, time_steps, features)。
from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, LSTM
model = Sequential([
LSTM(units=64, input_shape=(X_train.shape[1], X_train.shape[2]), return_sequences=True),
LSTM(units=32, return_sequences=False),
Dense(units=1)])
在训练模型之前,我们需要定义损失函数和优化器,并编译模型。
model.compile(loss='mean_squared_error', optimizer='adam')
现在,我们可以开始训练模型。在每个 epoch 后,我们将记录训练集和测试集上的损失值,并可视化它们的变化。
history = model.fit(
X_train, y_train,
epochs=50,
batch_size=16,
validation_split=0.1,
verbose=1,
shuffle=False) import matplotlib.pyplot as plt
plt.plot(history.history['loss'], label='train')
plt.plot(history.history['val_loss'], label='test')
plt.legend()
plt.show()
在模型训练完成后,我们可以对测试集进行预测,并将预测结果与真实值进行比较。
y_pred = model.predict(X_test)
plt.plot(y_test, label='true')
plt.plot(y_pred, label='predicted')
plt.legend()
plt.show()
最后,我们将使用训练好的模型来预测未来一周的气温。首先,我们需要获取最近 30 天的数据,然后使用模型进行预测。每次预测完之后,我们将新的预测值添加到输入序列中,用于下一次的预测。
X_last30
= test_data[-TIME_STEPS:] forecast = [] for i in range(7): y_pred_one = model.predict(X_last30.reshape(1, TIME_STEPS, -1)) forecast.append(y_pred_one[0, 0]) X_last30 = np.vstack((X_last30[1:], y_pred_one))
forecast = scaler.inverse_transform(np.array(forecast).reshape(-1, 1))
以上便是使用多变量 LSTM 进行时间序列预测的整个流程。通过训练模型,我们可以获得对未来数据的预测结果,并且不仅仅考虑了单一变量的影响,而是综合了多个变量的影响。当然,这只是一个简单的例子,实际应用中可能会涉及到更加复杂的数据和模型。
相信读完上文,你对算法已经有了全面认识。若想进一步探索机器学习的前沿知识,强烈推荐机器学习之半监督学习课程。
学习入口:https://edu.cda.cn/goods/show/3826?targetId=6730&preview=0
涵盖核心算法,结合多领域实战案例,还会持续更新,无论是新手入门还是高手进阶都很合适。赶紧点击链接开启学习吧!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27