Python语言描述随机梯度下降法-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读Python语言描述随机梯度下降法

Python语言描述随机梯度下降法

2018-02-14

Python语言描述随机梯度下降法

1.梯度下降

1）什么是梯度下降？

因为梯度下降是一种思想，没有严格的定义，所以用一个比喻来解释什么是梯度下降。

简单来说，梯度下降就是从山顶找一条最短的路走到山脚最低的地方。但是因为选择方向的原因，我们找到的的最低点可能不是真正的最低点。如图所示，黑线标注的路线所指的方向并不是真正的地方。

既然是选择一个方向下山，那么这个方向怎么选？每次该怎么走？

先说选方向，在算法中是以随机方式给出的，这也是造成有时候走不到真正最低点的原因。

如果选定了方向，以后每走一步，都是选择最陡的方向，直到最低点。

总结起来就一句话：随机选择一个方向，然后每次迈步都选择最陡的方向，直到这个方向上能达到的最低点。

2）梯度下降是用来做什么的?

在机器学习算法中,有时候需要对原始的模型构建损失函数,然后通过优化算法对损失函数进行优化，以便寻找到最优的参数，使得损失函数的值最小。而在求解机器学习参数的优化算法中，使用较多的就是基于梯度下降的优化算法(GradientDescent,GD)。

3）优缺点

优点：效率。在梯度下降法的求解过程中，只需求解损失函数的一阶导数，计算的代价比较小，可以在很多大规模数据集上应用

缺点：求解的是局部最优值，即由于方向选择的问题，得到的结果不一定是全局最优

步长选择，过小使得函数收敛速度慢，过大又容易找不到最优解。

2.梯度下降的变形形式

根据处理的训练数据的不同，主要有以下三种形式：

1）批量梯度下降法BGD(BatchGradientDescent):

针对的是整个数据集，通过对所有的样本的计算来求解梯度的方向。

优点：全局最优解；易于并行实现；

缺点：当样本数据很多时，计算量开销大，计算速度慢

2）小批量梯度下降法MBGD（mini-batchGradientDescent）

把数据分为若干个批，按批来更新参数，这样，一个批中的一组数据共同决定了本次梯度的方向，下降起来就不容易跑偏，减少了随机性

优点：减少了计算的开销量，降低了随机性

3）随机梯度下降法SGD（stochasticgradientdescent）

每个数据都计算算一下损失函数，然后求梯度更新参数。

优点：计算速度快

缺点：收敛性能不好

总结：SGD可以看作是MBGD的一个特例，及batch_size=1的情况。在深度学习及机器学习中，基本上都是使用的MBGD算法。

3.随机梯度下降

随机梯度下降（SGD）是一种简单但非常有效的方法，多用用于支持向量机、逻辑回归等凸损失函数下的线性分类器的学习。并且SGD已成功应用于文本分类和自然语言处理中经常遇到的大规模和稀疏机器学习问题。

SGD既可以用于分类计算，也可以用于回归计算。

1）分类

a）核心函数

sklearn.linear_model.SGDClassifier

b）主要参数（详细参数）

loss：指定损失函数。可选值：‘hinge'(默认),‘log',‘modified_huber',‘squared_hinge',‘perceptron',

"hinge":线性SVM

"log":逻辑回归

"modified_huber":平滑损失，基于异常值容忍和概率估计

"squared_hinge":带有二次惩罚的线性SVM

"perceptron":带有线性损失的感知器

alpha:惩罚系数

c）示例代码及详细解释

importnumpy as np

importmatplotlib.pyplot as plt

fromsklearn.linear_modelimportSGDClassifier

fromsklearn.datasets.samples_generatorimportmake_blobs

##生产数据

X, Y=make_blobs(n_samples=50, centers=2, random_state=0, cluster_std=0.60)

##训练数据

clf=SGDClassifier(loss="hinge", alpha=0.01)

clf.fit(X, Y)

## 绘图

xx=np.linspace(-1,5,10)

yy=np.linspace(-1,5,10)

##生成二维矩阵

X1, X2=np.meshgrid(xx, yy)

##生产一个与X1相同形状的矩阵

Z=np.empty(X1.shape)

##np.ndenumerate 返回矩阵中每个数的值及其索引

for(i, j), valinnp.ndenumerate(X1):

x1=val

x2=X2[i, j]

p=clf.decision_function([[x1, x2]])##样本到超平面的距离

Z[i, j]=p[0]

levels=[-1.0,0.0,1.0]

linestyles=['dashed','solid','dashed']

colors='k'

##绘制等高线：Z分别等于levels

plt.contour(X1, X2, Z, levels, colors=colors, linestyles=linestyles)

##画数据点

plt.scatter(X[:,0], X[:,1], c=Y, cmap=plt.cm.Paired,

edgecolor='black', s=20)

plt.axis('tight')

plt.show()

d）结果图

2）回归

SGDRegressor非常适合回归问题具有大量训练样本（>10000），对于其他的问题，建议使用的Ridge，Lasso或ElasticNet。

a）核心函数

sklearn.linear_model.SGDRegressor

b）主要参数（详细参数）

loss：指定损失函数。可选值‘squared_loss'（默认）,‘huber',‘epsilon_insensitive',‘squared_epsilon_insensitive'

说明：此参数的翻译不是特别准确，请参考官方文档。

"squared_loss":采用普通最小二乘法

"huber":使用改进的普通最小二乘法，修正异常值

"epsilon_insensitive":忽略小于epsilon的错误

"squared_epsilon_insensitive":

alpha:惩罚系数

c）示例代码

因为使用方式与其他线性回归方式类似，所以这里只举个简单的例子：

importnumpy as np

fromsklearnimportlinear_model

n_samples, n_features=10,5

np.random.seed(0)

y=np.random.randn(n_samples)

X=np.random.randn(n_samples, n_features)

clf=linear_model.SGDRegressor()

clf.fit(X, y)

总结

以上就是本文关于Python语言描述随机梯度下降法的全部内容，希望对大家有所帮助。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

损失函数机器学习 numpy 逻辑回归最小二乘 SVM 支持向量机文本分类

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇Python过滤函数filter()使用自定义函数过滤序列实例

下一篇诺奖为什么致敬大数据

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

Python语言描述随机梯度下降法

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：贺译册谈产品经理的市场洞察力与数 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

【CDA干货】漏斗拆解：核心逻辑、实操方法与业务优 ...

【CDA干货】SQL数值转日期函数全解析：主流数据库语 ...

数据分析必修课：CDA数据分析师视角下的表格结构数 ...

CDA持证人专访：杨旭谈数据产品经理的工作实践与核 ...

【CDA干货】Python变量定义与类实例化：核心原理、 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】联合索引与覆盖索引：本质区别、实战场 ...

【CDA干货】维度表与事实表：数据仓库建模的核心逻 ...

从“指标堆砌”到“体系落地”：CDA数据分析师视角 ...

【CDA干货】SQL计算列值趋势的全场景实现方法与实战 ...

【CDA干货】用户决策链路全解析：从认知到复购的增 ...

CDA 三级《敏捷数据挖掘》教材知识体系全面解读 ...

【CDA干货】付费玩家流失的核心原因与游戏行业长效 ...

CDA持证人专访：蒋少寒谈传统制造业与互联网行业数 ...

学完商业数据分析，开启 CDA 量化策略：从业务思维 ...

CDA持证人专访：赵森淼谈药企数据分析从业体验与转 ...

【CDA干货】卡方检验与T检验结果的标准化解读方法及 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载