
一、线性支持向量机的概念
线性支持向量机是针对线性不可分的数据集的,这样的数据集可以通过近似可分的方法实现分类。对于这样的数据集,类似线性可分支持向量机,通过求解对应的凸二次规划问题,也同样求得分离超平面
以及相应的分类决策函数
二、与线性可分支持向量机的比较
线性支持向量机与线性可分支持向量机最大的不同就是在处理的问题上,线性可分支持向量机处理的是严格线性可分的数据集,而线性支持向量机处理的是线性不可分的数据集,然而,在基本的原理上他们却有着想通之处。这里的线性不可分是指数据集中存在某些点不能满足线性可分支持向量机的约束条件:。
具体来讲,对于特征空间上的训练数据集,且不是线性可分的,即存在某些特异点不满足的约束条件,若将这些特异点去除,那么剩下的数据点是线性可分的,由此可见,线性可分支持向量机是线性支持向量机的特殊情况。为了解决这样的问题,对每个样本点
引入一个松弛变量
,且,则上述的约束条件被放宽,即:
此时目标函数变为:
其中称为惩罚参数,且。在线性支持向量机中加入了惩罚项,与线性可分支持向量的应间隔最大化相对应,在线性支持向量机中称为软间隔最大化。数据分析师培训
三、线性支持向量机的原理
由上所述,我们得到线性支持向量机的原始问题:
接下来的问题就变成如何求解这样一个最优化问题(称为原始问题)。引入拉格朗日函数:
其中,。
此时,原始问题即变成
利用拉格朗日函数的对偶性,将问题变成一个极大极小优化问题:
首先求解,将拉格朗日函数分别对求偏导,并令其为0:
即为:
将其带入拉格朗日函数,即得:
第二步,求,即求:
由可得
,因为在第二步求极大值的过程中,函数只与a有关。
将上述的极大值为题转化为极小值问题:
这就是原始问题的对偶问题。
四、线性支持向量机的过程
1、设置惩罚参数,并求解对偶问题:
假设求得的最优解为;
2、计算原始问题的最优解:
选择中满足
的分量,计算:
3、求分离超平面和分类决策函数:
分离超平面为:
分类决策函数为:
五、实验的仿真
1、解决线性可分问题
与博文“简单易学的机器学习算法——线性可分支持向量机”实验一样,其中取中的最大值。
MATLAB代码为
[plain] view plain copy 在CODE上查看代码片派生到我的代码片
%% 线性支持向量机
% 清空内存
clear all;
clc;
%简单的测试数据集
X = [3,3;4,3;1,1];
y = [1,1,-1];%标签
A = [X,y'];
m = size(A);%得到训练数据的大小
% 区分开特征与标签
X = A(:,1:2);
Y = A(:,m(1,2))';
for i = 1:m(1,1)
X(i,:) = X(i,:)*Y(1,i);
end
%% 对偶问题,用二次规划来求解
H = X*X';
f = ones(m(1,1),1)*(-1);
B = Y;
b = 0;
lb = zeros(m(1,1),1);
% 调用二次规划的函数
[x,fval,exitflag,output,lambda] = quadprog(H,f,[],[],B,b,lb);
% 定义C
C = max(x);
% 求原问题的解
n = size(x);
w = x' * X;
k = 1;
for i = 1:n(1,1)
if x(i,1) > 0 && x(i,1)<C
b(k,1) = Y(1,i)-w*X(i,:)'*Y(1,i);
k = k +1;
end
end
b = mean(b);
% 求出分离超平面
y_1 = [0,4];
for i = 1:2
y_2(1,i) = (-b-w(1,1)*y_1(1,i))./w(1,2);
end
hold on
plot(y_1,y_2);
for i = 1:m(1,1)
if A(i,m(1,2)) == -1
plot(A(i,1),A(i,2),'og');
elseif A(i,m(1,2)) == 1
plot(A(i,1),A(i,2),'+r')
end
end
axis([0,7,0,7])
hold off
实验结果为:
(线性可分问题的分离超平面)
2、解决线性不可分问题
问题为:
(线性不可分问题)
MATLAB代码:
[plain] view plain copy 在CODE上查看代码片派生到我的代码片
%% 线性支持向量机
% 清空内存
clear all;
clc;
% 导入测试数据
A = load('testSet.txt');
% 处理数据的标签
m = size(A);%得到训练数据的大小
for i = 1:m(1,1)
A(i,m(1,2)) = A(i,m(1,2))*2-1;
end
% 区分开特征与标签
X = A(:,1:2);
Y = A(:,m(1,2))';
for i = 1:m(1,1)
X(i,:) = X(i,:)*Y(1,i);
end
%% 对偶问题,用二次规划来求解
H = X*X';
f = ones(m(1,1),1)*(-1);
B = Y;
b = 0;
lb = zeros(m(1,1),1);
% 调用二次规划的函数
[x,fval,exitflag,output,lambda] = quadprog(H,f,[],[],B,b,lb);
% 定义C
% C = mean(x);
C = max(x);
% 求原问题的解
n = size(x);
w = x' * X;
k = 1;
for i = 1:n(1,1)
if x(i,1) > 0 && x(i,1)<C
b(k,1) = Y(1,i)-w*X(i,:)'*Y(1,i);
k = k +1;
end
end
b = mean(b);
% 求出分离超平面
y_1 = [-4,4];
for i = 1:2
y_2(1,i) = (-b-w(1,1)*y_1(1,i))./w(1,2);
end
hold on
plot(y_1,y_2);
for i = 1:m(1,1)
if A(i,m(1,2)) == -1
plot(A(i,1),A(i,2),'og');
elseif A(i,m(1,2)) == 1
plot(A(i,1),A(i,2),'+r')
end
end
hold off
实验结果为:
(线性不可分问题的分离超平面)
注:这里的的取值很重要,的取值将决定分类结果的准确性。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27