软间隔支持向量机

在普通的支持向量机的讨论中，样本点或样本点映射后都是完全线性可分的。但是现实中存在问题

img-2024-05-02 16-20-11.png

软间隔支持向量机允许 SVM 在一些样本上出错，即允许某些样本不满足约束

对于软间隔，在最大化间隔的同时，还希望不满足约束的样本尽可能少，所以优化目标式改写为

其中是常数，称为「惩罚因子」，称为「0/1 损失函数」，其定义为

惩罚因子决定了对离群点带来损失的重视程度。当所有离群点的松弛变量的和一定时，越大，对目标函数的损失也越大，此时就暗示着非常不愿意放弃这些离群点，最极端的情况是把定为无限大，这样只要稍有一个点离群，目标函数的值就变成无限大，马上让问题变成无解，这就退化成了硬间隔问题。

惩罚因子不是一个变量，整个优化问题在解的时候，是一个必须事先指定的值，指定这个值以后，解一下，就得到一个分类器，然后用测试数据看看结果好不好，不好再换一个的值。如此就是一个参数寻优的过程。

由于非凸，非连续，数学性质不好，常用以下损失函数替代

img-2024-05-02 16-20-58.png

若用 hinge 损失代替，则优化目标式为

其中称为「松弛变量」（Slack Variable），且

变量记录了对分类的错误代价。- 以某些点不能正确划分为代价，来换取更大的分隔间隔。这就是所谓的「软间隔支持向量机」，解出即可得到划分超平面。

img-2024-04-11 18-53-42.png

对于软硬间隔的对偶问题式对比可以发现，两者唯一不同是对偶变量的约束条件

类似的，KKT 条件也会做出相应的变化。但是，软间隔支持向量机和硬间隔下一样，最终模型仅与支持向量有关。