上篇博客中我们嘚到的目标函数:
我们在优化时喜欢求最小值,将上式转化正等价的求最小值如下:
对于(2)式这是一个凸二次规划问题,我们可以使鼡拉格朗日乘数法进行优化
为什么能这样假设呢?如果约束条件都满足(4)式的最优值就是,和目标函数一样
因此我们可以直接求(4)式的最小值,等价于求原目标函数因此目标函数变成如下:
将求最大值和最小值交换位置后
交换以后的新问题是原始问题的对偶问題,这个新问题的最优值用来表示而且有d*≤p*,在满足某些条件的情况下这两者相等,这个时候就可以通过求解对偶问题来间接地求解原始问题为什么要这样转换呢?此处借他人之言之所以从minmax的原始问题,转化为maxmin的对偶问题一者因为是的近似解,二者转化为对偶問题后,更容易求解下面可以先求L 对w、b的极小,再求L 对的极大回顾一下上面的目标函数L
这是一个拉格朗日乘法优化方法得到的,由于偠求
先求最大值后求最小值,求最小值时将a看成常量,那么L就是w,b的函数了极值在导数为0的点处取到,因此分别求L对w,b的导数并令其為0,得如下结果
将(9)式带入(7)(为什么呢?)得到:
为什么能将(9)式带入(7)式呢因为极值在导数为零的点处取到,因此(9)式符合(7)式取极值时w,b的取值(10)式就是(7)式的最小值了,求完最小值然后求最大值。求对的极大即是关于对偶问题的符号最优囮问题。经过上面第一个步骤的求w和b得到的拉格朗日函数式子已经没有了变量w,b只有。从上面的式子得到: (11)式是关于a的式子如果能求出a,则可以根据(7)式求出w求出w后可以根据前面函数距离等于1的假设求出b怎样求a呢?这需要后面的核函数和松弛量的知识利用SMO算法求解,下篇博客继续介绍核函数最后给大家附一张我的推到图,是上面内容的简化版本