「梯度下降法」,又称为最速下降法。1847 年由著名数学家柯西提出
基本思想为,假设我们爬山,如果想要最快地上到山顶,那么我们应该从山势最陡峭的地方上山。也就是山势变化最快的地方上山。同样,如果从任意一点出发,需要最快搜索到极大值,我们也应该从函数变化最快的方向搜索。
函数变化最快的方将就是函数的梯度。如果需要寻找函数极小点,那么应该从负梯度的方向寻找。该方法称为「梯度下降法」,即
梯度下降法的一般步骤为:考虑函数
再线性回归问题中,假设
注意,根据问题的不同,应设置不同的学习速度,如果代价函数很平滑,可以设置稍大的
在线性回归问题中,假设
代价函数可能有多个局部最优值,通常局部最优值不对应全局最优值。起始点即对应着
的初始化值。从不同的起始点出发时,梯度下降会收敛到不同的局部最优位置。
可以多次初始化初始值点
对于函数
因此
最终