机器学习导论（附录）–多变量极值数学分析

4,726次阅读

共计 913 个字符，预计需要花费 3 分钟才能阅读完成。

多元函数求极值问题 – ACdreamer – 博客频道 – CSDN.NET

今天来讨论多元函数求极值问题，在Logistic回归用牛顿迭代法求参数会用到，所以很有必要把它研究清楚。

回想一下，一元函数求极值问题我们是怎样做的？比如对于凹函数机器学习导论（附录）--多变量极值数学分析，先求一阶导数，得，

由于极值处导数一定为零，但是导数等于零的点不一定就有极值，比如机器学习导论（附录）--多变量极值数学分析。所以还需要进一步判断，对

函数继续求二阶导得到机器学习导论（附录）--多变量极值数学分析，因为在驻点处二阶导数成立，所以

在机器学习导论（附录）--多变量极值数学分析处取得极小值，二阶导数在这里的意义就是判断函数局部的凹凸性。

在多元函数中求极值的方法类似，只是在判断凹凸性这里引入了一个矩阵，叫做Hessian矩阵。

如果实值多元函数机器学习导论（附录）--多变量极值数学分析在定义域内二阶连续可导，那么我们求它的极值，首先对所有求偏导，即

得到机器学习导论（附录）--多变量极值数学分析个方程如下

机器学习导论（附录）--多变量极值数学分析

通过这机器学习导论（附录）--多变量极值数学分析个方程可以解得驻点，这个驻点是一个长度为的一维向量。但是我们仅仅得到这个驻点，其实在这

个驻点有3种情况，分别是：局部极大值，局部极小值和非极值。

所以接下来要做的事就是判断这个驻点机器学习导论（附录）--多变量极值数学分析属于这3个中的哪一个。所以就引入了Hessian矩阵，也就是说它用来

判断在多元函数的凹凸性问题。

Hessian矩阵是一个多元函数的二阶偏导数构成的方阵，描述了函数的局部曲率，常用于牛顿迭代法解决优化问题。

例如对于上面的多元函数机器学习导论（附录）--多变量极值数学分析，如果它的二阶偏导数都存在，那么Hessian矩阵如下

机器学习导论（附录）--多变量极值数学分析

如果函数机器学习导论（附录）--多变量极值数学分析在定义域内二阶连续可导，那么的Hessian矩阵在定义域内为对称矩阵，因为如果函数连

续，则二阶偏导数的求导顺序没有区别，即

机器学习导论（附录）--多变量极值数学分析

有了Hessian矩阵，我们就可以判断上述极值的3种情况了，结论如下

（1）如果机器学习导论（附录）--多变量极值数学分析是正定矩阵，则临界点处是一个局部极小值

（2）如果机器学习导论（附录）--多变量极值数学分析是负定矩阵，则临界点处是一个局部极大值

（3）如果机器学习导论（附录）--多变量极值数学分析是不定矩阵，则临界点处不是极值

接下来继续学习如何判断一个矩阵是否是正定的，负定的，还是不定的。

一个最常用的方法就是顺序主子式。实对称矩阵为正定矩阵的充要条件是的各顺序主子式都大于零。

由于这个方法涉及到行列式的计算，比较麻烦！对于实二次型矩阵还有一个方法，描述如下

实二次型矩阵机器学习导论（附录）--多变量极值数学分析为正定二次型的充要条件是的矩阵的特征值全大于零。为负定二次型的充要条

件是机器学习导论（附录）--多变量极值数学分析的矩阵的特征值全小于零，否则是不定的。

正文完

请博主喝杯咖啡吧！

post-qrcode

发表至： ml

2016-11-16

版权声明：本站原创文章，由 admin 2016-11-16发表，共计913字。

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

机器学习中分类任务的两种模型

机器学习参数模型与非参数模型

机器学习导论（5）–GDA高斯判别模型

机器学习导论（6）—朴素贝叶斯

程序修行从“拔刀术”到“万剑诀”

Matlab自定义Table表格颜色

评论（没有评论）

验证码