如何获取Bayes 最优分类器中类条件概率
假设
「极大似然估计」(Maximum Likelihood Estimation,MLE)是频率主义学派根据数据采样来估计概率分布参数的经典方法。令
最大对数似然估计的参数
在连续属性情况下,假设概率密度函数符合高斯分布,
这表明,通过极大似然法得到的正态分布均值就是样本均值,方差就是
注意,这种参数化的方法虽然能使得类条件概率估计变得相对简单,但估计结果的准确性严重依赖于所假设的概率分布形式是否符合潜在的真实数据分布。在现实应用中,若仅凭“猜测”来假设概率分布形式,则很可能产生误导性的结果。此时,往往需要在一定程度上利用关于应用任务本身的经验知识。
假设一个袋子中装有红白两种球,比例位置。每次从中随机抽取一球,记录其颜色后再放回袋内。假设抽取了 10 次,其中 7 次蓝球,3 次红球。在此数据样本条件下,利用最大似然估计法求袋子中红球的比例。
解:
假设每次取出的球的颜色为一随机变量,且符合分布
最大似然估计得思想是,一次抽样有许多可能结果,如果某一结果在一次抽样中出现了,则认为这一结果使所有可能结果中概率最大的一个。
每次抽取的结果可以视为伯努利随机变量,其中抽取到红球的概率为
记
为了便于处理,我们常常转而最大化似然函数的对数形式:
对
解这个方程可得:
所以,最大似然估计下,袋子中红球的比例
假设
求参数
解:
令
对数似然函数为
首先尝试求解均值。令
解方程
因此