一、背景引言

机器学习数据挖掘

1. 房价预测问题

已知一些不同面积住房销售放假如下表所示。对于一个新的待售住房,其面积为 132 ,预测其可能的销售价格

面积 销售价格
123 244
150 325
156 180
102 220
40 76
77 132

我们可将问题表示为机器学习问题,包括数据和模型两个部分,其中,数据即可进一步分为训练集测试集。在本例中,测试集只有一个

根据机器学习的理论,模型包括训练和测试两个过程。首先通过训练集 拟合出函数 ,使得 在训练集 在某种评价指标 上全局最优或者局部最优,同时对测试样本集 有预测能力

三、优化方法

四、广义线性模型

五、对数几率模型

线性回归和对数几率回归

线性回归和对数几率回归既有区别由联系紧密

区别在于,线性回归中标签为一连续值,二对数几率回归中标签为离散值。其本质上都属于线性模型。

六、多分类学习

七、类别不平衡问题

(没讲)