手抄 A4 纸一张带入考场,带科学计算器,考试走个形式,最后的报告需要双面打印一份纸质的,考试的时候带过来交。肯定要靠手算 BP 算法
项目大作业内容和形式已经明确给出,要看是否匹配模版,内容不能互相抄袭。
内容:
可以手写,也可以调包。考试很简单(跟往年很像),但是作业会比较难,包括课堂作业都是评价依据
「机器学习」(Machine Learning)是研究机器如何模拟或实现人类学习功能,获取新知识或新技能,从而改进现有系统性能的学科。机器学习是「人工智能」(Artificial Intelligence)的核心研究之一,也是 AI 系统的关键和瓶颈。
在机器学习中,「经验」通常以「数据」形式存在;因此,机器学习所研究的主要内容是如何利用计算机从数据中产生模型的算法,即学习算法。
当把经验数据提供给学习算法时,它能够给予这些数据产生模型。面对新的情况时,模型会给我们提供相应的预判。
形式化来定义,假设用
例如机器学习下围棋的过程,则有
王钰对机器学习的定义是,令
一致性假设是机器学习的条件。即:
决定模型对样本合集
学习的目的是学到隐含在数据背后的规律,即对未知样本的泛化能力,决定模型对世界
在夏天的时候,小明特别喜欢吃西瓜,他每天都要买个西瓜。
两周后,小明再去买西瓜时,他便能根据西瓜的根蒂、敲声、色泽来判断西瓜的好坏了。
对于机器学习而言,学习则是从大量样本出发,运用统计方法,发现统计规律。
每个科学领域的科学过程都有它自己的特点,但是,观察、创立假设、根据决定性实验或观察的检验、可理解检验的模型或理论,是各个学科所共有的。
对这个抽象的科学过程的每一个环节,机器学习都有相应的发展,我们相信它将导致科学方法中从假设生成、模型构造到决定性实验这些所有环节的合适的、部分的自动化/当机器学习研究在一些基本论题上取得令人印象深刻的进展,我们预期机器学习研究在今后若干年中将有稳定的发展。
机器学习是一个多学科交叉的产物,它吸取了人工智能、概率统计、神经生物学、认知科学、信息论、控制论、计算复杂性理论、哲学等学科的成果
机器学习在很多应用领域发挥了重要的实用价值,特别是在数据挖掘、语音识别、图像处理、机器人、车辆自动驾驶、生物信息需、信息安全、遥感信息处理、计算金融学、工业过程控制
人工智能主要是为了研究人的职能,模仿其机理将其应用于工程的科学。在这个过程中必然会问到,人类怎样做才能获取某种特殊技能或知识?
机器学习为当前人工智能研究的主要障碍和发展方向之一。机器学习主要研究如何使计算机具备自动获取知识的能力,从而克服人类存储少,效率低、注意力分散、难以传送所获取的知识等局限性。
在过去二十年中,计算机存储、传输、处理数据的能力取得了飞速发展,急需能有效地对数据进行分析利用的计算机算法,而机器学习作为智能数据分析算法的源泉,顺应了大时代这个迫切需求。
人类智能活动的能力是人类在认识世界和改造世界的活动中,由脑力劳动表现出来的能力
机器学习是一种实现人工智能的方法
深度学习是一种实现机器学习的技术
假定收集了一批关于西瓜的数据,例如
这组记录的集合为一个「数据集」,其中的每条记录是一个「示例」或「样本」。反映事件或对象在某方面的表现或性质的事项,例如“色泽”“根蒂”敲声“,称为「属性」,属性上的取值为「属性值」。属性张成的空间称为「属性空间」、「样本空间」或「输入空间」。如我们把色泽,根蒂和敲声作为三个坐标轴,则它们长成了用于描述西瓜的三维空间,每个西瓜都可以在这个空间中找到自己的坐标位置。由于空间中的每个点对应一个坐标向量,因此我们也把一个示例称为一个「特征向量」。
从数据中学得模型的过程称为「学习」或「训练」,训练过程中使用数据为「训练数据」,所组成的集合称为「训练集」。
学习过程通过执行某个算法来完成。要学得一个能判断没剖开的西瓜是不是好瓜的模型,还需获得训练的结果。
关于样本结果的信息称为「标记」。拥有标记信息的样本称为「样例」。一般地,用
令
一般地,预测任务是通过对训练集进行学习,即那里从输入空间
学得模型后,使用学得的模型进行预测的过程称为「测试」,被预测的样本的称为「测试样本」。例如在学得
将训练集分成若干组的过程称为「聚类」,每组称为一个「簇」(Cluster)。这些自动形成的簇可能对应一些潜在的概念划分,例如深色瓜,浅色瓜,甚至本地瓜,外地瓜等。另外,在聚类学习中,浅色瓜,本地瓜这些概念我们是现实不知道的,而且学习过程中使用的训练样本通常不拥有标记信息