aliases:
- KNN
k 近邻分类算法(KNN)是一种距离计算聚类算法,,通过计算每个训练数据到待分类元组的距离,取和待分类元组距离最近的 k 个训练数据,k 个数据中哪个类别的训练数据占多数,则待分类元组就属于哪一个类别。
输入
输出
过程:
predicted_labels
X_test
中的每个样本 x
:
distance
X_train
中的每个样本 x_train
d = distance(x, x_train)
(常用 Euclidean 距离)d
添加到 distance
distances
对训练样本索引进行排序,获取前 k 个最小距离的索引 k_indices
k_indices
获取对应的标签 k_nearest_labels
k_nearest_labels
中出现最多的标签,将其作为 x
的预测标签predicted_labels