读书笔记-统计学习方法（李航）第三章

阅读量：

第三章 K 近邻算法

3.1 k近邻算法
3.2 k近邻模型
- 距离度量
- k值的选择
- 决策规则
- - 实践：
手动实现
sklearn 实现

3.1 k近邻算法

k近邻是一种基本的分类和回归方法

k近邻法的三个基本要素为：
1：k值的选择
2：距离度量
1：分类决策规则

3.2 k近邻模型

距离度量

k值的选择

1：k值太小：

模型过于复杂（只考虑最近的一个点），过拟合

2：当k参数取值过大时，模型结构过于简单（例如当K的取值等于样本总数N时），导致模型无法有效学习到数据特征。

决策规则

对测试点最近的K个点的类别投票，用多数类别预测测试点的类别。

实践：

复制代码

    """
    2.给定一个二维空间的数据集T={正实例：(5,4),(9,6),(4,7)；负实例：(2,3), (8,1),(7,2)}，试基于欧氏距离，找到数据点S（5,3）的最近邻（k=1），并对S点进行分类预测。
    
    (1)用“线性扫描”算法自编程实现。
    
    (2)试调用sklearn.neighbors的KNeighborsClassifier模块，对S点进行分类预测，并对比近邻数k取值不同，对分类预测结果的影响。
    
    (3)思考题：思考“线性扫描”算法和“kd树”算法的时间复杂度。
    """

复制代码

    '\n2.给定一个二维空间的数据集T={正实例：(5,4),(9,6),(4,7)；负实例：(2,3), (8,1),(7,2)}，试基于欧氏距离，找到数据点S（5,3）的最近邻（k=1），并对S点进行分类预测。\n\n(1)用“线性扫描”算法自编程实现。\n\n(2)试调用sklearn.neighbors的KNeighborsClassifier模块，对S点进行分类预测，并对比近邻数k取值不同，对分类预测结果的影响。\n\n(3)思考题：思考“线性扫描”算法和“kd树”算法的时间复杂度。\n'

手动实现

复制代码

    import numpy as np
    x_train = np.array([[5,4],[9,6],[4,7],[2,3],[8,1],[7,2]])
    y_train = np.array([1,1,1,0,0,0])
    x_test = np.array([[5,3]])

复制代码

    def model(k,x_train,y_train,x_test):
    dis2class = dict()
    for i in range(y_train.shape[0]):
        point = x_train[i]
        dis = 0
        for j in range(2):
            dis += (point[j]-x_test[0][j])**2
        dis = dis ** 0.5
        dis2class[dis] = y_train[i]
    print(dis2class)
    dis_list = list(dis2class.keys())
    dis_list.sort()
    dis_list = dis_list[:k]
    print(dis_list)
    class_list = [dis2class[diss] for diss in dis_list]
    print(class_list)
    class_count = dict()
    for c in set(class_list):
        class_count[class_list.count(c)] = c
    print(class_count)
    print(max(class_count))
    return class_count[max(class_count)]    
    
    
    result = model(1,x_train,y_train,x_test)
    print("result = ",result)

复制代码

    {1.0: 1, 5.0: 1, 4.123105625617661: 1, 3.0: 0, 3.605551275463989: 0, 2.23606797749979: 0}
    [1.0]
    [1]
    {1: 1}
    1
    result =  1

k值过小会造成过拟合，过大则会欠拟合

sklearn 实现

复制代码

    from sklearn.neighbors import KNeighborsClassifier
    """
    n_neighbors : 默认值：5
    weights : 默认：uniform(权重一样) ； distancs(距离越近权重越大)
    algorithm: 默认：auto ； brute（暴力求解即线性扫描） ； kd_tree ; ball_tree  (当数据量较小时会自动变成暴力求解)
    leaf_size : 默认：30 （叶子节点数量的阈值）
    p : 默认是2（即欧氏距离）
    metric：默认 mincowski
    n_jobs:并行搜索 ，1表示一个进程，-1表示所%alias进程
    """
    for k in range(1,6,2):
    #构建实例
    clf = KNeighborsClassifier(n_neighbors=k,n_jobs=1,)
    #训练
    clf.fit(x_train,y_train)
    #预处
    res = clf.predict(x_test)
    print("当k值为{}时,测试点的分类结果为：".format(k) ,res)

复制代码

    当k值为1时,测试点的分类结果为： [1]
    当k值为3时,测试点的分类结果为： [1]
    当k值为5时,测试点的分类结果为： [1]

全部评论 (0)

还没有任何评论哟~

读书笔记-统计学习方法（李航）第三章

第三章K近邻算法 3.1k近邻算法 3.2k近邻模型距离度量 k值的选择决策规则实践：手动实现 sklearn实现 3.1k近邻算法 k近邻是一种基本的分类和回归方法 k近邻法的三个基本要素为...

读书笔记-统计学习方法（李航）第七章

第七章支持向量机 7.1线性可分支持向量机与硬间隔最大化 7.2线性支持向量机与软间隔最大化 7.3非线性支持向量机与和函数 7.4序列最小最优化算法实战： 7.1线性可分支持向量机与硬间隔最大化 ...

读书笔记-统计学习方法（李航）第六章

第六章逻辑回归和最大熵模型 6.1逻辑斯蒂回归模型 6.2最大熵模型 6.3模型学习的最优化算法实战： 6.1逻辑斯蒂回归模型二项逻辑斯蒂回归模型: 极大似然估计：多分类： 6.2最大熵模型最...

统计学习方法（第二版）李航——读书笔记I

文章目录第1章统计学习及监督学习概论 1.1统计学习 1.1.1统计学习的特点 1.1.2统计学习的对象 1.1.3统计学习的目的 1.1.4统计学习的方法 1.1.5统计学习的研究 1.1.6统计...

李航-统计学习方法学习笔记-第一章

统计学习方法李航统计学习方法的三要素：（1）模型（2）策略（3）算法实现统计学习的步骤：（1）得到用来训练模型和测试模型的数据集（输入和输出（实际值）+需要进行预测的输入数据）（2）确定...

统计学习方法 pdf_李航统计学习方法（第三章）

第3章k近邻法 k近邻法（kNN）是一种基于实例的学习方法，无法转化为对参数空间的搜索问题（参数最优化问题）。它的特点是对特征空间进行搜索。除了k近邻法，本章还对以下几个问题进行较深入的讨论：切比雪...

李航《统计学习方法》第一章习题和笔记

《统计学习方法》第一章习题和笔记关键概念个人习题解答遗留问题关键概念 1.统计学习三要素一切统计学习方法可以由三要素描述：模型+策略+算法模型根据想要学习的目标，模型可以分为概率模型和非...

李航《统计学习方法》第二章习题和笔记

李航《统计学习方法》第二章习题和笔记感知机模型点到平面公式的推导两种思路习题感知机模型模型：fx=\rmsign\vecw\cdot\vecx+b注意w和b是n维向量，b是常数偏置策略：损...

《统计学习方法—李航》阅读笔记

第一章统计学习方法简介 1.1统计学习 1.统计学习的特点统计学习是关于计算机基于数据构件概率统计模型并用模型对数据进行预测与分析的一门学科，又称统计机器学习。

《统计学习方法》李航-第二版，读数笔记

第1章统计学习及监督学习概论一、分类基本分类：监督学习、无监督学习、强化学习、半监督学习和主动学习监督学习：分类问题（离散）和回归问题（连续）按模型分类：概率与非概率、线性和非线性、参数化和非...

是否确定退出登录?

读书笔记-统计学习方法（李航）第三章

第三章 K 近邻算法

3.1 k近邻算法

3.2 k近邻模型

距离度量

k值的选择

决策规则

实践：

手动实现

sklearn 实现

全部评论 (0)

相关文章推荐

读书笔记-统计学习方法（李航）第三章

读书笔记-统计学习方法（李航） 第七章

读书笔记-统计学习方法（李航） 第六章

统计学习方法（第二版）李航——读书笔记I

李航-统计学习方法学习笔记-第一章

统计学习方法 pdf_李航统计学习方法（第三章）

李航《统计学习方法》第一章习题和笔记

李航《统计学习方法》第二章习题和笔记

《统计学习方法—李航》阅读笔记

《统计学习方法》李航-第二版 ，读数笔记

读书笔记-统计学习方法（李航）第七章

读书笔记-统计学习方法（李航）第六章

《统计学习方法》李航-第二版，读数笔记