利用sklearn实现KNN--乳腺癌诊断代码实战与分析

阅读量：

这篇文章是利用sklearn实现KNN算法，如何调整参数，实战代码。

如果想了解具体原理及Python代码实现简单的KNN相关内容，则可参考<>

---------目录----------

1. sklearn.neighbors.KNeighborsClassifier参数介绍

2. 利用sklearn中的自带库的实战代码分析（乳腺癌诊断）

正文：

1. sklearn.neighbors.KNeighborsClassifier参数介绍

官网文档中对这个类的定义是这样的：

基于Scikit-learn库提供的机器学习工具包中，默认情况下，
KNeighborsClassifier类实现了基于k近邻的分类器，
其核心功能模块包括多个可调用接口，
支持多种距离度量方式以及加权投票策略，
并提供了多种计算算法选择以优化性能表现。

_type sklearn.neighbors.KNeighborsClassifier(neighbors=5, weights='uniform', algorithm='auto', leaf_size=30, p=2, metric='minkowski', metric_params=None, n_jobs=None, **kwargs))

n_neighbors：K值的大小，默认值为5

weights：权重参数，在处理数据分布不均衡的情况下具有特殊作用，在具体实现中通常提供三种模式：其中一种是默认采用均匀分配策略；另一种则是允许用户根据需求进行个性化配置；还有一种是基于样本间距离远近来动态调整权重。（如何设置建议参考官方文档）

_algorithm：当然这里寻找距离最近的k个数据点的算法不仅仅只是基于欧式距离那么简单了，默认情况下可以选择balltree...（这个算法我不了解具体原理），默认值的意思是说程序会根据数据特征自行选择合适的方式进行处理。

leaf_size=30：和选择的balltree算法有关，叶子节点数。

n_jobs=None：并行多少个数据去搜索最近邻点。

其余参数基本无需做过多调整,因此也不必一一详细说明。实际上K值对模型性能有很大影响,并非选择数值越大越好

2. 利用sklearn中的自带库的实战代码分析（乳腺癌诊断）

在scikit-learn自带的数据集中存在一个用于二分类任务处理的乳腺癌数据集，在该数据库中可以找到专门针对这种类型问题的数据支持资源

复制代码

 from sklearn.neighbors import KNeighborsClassifier

    
 from sklearn.datasets import load_breast_cancer
    
 import numpy as np
    
  
    
 data = np.array(load_breast_cancer()['data'][10:])
    
 lable = np.array(load_breast_cancer()['target'][10:])
    
  
    
 data_test = np.array(load_breast_cancer()['data'][0:10])
    
 lable_test = np.array(load_breast_cancer()['target'][0:10])
    
  
    
 model = KNeighborsClassifier(n_neighbors=4)
    
 model.fit(data,lable)
    
 res = model.predict(data_test)
    
 print('prediction',res)
    
 acc = model.score(data_test,lable_test)
    
 print("accuracy",acc)
    
    
    
    
    
![](https://ad.itadn.com/c/weblog/blog-img/images/2025-07-13/BcZjQYr7GpsDf05lbMkn8d429viW.png)

计算结果：

prediction [0 0 0 1 0 0 0 0 0 0]
accuracy 0.9

全部评论 (0)

还没有任何评论哟~

利用sklearn实现KNN--乳腺癌诊断代码实战与分析

这篇文章是利用sklearn实现KNN算法，如何调整参数，实战代码。如果要看具体原理和python代码实现简单的KNN转这里：< \目录 1\.sklearn.neighbors.KN

sklearn-SVM-乳腺癌诊断分类

目录 01SVM简介 02乳腺癌诊断 1.先导入需要的库 2.设置seabon，matplotlib中文显示，pycharm显示行数扩大 3.svm实例化 4.数据集准备 5.数据集预处理 6.描述分...

sklearn之Knn实战乳腺癌数据案例

sklearn之Knn实战乳腺癌数据案例（此处博主不细说Knn算法的基础逻辑，有兴趣可自行百度）（导入的数据是sklearn自有的乳腺癌数据，sklearn有大量内置的数据，详细可点击sklear...

sklearn实现决策树对乳腺癌的分类诊断（下）

前面我们做的关于决策树的代码实现是对一个数据集进行划分为训练集和测试集，这篇使用的训练集和测试集是已经帮你划分好的存放在二个文件里的。这里我们使用的训练集和测试集都是关于乳腺癌的数据集，但是和前面我...

乳腺癌诊断分析——基于聚类分析实现

一、研究背景乳腺癌属于恶性肿瘤，在早期发现后需要及早将病变组织切除，而且术后还要化疗和放射等辅助治疗，能够抑制癌细胞的扩散和增长。二、研究目的 1.研究乳腺癌病人的患病特征 2.通过聚类分析方法对...

sklearn代码6 6-KNN癌症诊断

importnumpyasnp importpandasaspd frompandasimportSeries,DataFrame fromsklearn.neighborsimportKNeighb...

pythonsklearn乳腺癌数据集_【sklearn数据集】SVM之乳腺癌数据集实战

一、Sklearn介绍 scikitlearn是Python语言开发的机器学习库，一般简称为sklearn，目前算是通用机器学习算法库中实现得比较完善的库了。其完善之处不仅在于实现的算法多，还包括大量...

基于GFS进行威斯康星州乳腺癌（诊断）数据分析（Matlab代码实现）

📝个人主页 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️座右铭：行百里者，半于九十。目录 💥1概述基于GF...

机器学习-KNN小实战---乳腺癌预测

一、数据集导入本项目采用sklearn中的breastcancer的数据集，数据集源介绍sklearn.datasets.loadbreastcancer—scikitlearn1.4.2docum...

使用K近邻算法诊断乳腺癌

使用K近邻算法诊断乳腺癌一、设计内容及目的（一）设计内容数据收集：收集包含乳腺癌相关特征的数据集，例如肿块大小、肿块形状、肿块表面的光滑度、肿块边缘的均匀性等。这些特征可以从乳腺癌病例的医疗记录...

是否确定退出登录?

利用sklearn实现KNN--乳腺癌诊断代码实战与分析

---------目录----------

1. sklearn.neighbors.KNeighborsClassifier参数介绍

2. 利用sklearn中的自带库的实战代码分析（乳腺癌诊断）

正文：

1. sklearn.neighbors.KNeighborsClassifier参数介绍

2. 利用sklearn中的自带库的实战代码分析（乳腺癌诊断）

全部评论 (0)

相关文章推荐

利用sklearn实现KNN--乳腺癌诊断代码实战与分析

sklearn-SVM-乳腺癌诊断分类

sklearn之Knn实战乳腺癌数据案例

sklearn实现决策树对乳腺癌的分类诊断（下）

乳腺癌诊断分析——基于聚类分析实现

sklearn代码6 6-KNN癌症诊断

pythonsklearn乳腺癌数据集_【sklearn数据集】SVM之乳腺癌数据集实战

基于GFS进行威斯康星州乳腺癌（诊断）数据分析（Matlab代码实现）

机器学习-KNN小实战---乳腺癌预测

使用K近邻算法诊断乳腺癌