实战十七:医疗机器学习实战 乳腺癌疾病预测项目完整代码数据视频讲解
发布时间
阅读量:
阅读量
视频讲解介绍了基于机器学习的医疗乳腺癌数据的乳腺癌疾病预测,并提供了完整的代码和数据分享。视频内容包括使用Python库(如numpy、pandas、matplotlib、seaborn等)进行数据处理和分析,涉及特征提取、数据标准化、模型训练(如Logistic Regression、Random Forest、K-Nearest Neighbors等)以及模型评估。代码中还包含了数据预处理步骤,如删除无关列、提取特征、数据标准化和相关性分析,并通过热图展示了特征之间的相关性。视频链接为哔哩哔哩的视频资源,旨在帮助观众理解和应用机器学习技术在乳腺癌预测中的应用。
基于机器学习的医疗乳腺癌数据用于乳腺癌疾病预测,并提供完整的代码和数据集
以机器学习技术为基础的医疗乳腺癌数据集,提供乳腺癌疾病预测模型的完整代码与数据资源分享,视频链接:哔哩哔哩_bilibili

代码:
#第一步!导入我们需要的工具
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.model_selection import KFold
from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import RandomForestClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.neighbors import KNeighborsClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn import svm
from sklearn import metrics
import warnings
warnings.filterwarnings('ignore')
data.drop("Unnamed: 32",axis=1,inplace=True)
data.drop("id",axis=1,inplace=True)
data.columns
features_mean= list(data.columns[1:11])
features_se= list(data.columns[11:20])
features_worst=list(data.columns[21:31])
print(features_mean)
print("-----------------------------------")
print(features_se)
print("------------------------------------")
print(features_worst)
data['diagnosis']=data['diagnosis'].map({'M':1,'B':0})
data.describe()
corr = data[features_mean].corr()
plt.figure(figsize=(14,14))
sns.heatmap(corr, cbar = True, square = True, annot=True, fmt= '.2f',annot_kws={'size': 15},
xticklabels= features_mean, yticklabels= features_mean,
cmap= 'coolwarm')


六条重要信息源自医疗乳腺癌领域的数据资源,该链接指向文库中的相关内容。
全部评论 (0)
还没有任何评论哟~
