Advertisement

案例:逻辑回归预测良恶性乳腺癌肿瘤

阅读量:
复制代码
    先说一下概念,是分类算法

在这里插入图片描述
在这里插入图片描述

数据导入:直接读取互联网上的数据
在这里插入图片描述
这是根据对数字的理解,进行对列的取名
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
数据清洗与整理
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在机器学习中,要对数据进行切分,分为训练集和测试集,75%为训练集,25%为测试集
这里面有两个语法错误
一sklearn中已经废弃cross_validation,将其中的内容整合到model_selection中
将sklearn.cross_validation 替换为 sklearn.model_selection
二是分配为10的时候,出现溢出情况,应该改为9,9个特性
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

数据标准化
sklraen的preprocessing中去导入一个StandardScaler去做标准化
因为后面要做逻辑回归,顺便导入LogisticRegression
在这里插入图片描述
在这里插入图片描述
调用lr中的fit函数/模块训练模型参数
在这里插入图片描述
有空可以去查阅关于它的文档
LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
intercept_scaling=1, l1_ratio=None, max_iter=100,
multi_class=‘auto’, n_jobs=None, penalty=‘l2’,
random_state=None, solver=‘lbfgs’, tol=0.0001, verbose=0,
warm_start=False)

现在进行评估
评估方法一和二的区别是,前者要有报告,后者是没有报告下的评估
在这里插入图片描述
评估结果
在这里插入图片描述
在这里插入图片描述
suppro样本,precision准确率
在这里插入图片描述

全部评论 (0)

还没有任何评论哟~