案例:逻辑回归预测良恶性乳腺癌肿瘤
发布时间
阅读量:
阅读量
先说一下概念,是分类算法


数据导入:直接读取互联网上的数据

这是根据对数字的理解,进行对列的取名



数据清洗与整理




在机器学习中,要对数据进行切分,分为训练集和测试集,75%为训练集,25%为测试集
这里面有两个语法错误
一sklearn中已经废弃cross_validation,将其中的内容整合到model_selection中
将sklearn.cross_validation 替换为 sklearn.model_selection
二是分配为10的时候,出现溢出情况,应该改为9,9个特性



数据标准化
sklraen的preprocessing中去导入一个StandardScaler去做标准化
因为后面要做逻辑回归,顺便导入LogisticRegression


调用lr中的fit函数/模块训练模型参数

有空可以去查阅关于它的文档
LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
intercept_scaling=1, l1_ratio=None, max_iter=100,
multi_class=‘auto’, n_jobs=None, penalty=‘l2’,
random_state=None, solver=‘lbfgs’, tol=0.0001, verbose=0,
warm_start=False)
现在进行评估
评估方法一和二的区别是,前者要有报告,后者是没有报告下的评估

评估结果


suppro样本,precision准确率

全部评论 (0)
还没有任何评论哟~
