传统组学模块:乳腺肿瘤良恶性预测
注意:附件为代码,必须依赖Onekey平台才能运行,没有平台的可以联系
Onekey平台模块-Component1,一站式解决传统组学的问题。http://medai.icu/thread/63。
Component1包括:
数据加载
数据统计分析,不同特征的占比,分布。
特征的降维,PCA
样本的聚类分析。
特征之间的相关系数分析。
特征筛选
先行者总结
http://medai.icu/topic/topic-detail/1
乳腺癌肿瘤诊断为例
乳腺癌数据库,主要记录了569个病例的32个属性。

应用场景
原始任务是预测肿瘤的良性还是恶性。这是典型的分类任务。
在真实的应用场景中,除了预测肿瘤的良性、恶性。还可以用来研究不同的特征对于最终诊断结果的重要性研究。这个可以迁移到其他的场景,例如在农业研究中,不同的形状对粮食的产量的贡献;在基因组学研究中,研究不同的基因对最终的表达的贡献等。
问题建模
此数据为典型的结构化数据,每个样本一行,每个特征一列,这样构成了整个数据集。结构化数据可以采用两种建模方式。
机器学习算法,比较有代表的是SVM、LR、RandomForest、XGBoost、LightGBM等。
深度学习算法,代表的是DNN,可能增加一些创新点的是Attention技术,以及一些特征交叉技术。
这里我们使用机器学习算法对此任务进行建模。
模型对比及特征重要性

代码链接
http://www.medai.icu/thread/80
任务训练效果验证,数据委托训练服务
图像****数据
病理数据
超声数据
三维数据
结构化数据
组学数据
方法验证
传统组学验证
机器学习验证
多组学验证
深度学习验证
验证结果打印




验证报告
1、 数据类型特点
2、 验证方法特点
3、 方法改进意见
4、 训练结果分析
5、 任务实操指导视频课程
6、 实验平台定制化
附加验证要求
1. 传统组学,迁移临床场景。初级,对应2分左右论文。
2. 传统组学+其他组学(遗传组学、代谢组学),两阶段建模。中级,对应3分左右论文。
3. 传统组学+其他组学+深度学习特征,多阶段建模。中级,对应4分左右论文。
4. 传统组学+其他组学+深度学习特征,端到端深度学习建模。高级,对应5分左右论文。
5. 单一影像组学,深度学习端到端建模,高级,对应5分左右论文(主流)。
6. 多组学融合端到端深度学习建模,顶级,对应8分左右论文,如果配合比较好的临床意义,可以达到顶刊
