Advertisement

传统组学模块:乳腺肿瘤良恶性预测

阅读量:

注意:附件为代码,必须依赖Onekey平台才能运行,没有平台的可以联系

Onekey平台模块-Component1,一站式解决传统组学的问题。http://medai.icu/thread/63。
Component1包括:

数据加载

数据统计分析,不同特征的占比,分布。

特征的降维,PCA

样本的聚类分析。

特征之间的相关系数分析。

特征筛选

先行者总结

http://medai.icu/topic/topic-detail/1

乳腺癌肿瘤诊断为例

乳腺癌数据库,主要记录了569个病例的32个属性。
图片

应用场景

原始任务是预测肿瘤的良性还是恶性。这是典型的分类任务。

在真实的应用场景中,除了预测肿瘤的良性、恶性。还可以用来研究不同的特征对于最终诊断结果的重要性研究。这个可以迁移到其他的场景,例如在农业研究中,不同的形状对粮食的产量的贡献;在基因组学研究中,研究不同的基因对最终的表达的贡献等。

问题建模

此数据为典型的结构化数据,每个样本一行,每个特征一列,这样构成了整个数据集。结构化数据可以采用两种建模方式。

机器学习算法,比较有代表的是SVM、LR、RandomForest、XGBoost、LightGBM等。

深度学习算法,代表的是DNN,可能增加一些创新点的是Attention技术,以及一些特征交叉技术。

这里我们使用机器学习算法对此任务进行建模。

模型对比及特征重要性

图片

代码链接

http://www.medai.icu/thread/80

任务训练效果验证,数据委托训练服务

图像****数据

病理数据

超声数据

三维数据

结构化数据

组学数据

方法验证

传统组学验证

机器学习验证

多组学验证

深度学习验证

验证结果打印

图片
图片
图片
图片

验证报告

1、 数据类型特点

2、 验证方法特点

3、 方法改进意见

4、 训练结果分析

5、 任务实操指导视频课程

6、 实验平台定制化

附加验证要求

1. 传统组学,迁移临床场景。初级,对应2分左右论文。

2. 传统组学+其他组学(遗传组学、代谢组学),两阶段建模。中级,对应3分左右论文。

3. 传统组学+其他组学+深度学习特征,多阶段建模。中级,对应4分左右论文。

4. 传统组学+其他组学+深度学习特征,端到端深度学习建模。高级,对应5分左右论文。

5. 单一影像组学,深度学习端到端建模,高级,对应5分左右论文(主流)。

6. 多组学融合端到端深度学习建模,顶级,对应8分左右论文,如果配合比较好的临床意义,可以达到顶刊

全部评论 (0)

还没有任何评论哟~