医学影像特征提取与导出
本文介绍了医学影像中的感兴趣区(ROI)及其重要性,并详细讲解了如何利用Python进行医学影像特征的提取。通过使用RadiomicsFeatureExtractor库,可以实现对医学影像序列的分析,并将提取到的特征数据导出为CSV格式文件。这一过程为后续的数据预处理和建模奠定了基础。
前言部分中指出,在之前的文章医学影像 DICOM转NIFTI(.dcm 到 .nii) 中详细阐述了如何获取医学影像数据及其相应的格式转换方法。当前文章则将聚焦于另一个关键环节——特征提取技术,在这一章节中我们将深入探讨如何利用Python语言实现对医学影像数据特征的精准提取,并为其后续的数据预处理和建模工作奠定坚实的基础。
1 序列文件与 ROI
在启动阶段之前,我们需要明确两个关键点——一项是医学影像序列数据,另一项是感兴趣区域标记为ROI。
在医学领域中对影像序列有一定的了解。这些影像数据主要是通过CT扫描或磁共振(MRI)等技术手段获取的。
那么ROI到底是什么呢?官方对ROI的定义是:Region Of Interest(ROIs),即感兴趣区。它被用来指定特定区域,并从中提取医学影像序列中的部分数据。听起来可能有些抽象吧?为了更好地理解这一概念,请看下文的例子说明。
例如,在医学成像领域中应用广泛的就是这个概念。通过设置ROI区域后系统就可以聚焦于该区域内的图像信息进行分析处理
大家可能都使用过面膜;有些人可能未曾使用过但也许也见过;如果都没去过的话,则这样理解起来可能就不会那么直接明了。
大家可能都使用过面膜;有些人可能未曾使用过但也许也见过;如果都没去过的话,则这样理解起来可能就不会那么直接明了。
将面膜贴在脸部时,通常会露出:眼睛、鼻子和嘴唇。这些区域可以被定义为 ROI(感兴趣区域)。我们先确定并标记出这三处 ROI(感兴趣区域),然后通过这些区域观察后方的脸部。这样就能清晰地看到:眼睛、鼻子以及嘴唇的位置。
在医学影像与 ROI 领域内进行对应分析是同样的方法。拥有 ROI 文件后,则能够从医学影像中提取出指定感兴趣的区域。
一般情况下而言,在医学影像领域中
2 相关依赖
本文将采用Python来进行特征抽取这一操作。从技术实现的角度来看,在正式开始处理数据之前必须确保已安装好所需的第三方库。
pip install pandas
pip install pyradiomics
然后是影像序列 image.nii.gz 和 ROI 文件 label.nii.gz

3 特征抽取与导出
接下来,以一段代码示例来看看如何进行特征抽取。
# 导入相关依赖包
import pandas as pd
import radiomics
from radiomics import featureextractor
# 读取影像组学特征信息
df = pd.DataFrame()
extractor = featureextractor.RadiomicsFeatureExtractor()
image_path, label_path = "/tmp/image.nii.gz", "/tmp/label.nii.gz"
featureVector = extractor.execute(image_path, label_path)
for key, item in featureVector.items():
print(key, ': ', item)

特征抽取出来后,难免要导出到文件,方便后续使用,如下:
# 导入相关依赖包
import pandas as pd
import radiomics
from radiomics import featureextractor
# 读取影像组学特征信息
df = pd.DataFrame()
extractor = featureextractor.RadiomicsFeatureExtractor()
image_path, label_path = "/tmp/image.nii.gz", "/tmp/label.nii.gz"
featureVector = extractor.execute(image_path, label_path)
for key, item in featureVector.items():
print(key, ': ', item)
# 使用 pandas 做成表格(需要做下转置)
df_new = pd.DataFrame.from_dict(featureVector.values()).T
df_new.columns = featureVector.keys()
df = pd.concat([df, df_new])
df.to_csv("/tmp/result.csv")

4 回顾总结
本文对医学影像分析及其关注区域进行了概述性介绍,并重点阐述了医学影像特征提取方法及输出流程。通过具体的案例分析和数据导出过程的详细说明,为后续的数据预处理工作以及模型构建过程奠定了可靠的基础。
