Advertisement

肺部CT分割挑战2017数据集下载和说明

阅读量:

文章目录

  • 1. 下载

    • 1.1 正常情况
    • 1.2 关联内容
  • 2 LCTSC(Lung CT Segmentation Challenge 2017)数据集说明

  • 2.1 简述
    * 2.2 数据描述

    • 2.2.1 细节说明
    • 2.2.1 数据信息
    • 2.3 训练数据集信息
    • 外部测试数据集信息
    • 现场测试数据集信息
    • 场内外测试区域的人工标注边界
    • 轮廓指南(涉及四种分割目标)
复制代码
* 2.3 评估指标
  • 3. 完成数据格式转换任务
    • 3.1 数据格式规范说明

      • 3.2 通过开源工具将结果解析为DICOM RTSTRUCT文件
    • 4. 数据查看

1. 下载

1.1 正常情况

请参考:Lung CT Segmentation Challenge 2017,仅凭常规网络访问可能无法获取该资源

如果是windows系统

快速获取高质量的两个重要数据集

按照指引依次完成相关操作步骤:首先,在工作界面中找到并执行以下操作:

  1. 打开本地存储路径下的NBIA Data Retriever工具包。
  2. 单击打开位于本地存储路径上的CTSC_v2_20190508.tcia文件。
  3. 系统将自动调用NBIA Data Retriever与该文件建立关联并启动处理流程。

如果是linux系统(以Ubuntu为例):

获取软件包:https://cbiit-download.nci.nih.gov/nbia/releases/ForTCIA/NBIADataRetriever_4.2/nbia-data-retriever-4.2.deb

复制代码
    sudo -S dpkg -r nbia-data-retriever-4.1.deb # 这是卸载旧版本

    sudo -S dpkg -i nbia-data-retriever-4.2.deb # 这是安装新版本

关于sudo dpkg操作,请详见dpkg 操作指南
在处理依赖关系时,默认不支持自动生成解决流程。如果遇到.deb文件存在依赖包的情况,则不推荐直接运行sudo dpkg命令来完成安装。建议采取以下措施:一是不运行此命令;二是按照优先级高低逐步安装各相关依赖包


因我的Windows系统出现了一些问题, 因此最终决定使用Mac系统进行下载, 并无需额外付费购买VPN服务以实现合法访问互联网。操作流程与Windows类似, 然而Mac系统的一个显著优势在于, 那个软件可以直接在App Store里下载。寻找NBIA Data Retriever

在这里插入图片描述

双击.tcia文件,稍等几秒钟,同意数据下载协议。

打开后就是这个样子,直接新建一个目录让它去下载就可以。

在这里插入图片描述

关于下载的数据文件,在使用ITK-SNAP进行查看时可能会出现警告信息:由于该数据文件具有32位深度的特点,并且该软件仅支持16位图像格式作为默认处理方式,在尝试加载此类高精度数据时可能会导致格式不兼容的问题出现

无所谓,不影响观看,大致如下:

在这里插入图片描述

可以看到,确实是肺部的图像,也可以看到心包。

在过程中可能会遇到一些失败的情况,请您无需担心最终系统会提示重新下载刚刚无法完成的文件。

在这里插入图片描述

如果网速不错的话,大概从12:35下载到

1.2 关联内容

通过直接单击NBIA Data Retriever软件界面中的某个功能项,在线便会弹出一个对话框或视图窗体,默认情况下其链接将引导到Youtube的视频内容:https://www.youtube.com/watch?v=NO48XtdHTic

通过分析视频内容的需求,我们可以定位网站地址:https://nbia.cancerimagingarchive.net/nbia-search/

在这里插入图片描述

该网站允许直接访问TCIA-The Cancer Imaging Archive中的全部数据资源库,并依据特定的标准进行筛选以满足不同研究需求。这意味着用户必须明确自己的需求。

访问该网站以获取其数据集名称:https://wiki.cancerimagingarchive.net/

在这里插入图片描述

例如,在我的研究项目中涉及到了Lung CT Segmentation Challenge 2017这一挑战项目,在详细信息页面中提供了关于训练集与验证集的具体信息。

在这里插入图片描述

因此可以去检索或选择LCTSC

在这里插入图片描述

依次点击各个数据详情页面并展开查看,则能够获取这些数据的具体描述信息。其中Storage UID具体来说就是在数据下载过程中生成的唯一标识符。

在这里插入图片描述

Storage UID代表的是从数据集wiki介绍页面上下载的类似manifest-1648526231429.tcia文件内容

在这里插入图片描述

该文件的内容大致如下:

复制代码
    downloadServerUrl=https://public.cancerimagingarchive.net/nbia-download/servlet/DownloadServlet

    includeAnnotation=true
    noOfrRetry=4
    databasketId=manifest-1557326747206.tcia
    manifestVersion=3.0
    ListOfSeriesToDownload=
    1.3.6.1.4.1.14519.5.2.1.7014.4598.278528516827875270055530886523
    1.3.6.1.4.1.14519.5.2.1.7014.4598.306855928738612353709729964131
    1.3.6.1.4.1.14519.5.2.1.7014.4598.612840042523497321192282140334
    1.3.6.1.4.1.14519.5.2.1.7014.4598.648202329529129061444241329585
    1.3.6.1.4.1.14519.5.2.1

2 LCTSC(Lung CT Segmentation Challenge 2017)数据集说明

This challenge focuses on the segmentation of lung structures using computed tomography (CT) imaging techniques, aiming to improve diagnostic accuracy in oncology. The dataset is available at Lungs' Image Segmentation Using Computed Tomography in 2017.

2.1. 简述

这个数据集源自AAPM 2017年会上所举办的挑战赛及相关的会议内容,并非专有性质。最初获得胜利的是在该会议上正式宣布的成果;然而,在线平台将长期保持开放状态,并为参与者提供了查看自己算法运行结果的机会。

针对胸部患者CT图像中的关键区域——如放射性病变或肿瘤——的处理需求,在现代医学领域已经发展出了许多自适应分割方法。这项挑战的主要目的是建立一个平台来比较不同的自适应分割方法,并从中提取出各个患者体内的高风险器官(OAR),即那些可能对放疗产生严重影响的关键区域。通过研究结果将展示各种自适应分割算法实现性能的评估指标,并在此基础上帮助医生选择最适合当前放疗方案的方法以提高治疗效果和安全性。


2.2. 数据描述

2.2.1. 详细描述

数据统计 2019/5/8更新
数据类型 CT、RT、RTstruct
参与人数 60
研究数量 60
序列数量 120
图像数量 9593
图像存储空间 4.8GB

2.2.2. 数据信息

关于训练集与测试集的相关信息,请访问AAPM Thoracic Auto-segmentation Challenge-官方平台查阅详细资料。

基于临床实践的研究表明,来自60名患者的常规4DCT或自由呼吸CT(FB-CT)图像被广泛应用于该竞赛。这些数据源自3家医院,并每家医院提供了20份数据样本。该数据集依据组织类型进行了分层分类,并分为三个类别:

  • 36个训练数据
  • 12个离线测试数据(off-site)
  • 12个在线测试数据(live)

数据遵循DICOM格式呈现(包含CT与RTSTRUCT内容),与现有商业治疗系统的标准格式一致。


2.2.3 训练数据

每个训练样本都包含一个 DICOM CT 图像集文件 以及一个 DICOM RTSTRUCT 文件 。每个训练样本都被命名为 LCTSC-Train-Sx-yyy ,其中 Sx (x=1,2,3) 代表机构编码 ,yyy 表示该机构对应的数据 ID 。这些命名规则有助于优化算法性能,并可据此对来自不同机构的测试数据进行验证 。为了获取训练数据集,请通过 .tcia 格式化的 manifest 文件进行下载 。具体而言,请访问 这个链接 下载该 manifest 文件,并使用 NBIA 数据检索器完成数据获取流程 。

复制代码
    |-- LCTSC
    	|-- LCTSC-Train-S1-001
    		|--11-01-2003-NA-RTRCCTTHORAX8F Adult-00439
    			|-- 0.000000-CT2p2b2 50 Ex-45938
    				|-- 1-001.dcm
    				|-- 1-002.dcm
    				...
    				|-- 1-105.dcm
    				|-- 2-001.dcm
    				|-- 2-002.dcm
    				...
    				|-- 2-055.dcm
    			|-- 1.000000-.simplified-15042
    				|-- 1-1.dcm
    	|-- LCTSC-Train-S1-002
    	|-- LCTSC-Train-S1-003
    	...
    	|-- LCTSC-Train-S1-012
    	|-- LCTSC-Train-S2-001
    	|-- LCTSC-Train-S2-002
    	|-- LCTSC-Train-S2-003
    	...
    	|-- LCTSC-Train-S2-012
    	|-- LCTSC-Train-S3-001
    	|-- LCTSC-Train-S3-002
    	...
    	|-- LCTSC-Train-S3-012

2.2.4 Off-site测试数据

每个场外测试数据集包含一个命名的DICOM CT图像集合。该集合文件名采用格式LCTSC-Test-Sx-10y(见下文说明),其中变量Sx(取值范围为1、2、3)标识机构编码;参数10y(取值范围为1至4)则对应于各机构的数据标识符。
请保存上述链接中的DICOM集合文件,并使用NBIA平台的数据检索工具下载相关资料。

2.2.5 Live test data

每个现场测试实验涉及一个包含一个DICOM CT图像集文件的测试包。该集合文件由三个部分组成:主CT图像(Main CT Image)、解剖学分割结果(Anatomical Segmentation Result)和放射性核素追踪结果(Radioisotope Tracking Result)。每个主CT图像对应一组临床参数配置(如{}, {}, {}),其中{}表示CT扫描参数的不同组合设置;同时包含一组放射性核素追踪参数配置(如{}, {}, {})。

为了获取这些测试用例的数据包,请访问TCIA的[下载中心](https://www_tcia com/Downloads)并下载其对应的元数据文件。然后使用NBIA的在线工具NBIA Data Retriever进行批量下载。

2.2.6 场外和现场测试数据的人工标记的轮廓

  • DICOM RTSTRUCT 形式下获取了所有离线和实时测试数据的人工标注轮廓,并为每个测试数据分配了一个对应的 DICOM RTSTRUCT 文件。
  • 这些人工标注的轮廓被用作衡量分割算法性能的真实参考标准。
  • 获取CT图像的数据集可以通过访问TCIA平台上的 manifest 文件。
  • 可通过存储此附件直接下载。
  • 之后可以通过NBIA Data Retriever工具进行批量下载。

2.2.6 轮廓指南(四种待分割对象)

Contouring Guidelines

在临床中使用的由人工标记出的边界特征被视为标准参考。通过应用RTOG1106图谱对所有边界特征进行审核过程,并在必要时进行修改以确保60名受试患者的统一标准。本次挑战涵盖了以下高风险器官:

  • Esophagus(食管)
  • Heart(心脏)
  • Left and Right Lungs(左右肺)
  • Spinal cord(脊髓)

RTOG ¹⁶ 被认定为一种协议类型。参考:[RTOG - ¹¹⁰⁶](https://www.nrgoncology.org/Clinical-Trials/Protocol/rtog- ¹¹⁰⁶?filter=rtog - ¹¹⁰⁶))

食管

标准名称:食道
ROTG图集上的描述:应在环状软骨下缘水平延伸至GE平面与胃入口相对应的位置进行描绘。
附加说明:可观察到的是,在第一层面以下有一圈清晰可见的环状软骨层切片(±1层厚度)。这有助于确定食道的位置。在靠近胃部的一端,可观察到一层位于食道与胃连接部位的第一层面(±1层厚度)。此处不仅清晰可见该区域的具体结构分布情况,并且能够观察到至少10平方厘米大小的标准胃横断面。

心脏

  • 标准名称:Heart
  • ROTG图集上的描述:心脏与心包共同呈现出独特的形态特征。上部或下部将从肺动脉下方的水平位置开始延伸,在穿过中线后向下发展至心脏尖端。
  • 附加说明:从半圆周以上与右心房分离的切片区域进行评估或处理以排除或部分排除下腔静脉。

肺部

  • 标准名称:左右肺癌标记为 Lung_L 和 Lung_R
  • ROTG 图书中的描述:在影像学检查中应勾勒双侧胸腔内的左右两 lung 的轮廓。这种结构被视为评估呼吸功能的基础区域。
    所有膨胀或塌陷、纤维化以及气肿的 lung 都应该被勾画出来,并需注意延伸至胸骨后方及纵膈以外的小支气管的存在;然而前 GTV、胸骨后方及主支气管不应包含在内。
  • 附加说明:在大多数训练和测试数据中会排除肿瘤或塌陷的 lung 区域,在评估过程中这些区域会被屏蔽以避免影响分割结果。

脊髓

  • 标准名称:SpinalCord
  • RTOG图集上的描述:RTOG Atlas 描述:脊髓的轮廓基于椎管骨骼的限制进行描述。脊髓轮廓应在环状软骨下方(颅底处)起始,并延伸至每个CT切片中的L2底部位置。应排除神经甲酸的影响。
  • 附加说明:脊髓轮廓在某些情况下可能在环状软骨上方超出范围,在L2底部附近出现偏离。对于顶端肿瘤,则难以达到颅底的位置。

2.3 评估指标

基本说明

在所有测试数据中,在Plastimatch中实现的一种指标将被用来比较自动分割和人工标记的轮廓。通过将其体素化为CT分辨率的方式,在整个计算过程中使用 DICOM 数据。评估将以3D的形式进行。为了防止脊髓和食道轮廓范围内的不确定性问题,在提交时会裁剪这些区域至测试数据范围。因此,在上下方向上过度勾勒结构可能会导致惩罚减少的情况出现;相反地,则可能导致因分割不足而产生的惩罚增加。

上述名词解释

Platimatch 是一款开源的图像计算软件,其核心功能专注于医学影像的高精度对齐,能够高效执行广泛使用的算法在 GPU 上运行,涵盖 X 射线 CT、MRI 和 PET 等典型应用

  • DICOM 中的放射治疗结构集合被称为 RTSS。
  • RivatunerStatisticsServer(RTSS)最早是RivaTuner配套软件,并逐渐发展成为支持基于视频捕获与帧速率控制的硬件监视功能。
  • 从2017年开始,RTSS加入了对最新显卡与API性能监控的支持。
  • RTSS与MSI Afterburner捆绑发行,但MSI Afterburner无需依赖RTSS即可运行。

关于评估指标的详细说明放在另一篇博客里,

3. 对上传数据进行格式转换

3.1 格式说明

本研究中提交的轮廓结果需涵盖训练集识别的所有关键解剖结构(如高危器官),且这些解剖学标记的命名遵循与训练数据一致的标准。每一份报告均应包含:

  • Esophagus(食管)
  • Heart(心脏)
  • Lung_L(左肺)、Lung_R(右肺)
  • Spinal cord(脊髓)

对于每个测试用例而言,其结果都需要提交为一个单独的DICOM RTSTRUCT文件,并且按照该测试用例中病人的ID来进行命名。例如,在这种情况下,请确保生成的文件名称符合以下格式:LCTSC-Test-S1-101.dcm等类似的形式

将12个测试用例的结果数据打包至单独的压缩包中,并确保该压缩包仅包含这12个测试用例的数据,并无其他层次结构。无需指定此压缩包的特别名称,在线提交即可。

当文件名称命名不当、文件丢失或器官名称错误时, 网站会向你表明问题所在; 然而这可能导致最终得分归零

通过开源软件实现对结果的转译功能,并将其输出为DICOM RTSTRUCT格式的数据文件

为了将个人实验数据转为DICOM-RT格式,则可通过3D Slicer这一软件工具获取所需的数据文件。

为了避免翻译误差,请您参考原文以确保准确性;原文链接如下:http://aapmchallenges.cloudapp.net/competitions/3#learn_the_details-dicom-rt-convertor

以使用3D Slicer为例,转换过程如下:

导入所有图像文件;在导入过程中,请确保为每个器官标注的区域选择Labelmap选项,
.dcm格式的影像数据为例, 系统是否能够自动生成连续编号的.dcm文件这一点尚存疑问。

在这里插入图片描述

LabelMap会帮助对颜色做一些分区。。。

在这里插入图片描述

在左上方位置有一张平面图,在左下方区域能明显看见脊髓、食管以及肺部区域。右下方部分则展示了左右两侧的肺脏情况,并且实际上这两个肺脏之间是心脏所在部位。。通过观察不同角度的影像学检查(如CT或X光片),基本都能清晰地观察到上述提到的五种高危病变组织结构。

在这里插入图片描述

进入Segmentation模块

在这里插入图片描述

Active segmentation选项设置中进行参数配置时,请选择Create new segmentation这一子选项进行操作。然而,在当前的工作环境中由于已经导入并展示好了带有labelmap标注的数据集,在这种情况下该功能项并未提供相应的可选设置项

依次处理每个结构(器官),执行以下操作:a. 在Export/Import字段中,指定为labelmap,并将其导入到labelmap字段。

点击segments中的1个,点击Edit selected

对CT图像设置Master volume

进入Data模块。

background中,右击选择Create new subject

subject中,右击选择Create child study

Drag the CT and segmentation node onto the child study

Right click on study, choose “Export to DICOM”

然后你的DICOM-RT文件就创建好了。

4. 数据查看

有不连续标记的现象,比如下图是:LCTSC-Test-S3-204

在这里插入图片描述

LCTSC-Train-S1-011

在这里插入图片描述

LCTSC-Train-S3-011

在这里插入图片描述

还有标注明显有问题的,LCTSC-Train-S2-008

在这里插入图片描述

还有很奇怪的,转换为nii格式后,颜色非常淡的,LCTSC-Train-S2-009

在这里插入图片描述

全部评论 (0)

还没有任何评论哟~