Advertisement

LIDC-IDRI肺结节数据库详解

阅读量:

LIDC-IDRI肺结节数据库详解
LIDC-IDRI (The Lung Image Database Consortium),该数据库包含来自胸部医学影像文件(例如CT扫描和X射线影像)以及与这些影像相关的病变诊断标注。该数据库是由美国国家癌症研究所(National Cancer Institute)发起收集的。其主要目标在于评估高风险人群早期肺癌的可检测性。

在本研究的数据集中包含共计1018个典型病例,在本研究中

Collection Statistics updated 3/21/2012
数据大小 124G

| 图像类型 | 包含CT(computed tomography),共计约243,958张图像
包括数字减影摄影技术和计算减影摄影技术 |

图片数 共计约244,527张图像

| 系列数 (Number of Series)| 1,018 CT
290 CR/DX |
|研究数 (Number of Studies)|1038|

目前测试中共有1012个病例数据,在每个病例对应的文件夹中均遵循以下结构组织:LIDC-IDRI-XXXX(其中XXXX表示从0000至1012)、Study Instance UID(具体检查实例编号)、Series Instance UID(不同检查对应的序列编号)以及包含切片图像的.dcm文件和标注信息的.xml文件。

图像矩阵像素信息
该模块接收并处理具有体素数(Slicer×Rows×Cols)大小的三维矩阵D。
例如,在LIDC-IDRI数据库中,一个典型病例如LIDC-IDRI-0001对应一个133×512×512的三维数组。该数组由133个切片组成(依次按照空间顺序组织并保存到二进制文件中),每个切片尺寸为512×512像素点,并且每个像素占用2个字节存储空间(对应于short类型)。

XML标注信息说明

在这里插入图片描述

XML解析过程:

在这里插入图片描述

本文内容主要参考博客:LIDC-IDRI肺结节Dicom数据集解析与总结

全部评论 (0)

还没有任何评论哟~