LIDC-IDRI肺结节数据库详解
LIDC-IDRI肺结节数据库详解
LIDC-IDRI (The Lung Image Database Consortium),该数据库包含来自胸部医学影像文件(例如CT扫描和X射线影像)以及与这些影像相关的病变诊断标注。该数据库是由美国国家癌症研究所(National Cancer Institute)发起收集的。其主要目标在于评估高风险人群早期肺癌的可检测性。
在本研究的数据集中包含共计1018个典型病例,在本研究中
| Collection Statistics | updated 3/21/2012 |
|---|---|
| 数据大小 | 124G |
| 图像类型 | 包含CT(computed tomography),共计约243,958张图像
包括数字减影摄影技术和计算减影摄影技术 |
| 图片数 | 共计约244,527张图像 |
|---|
| 系列数 (Number of Series)| 1,018 CT
290 CR/DX |
|研究数 (Number of Studies)|1038|
目前测试中共有1012个病例数据,在每个病例对应的文件夹中均遵循以下结构组织:LIDC-IDRI-XXXX(其中XXXX表示从0000至1012)、Study Instance UID(具体检查实例编号)、Series Instance UID(不同检查对应的序列编号)以及包含切片图像的.dcm文件和标注信息的.xml文件。
图像矩阵像素信息
该模块接收并处理具有体素数(Slicer×Rows×Cols)大小的三维矩阵D。
例如,在LIDC-IDRI数据库中,一个典型病例如LIDC-IDRI-0001对应一个133×512×512的三维数组。该数组由133个切片组成(依次按照空间顺序组织并保存到二进制文件中),每个切片尺寸为512×512像素点,并且每个像素占用2个字节存储空间(对应于short类型)。
XML标注信息说明

XML解析过程:

本文内容主要参考博客:LIDC-IDRI肺结节Dicom数据集解析与总结
