Advertisement

目标检测舰船数据集整合

阅读量:

:大家如果有想要的数据集,请您告知我一下;一旦我自己下载了数据集或许会分享给你们。

:大家如果有想要的数据集,请您告知我一下;一旦我自己下载了数据集或许会分享给你们。

有新增,可见光遥感图像数据集 FAIRIM

在这里插入图片描述
在这里插入图片描述

一、光学数据集

1、 DIOR 数据集(已下载yolo版本)( 论文中提到过

在这里插入图片描述

该基准库由精选的高质量遥感图像与丰富的目标实例共同构成

该基准库专为光学遥感领域的目标检测研究而设计

2、 LEVIR 数据集

在这里插入图片描述

LEVIR数据集包含大量800×600像素及更高分辨率(达到1.0米)的高分辨率Google地球图像,并超过22,000张图片。该数据集主要涵盖人类居住环境中的各类地面特征,包括城市区域、农村地区、山地景观以及海岸线区域等。值得注意的是,该集合未包含冰川区、沙漠以及广袤的戈壁等地形环境的数据。在目标分类方面,该集合分为三种主要类别:飞机(包括近海飞机与水面飞机)、船舶(包括近海船舶与驶离港口船舶)以及油罐车辆等物体类别。所有图像总计标记了11,724个独立的目标边界框(其中包含4,724架飞机、3,025艘船舶及3,279辆油罐车辆)。每个图像平均约包含半个目标物体。

3、DOTA 数据集( 已下载

具体信息:<>

在这里插入图片描述

DOTA是用于航空图像中目标检测的大规模数据集。它可以用于开发和评估航空影像中的物体检测。对于DOTA数据集,它包含来自不同传感器和平台的2806个航拍图像。每个图像的大小在大约800×800到4000×4000像素的范围内 ,并且包含各种比例,方向和形状的对象。这些DOTA图像由航空影像解释专家分类为15个常见对象类别。完全注释的DOTA图像包含188282个实例,每个实例都由任意(8自由度)四边形标记。
该数据集共包含2806张遥感图像(图片尺寸从 800 800 到 4000 4000),一共188,282个实例,分为15个类别:飞机、船只、储蓄罐、棒球内场、网球场、篮球场、田径场、海港、桥、大型车辆、小型车辆、直升飞机、英式足球场、环形路线、游泳池。每个实例都由一个四边形边界框标注,顶点按顺时针顺序排列。官方使用1/2的图像作为训练集,1/6作为验证集,1/3作为测试集。测试集没有公开,需要上传至服务器。
论文地址:DOTA: A Large-scale Dataset for Object Detection in Aerial Images

4、 NWPU VHR-10 数据集(已下载voc格式)( 论文中提到过

4.1 基本信息

NWPU VHR-10 数据集是由西北工业大学开发的一个高分辨率遥感图像数据集(Cheng et al. 2016),其中包括650张包含目标实例的正样本图像以及非目标类别图像150张背景。该数据集总计800幅超分辨率遥感图像通过Google Earth和Vaihingen数据集裁剪获取,并由专家团队手动标注完成分类任务。

NWPU VHR-10 是西北工业大学发布的一个专门用于地理空间物体检测的研究公开数据集(Cheng et al. 2016)。该集合由10个不同类别的物体组成:飞机、船舶、油罐车、棒球场、网球场、篮球场、跑道、港口、桥梁以及汽车等共计10个种类。其中包含650张具有目标实例的正样本图片以及无目标类别的背景图片共150张。经过从Google Earth及Vaihingen数据集中提取并人工标注后形成完整的800幅高分辨率遥感影像库。

NWPU VHR-10 是西北工业大学于2014年推出的专门用于空间物体检测研究的一份公开遥感数据集合(Cheng et al. 2016)。该数据集包含了多个不同类别的地理物体样本:飞机、船舶、油罐车、棒球场场地馆等共计十种类型,并分别提供了包含实例和不包含实例两类图像共计8百零一幅高分辨率遥感影像资料库。其中正样本类别共有6百五十幅图片而背景无目标类别的共有一百五十幅图片全部由专业人员进行人工标注处理以满足研究需求的各种技术指标要求。

在这里插入图片描述
在这里插入图片描述
4.2数据说明

4.2.1目标图像定义

本研究数据集聚焦于航空摄影图像中的物体分类任务,在其范围内共有10种不同的物体类别需要被识别和分类。该数据集总共包含了3,775个具体实例,并细分如下:其中包括了共计757架飞机及其相关设备(如雷达天线等)、约390个棒球场区域(涉及不同运动项目)、约159个篮球场设施(包括看台座椅等)、约124座桥梁设施(如桥面铺装等)、约224个港口设施(如泊位布局等)、约163个田径场跑道及附属设施(如 bleachers 等)、约302艘船舶及其存储设备(如储油罐等)、约655个储罐(包括加油站类型的储油罐) 以及约524片网球场区域(涉及灯光与裁判席位)。这些具体实例均通过水平边界框工具进行人工标注。

4.2.2数据来源

通过Google Earth软件,在全球部分地区中获取了716张高分辨率图片。此外,
德国民用遥感学会提供了86张超高质量图片。
其中,
其影像分辨率从最低到最高分别为0.5米至2米。
同时,
其CIR图像是达到每米分之一零点零八米的超高清水平。
这些图像是
包括了716张RGB影像以及86张经过全色锐化的彩色红外图。

4.2.3数据格式

数据集被划分为三个部分:正样本图像文件夹(positive image set)、负样本图像文件夹(negative image set)以及标注信息文件夹(ground truth)。其中:

位于正样本图像文件夹下的图片均为正例图片;
位于负样本图像文件夹下的图片均为反例图片;
且所有标注图片均以001开头命名。

4.2.4样本标注信息

NWPU VHR-10应用HBB标记法进行标注。ground truth文件夹中包含有650个独立的txt文本文件,每个这样的txt文本文件对应于positive image set目录中的一个图像。这些txt文本文件中的每一行都标识为一个ground truth边界框,请注意其格式如下:

(x1,y1),(x2,y2),a

其中(x_1,y_1)表示bounding box的左上角位置,(x_2,y_2)则代表bounding box的右下位置,而a则代表所检测的目标类型,具体包括:飞机(编号1)、轮船(编号2)、储油罐(编号3)以及从编号4到编号10分别对应棒球场、网球场、篮球场、田径场和港口等设施。

在这里插入图片描述

参考文献:Develop a Rotation-Invariant Deep Convolutional Neural Network with Enhanced Performance for Object Detection in High-Resolution Optical Remote Sensing Images

参考文献:Develop a Rotation-Invariant Deep Convolutional Neural Network with Enhanced Performance for Object Detection in High-Resolution Optical Remote Sensing Images

5、 VEDAI 数据集( 论文中提到过

在这里插入图片描述

VEDAI数据集被应用于航空图像中的多类车辆检测任务。其中涵盖了9个类别:船、车、露营车、飞机、接送车、拖拉机、卡车、货车以及其他类别。该数据库还包含了来自犹他州AGRC的12.5\,\mathrm{cm}空间分辨率1024\times 1024像素的一共1,210张航空图像。这些图像在2012年春季采集,并且每个样本都具备四个原始RGB彩色通道以及一个近红外通道

VEDAI被视为一种用于评估目标检测算法鲁棒性的基准数据集。该数据库不仅具有丰富的类别多样性(如不同方向的目标),还涵盖了复杂的光照条件(包括阴影)、镜面反射以及遮挡等因素的变化。此外,默认情况下每个样本都具备四个原始RGB彩色通道以及一个近红外通道

为了保证实验结果的一致性和可重复性,默认情况下作者提供了详细的实验方法以保证结果的一致性和可重复性

如需进一步了解该研究,请访问https://downloads.greyc.fr/vedai/

6、DIUx xView 2018

在这里插入图片描述
在这里插入图片描述

xView被视为最广泛使用的资源消耗图像集合之一。它汇聚了全球复杂场景中的大量图像,并通过超过100万个边界框进行了详细标注。这些标注涵盖了60种不同对象类别范围内的细节内容。相较于其他虚构图像数据集,在此集合中所采用的图像是高分辨率、多光谱特性和多元化的对象分类标记。DIUx XView挑战主要致力于推动四个计算机视觉领域的技术进步:其一是降低目标检测最小分辨率的要求;其二是提升模型训练效率;其三是扩展可识别的对象类别数量;其四是优化微粒级目标检测性能。该挑战计划紧密跟踪XView比赛节奏(如通用物体COCO基准),同时致力于构建SpaceNet与全球功能图FMoW框架系统,在利用太空可获取图像的基础上推动计算机视觉技术的发展。这些努力有助于我们从新的视角重新审视视觉世界并解决一系列关键问题

7、 HRSC2016 数据集 (已下载yolo版本)( 论文中出现过

在这里插入图片描述
7.1 基本信息

HRSC2016 数据集(由Liu等人在2016年提出)是由西北工业大学采集并提供给船舶检测任务的数据源。该数据集包含海上的船舶以及沿海附近的船舶实例,并全部源自全球六个知名港口中的某一个。所有图像是分辨率介于0.4m至2m之间的影像。舰船检测任务中使用了来自Google Earth平台的1,070张图片以及2,976个实例,并通过旋转框标注法进行了具体定位。具体来说,在训练集中包含了436幅图片(总计包含1,207个实例),验证集包含了181幅图片(总计包含541个实例),而测试集中则有444幅图片(总计包含1,228个实例)。这些图像是经过多方面的变化处理后收集得到的:包括旋转角度的变化、比例缩放的不同、位置坐标的偏移、形状特性的差异以及外观特征的不同。

7.2 数据说明

7.2.1目标图像定义

在本数据集里的目标是航拍图像中的船只,在其中分为海上船舶和近岸船舶两类。研究者采用了基于生物分类学的理念构建了一个层级分明的分层体系来分类船模:其中第一层称为Class(门类)、第二层称为category(类别)、第三层称为Type(种),具体表示如下:

在这里插入图片描述

7.2.2数据来源

利用Google Earth软件获取全球部分区域的影像资料, 其中包含基于Google Earth标准展示的画面, 并且还包括该地点历史时期的照片。

7.3 数据格式及规模

该数据集合划分为三个专门化的文件夹:Train、Test及ImageSplits。其中Train与Test目录分别包含仅包含船只图像的AllImages文件夹以及仅包含注释信息的Annotations文件夹;其注释信息则以xml格式存储。所有图片均按照港口编号命名并采用bmp格式存放;其对应的注释则储存在xml标签中。具体而言,在数据集中包含了以下数量的数据样本:训练集合总计436张图片(共计1207个样本),验证集合拥有181张图片(总计541个样本),测试集合则包括444张图片(共计1228个样本)。在ImageSplits目录中包含了四个split文件:train.txt、val.txt、trainval.txt以及test.txt,这些split文件分别记录了各个阶段的数据索引信息

在这里插入图片描述

该研究提供了一份高质量的高分辨率光学卫星图像数据集,并针对船舶识别问题进行了深入探索

8、HRRSD数据集( 论文中提到过

在这里插入图片描述

由2019年中国科学院大学发布的HRRSD数据集

9、SIMD 数据集( 论文中提到过

该数据集中的绝大多数图像尺寸设定为1, 192×768像素,并由巴基斯坦国立科学技术大学的研究团队于2, 233年提出。该目标检测数据集主要用于车辆检测任务,并包含约5, 567幅遥感图像(每幅图像尺寸均为1, 936×768像素)以及总共约45, 993个实例。该数据集中所有图像均为JPEG格式,并且具有较高的分辨率水平。此外,在该数据集中具有显著比例的小目标样本(宽度和高度均小于等于约四分之一)。

在这里插入图片描述

10、ACS数据集 ( 论文中提到过

该数据集主要包含飞机、汽车以及船舶三大类别的内容。该集合整合了多个知名航空图像目标检测领域的基础研究资源包。其中包含共计4{,}159张遥感图像的数据样本。总计拥有27{,}438个标注实例。其中包括了13{,}082架飞机的数据记录。另有约4{,}843辆汽车的样例。还有9{,}513艘船舶的观测记录。


11、FAIRIM数据集( 已下载

具体信息可通过博客详细了解:<>

二、 SAR

1、 SSDD 数据集(已下载并且训练)( 论文中提到过

在这里插入图片描述

在数据集SSDD中共计有1160张图像以及2456艘舰船平均每张图片平均拥有2.12艘舰船该数据集未来将持续扩展与包含20个类别目标的PASCAL VOC数据集相比SSDD虽然图像数量较少但其仅包含舰船这一类目标因此能够有效训练检测模型

2、SSDD+ 数据集

在这里插入图片描述

SSDD+的数据集相较于SSDD数据对垂直边框进行了优化处理,在完成目标检测的同时具备了对目标方向估计的能力。

3、OpenSARShip 数据集

在这里插入图片描述

OpenSAR是由上海交通大学高级传感技术中心(AST)负责开发的一款开放源代码的SAR图像管理系统与处理平台。该系统致力于实现高效的图像管理与处理功能,并提供丰富的接口以实现图像读取、处理、可视化以及算法测试功能。

4、AIR-SARShip-1.0 数据集

在这里插入图片描述

该平台发布了AIR-SARShip-1. 系列版本的数据集第一批样本

5、 SAR-Ship-Dataset 数据集

在这里插入图片描述

本研究基于我国国产高分三号SAR数据和Sentinel-1 SAR数据开展研究工作。通过综合运用102幅高分三号图像与108幅Sentinel-1 SAR图像,在深度学习框架下构建了高分辨率SAR船舶目标样本数据库。目前该数据库已包含43819个船舶切片样本。其中高分三号平台采用的成像模式包括Strip-Map (UFS)、Fine Strip-Map 1 (FSI)、Full Polarization 1 (QPSI)、Full Polarization 2(QPSII)和Fine Strip-Map 2 (FSII),其对应的分辨率分别为3米、5米、8米、25米和10米。而Sentinel-1平台则主要采用条带模式(S3/S6)以及宽幅成像模式。

6、 HRSID 数据集( 论文中提到过

在这里插入图片描述

由电子科技大学苏浩于2020年1月发布的该研究团队开发的数据集中包含多种相关资料。其中,HRSID作为高分辨率 SAR 数据库被定义为专门用于船舶检测、语义分割以及实例分割任务的数据资源库。该数据库总计提供了 5604 张高分辨率 SAR 图像样本以及 16951 个船体实例供研究人员参考使用。值得注意的是,在构建 ISSID 数据库时参考了 Microsoft COCO 数据库的整体架构与构建方法学。对于 HRSID 数据库而言,其使用的 SAR 图像分辨率设置为 0.5 米、1 米以及 3 米三个不同等级选项以满足多样化的应用需求。

全部评论 (0)

还没有任何评论哟~