Advertisement

图像篡改检测数据集修正(Image Tampering Detection Dataset)

阅读量:

文章目录

    • 1 简介

    • 2 数据集处理过程

      • 2.1 CASIAv1
      • 2.2 CASIAv2
      • 2.3 COVERAGE
      • 2.4 NIST16
    • 3 总 结

1 简介

CASIAv1 、CASIAv2、COVERAGE、NIST16 作为图像篡改检测的公开数据集,用于训练和测试模型。然而,公开数据集中存在不同情况的问题,本仓库主要解决这些问题,原始数据集CASIAv1 和 CASIAv2来自[kaggle link],CASIAv1的mask来自[github],CASIAv2的mask来自[github]
COVERAGE数据集来自[github]。本人在[github]中提供了处理后的数据集百度网盘下载链接,方便用户直接下载使用。

2 数据集处理过程

2.1 CASIAv1

  • 情况1:部分图像操作类别分类不准确,例如,Sp_D_NND_A_nat0054_nat0054_0189.jpg,图像名称中第4位的字母’D’含义difference,表示splicing操作,转换成Sp_S_NND_A_nat0054_nat0054_0189.jpg,'S’含义same,表示copy-move操作。总共转换操作类型照片29张,更改名字照片4张。

  • 解决方案:
    运行1_modify_name_casia1.py,通过使用 CASIAv1的mask仓库中的文件".\casia1groundtruth-master\CASIA 1.0 groundtruth\FileNameCorrection.xlsx"修改图像文件名称。

  • 情况2:图像库中的"casia-dataset\CASIAv1\Sp"的部分图像没有对应的mask名称。

  • 解决方案:
    运行2_process_casia_1.py脚本,查找出不匹配图像并且存入".\73 images process\CASIAv1_no_mask_imgs.txt"。
    运行3_capture_and_modify_name_73.py修改图像名称匹配mask名称。处理73张图片。

  • 情况3:
    Sp_D_NRN_A_sce0011_cha0011_0542.jpg 没有掩码,删除该图像。

  • 提示:

真实图像:800,篡改图像:920(921张图片删除1张图片)。

2.2 CASIAv2

  • 情况1:部分图像操作类别分类不准确,总共转换操作类型照片99张,更改名字照片42张。

  • 解决方案:
    运行modify_name_casia2.py,通过使用 CASIAv2的mask仓库中的文件".\casia2groundtruth-master\Notes\fileNamesCorrection.xlsx"修改图像文件名称。

  • 情况2:图像文件夹中的".\casia-dataset\CASIAv2\Tp"的部分图像分辨率与对应名称的掩码分辨率不同。

  • 解决方案:
    一共17张图像需要修改分辨率,参考[github]

  • 情况3:

Tp_D_NNN_M_B_art00037_nat10103_10108.tif

Tp_D_NNN_M_N_nat10103_pla10110_10116.tif

Tp_D_NNN_S_N_nat00042_nat00042_00961.tif
没有掩码,可以删除这些图像。

  • 提示:

真实图像:7491,篡改图像:5123(其中3张图像没有掩码)。

2.3 COVERAGE

  • 情况:有9张图像(27张mask)分辨率不匹配
  • 解决方案:可以参考[github]
  • 提示:

真实图像:100,篡改图像:100

2.4 NIST16

  • 提示:

真实图像:0,篡改图像:564

3 总 结

图像篡改检测数据集还有很多。本文只是列举了几个比较常用的数据集,如果对您的使用带来便利,记得点赞赠送小星星呦!
重要事情重复提醒:
处理完的数据集可以通过[github]中提供的数据集百度网盘下载链接,下载使用数据集呀。

全部评论 (0)

还没有任何评论哟~