Advertisement

超高分辨率 图像 分割处理

阅读量:

文章大纲

  • 该领域中的制造业半导体高分辨率图像

    • 半导体相关数据集合
      • 公开提供高质量晶圆图像的数据集合
          1. WM-811K公开可用的数据集合
          1. Kaggle平台上的WM-811K高质量清洗数据集合
  • 医学病理领域中的高清图像分析


    • Camelyon++
      • CAMELYON17
      • CPIA 数据集
      • UCF-WSI 数据集
  • 航拍与遥感在获取高清晰度图像方面具有重要价值

    • 构建了该领域中具有代表性的高分辨率图像数据集
    • 1. 多目标检测技术
    • 2. 高分辨率场景理解系统开发
    • 3. 基于深度学习的城市 remote sensing 研究
    • 4. SEN2NAIP 数据增强系统开发
  • 切片推断法

      • SAHI: 切片辅助超推断

      • 简要说明

        • 该系统通过结合多种算法模型...实现高效的数据处理与分析...
        • 核心功能在于优化计算效率...
        • 具备良好的扩展性和适应性...
        • 能够处理复杂的数据场景...
      • 使用

        • 安装
  • 在半导体领域的高分辨率晶圆图像分割中,DeepLab、U-Net 和 YOLO 的应用表现如何?

    • DeepLab在该领域的应用具有哪些特点?

      • 其优势方面体现在哪些方面?

      • 其局限性主要表现在哪里?

      • 在实际应用中的分割性能如何?

      • 2. U-Net

        • 2.1 优势
        • 2.2 局限性
        • 2.3 分割性能
      • 3. YOLO

        • 3.1 优势
        • 3.2 局限性
        • 3.3 分割性能
      • 4. 适用性分析

        • 4.1 DeepLab
        • 4.2 U-Net
        • 4.3 YOLO
      • 5. 结论

    • 语义分割

    • 参考文献


在这里插入图片描述

制造业半导体领域高分辨率图像

半导体数据集

开源的高分辨率晶圆图像数据集

以下是两个开源的高分辨率晶圆图像数据集的链接地址:

1. WM-811K数据集

  • 描述:此数据集包括811,457张晶圆图像样本,在这些样本中有一半多一点的比例(即172,950张)被人工标注,并按九个不同的类别进行了分类。
  • GitHub链接WM-811K半导体晶圆图谱分类数据集

2. Kaggle上的WM-811K Clean Subset数据集

  • 描述 :这个子集包含了整合后的WM-811K数据集合经由去杂处理后分段处理而成。

医疗 病理领域高分辨率图像

1. Camelyon+

  • 说明 :基于对Camelyon-16及Camelyon-17数据集的重新处理构建了 Camelyon+ 数据集。该过程包括去除低质量切片、修复错误标签,并对先前未公开测试集提供由专家提供的像素级注释以提升数据质量和临床相关性。具体而言, 研究团队筛选并排除了模糊不清, 染色不当, 与治疗相关的伪影或具有模糊阳性的切片样本, 并将 Camelyon-16 中 的二分类标签扩展为包含四个分类的新系统(负性, 微转移, 宏转移及孤立肿瘤细胞)。通过这些措施, 最终构建出包含 1350 张完整切片图像的新 Camelyon+ 数据集 [32]。
  • 链接地址Camelyon+ 数据集

2. CAMELYON17

  • 说明 :CAMELYON17作为一个公开的数据集合,在病理学影像分析领域具有重要意义。该数据集合共计包含了500张全切片图象( WSIs ),主要用于乳腺癌淋巴结转移的检测工作。在具体应用中,则将该数据集合划分为训练用图像集合与测试用图像集合两部分:其中训练用图像集合包含了270张 WSIs ,而测试用则拥有230张 WSIs 。此外,在每一个切片图象中均进行了肿瘤区域的标记处理,并以此为基础开展相关研究与评估工作[33]。

3. CPIA Dataset

  • 说明 :The CPIA Dataset is a large-scale self-supervised pre-trained dataset for pathological image analysis, developed by a research team from Beijing Institute of Aerodynamics. It consists of 103 open-source datasets, containing 21,427,877 standardized images that cover over 48 different organs and tissues as well as approximately 100 types of diseases. The dataset primarily includes two types of data: whole slide images (WSIs) and region of interest (ROI) features [35].

4. UCF-WSI-Dataset

UCF-WSI-Dataset是一个专为深度学习模型的开发而设计的病理图像公开数据集,在其中包含了15个不同的器官类别。该数据集严格遵循FAIR原则,并展示了丰富多样的全切片病理图像作为样本集合,在疾病分类、癌症细胞识别以及肺炎细胞分割等医学影像分析任务中被应用于研究与临床诊断[36]。
数据集链接:UCF-WSI-Dataset


航拍 遥感中的高分辨率 图像

航拍遥感领域高分辨率图像数据集

1. DOTA

介绍:DOTA是一个规模庞大的遥感图像目标检测数据集。该数据集总计包含2806张遥感图像样本,并提供了约19万个标注实例。每幅图像的像素尺寸约为4000×4000像素,并划分为15个不同的类别,具体包括飞机、船舶、储油罐以及棒球场等[42]。

2. HRRSD

  • 说明 :该数据集由Google Earth和Baidu Map基于0.15米至1.2米的高分辨率影像捕获了21,761张图片,并涵盖了总共55,740个目标实例以及分为13个类别的遥感影像数据[41]。

3. LEVIR

  • 说明 :LEVIR数据集包含大量800×600像素以及分辨率高达每像素0.2米至1.0米的高分辨率Google Earth图像,并涵盖了城市地区、农村地区、山区以及海洋等多种地面特征。该数据集主要分为三种目标类别:飞机、轮船以及油罐[44]。

4. SEN2NAIP

  • 说明 :该数据集规模庞大且专注于遥感领域的研究与应用。其核心目标在于促进高分辨率模型的研究与实践工作。其中包含了从Sentinel-2 L2A平台获取的低分辨影像以及由国家农业影像计划(NAIP)提供的高分辨影像(参考文献:43)。

Sliced Inference

SAHI: Slicing Aided Hyper Inference

简要说明

该视觉库以轻量化的设计为基础,在大规模目标检测与实例分割任务中展现出卓越的效果。该技术通过辅助切片方法提升了推理效率,在实际应用中尤其擅长检测难以处理的小目标,并在处理大型图像时保持高效性。支持广泛使用的主流深度学习框架包括Ultralytics、MMDetection、Detectron2、HuggingFace以及TorchVision等。

主要功能

  • 图像切片与预处理模型 :支持使用各种检测模型进行图像切片或预处理操作。
    • COCO数据集操作 :自动划分COCO标注文件与图像文件,并系统分析多个预测结果的效果。
    • 交互式展示与验证界面 :提供交互式展示和验证界面用于结果分析及问题排查。
    • 多框架集成支持 :兼容多种目标检测框架实现灵活配置与集成使用。

使用

安装

复制代码
    pip install sahi
复制代码
    from sahi.predict import get_prediction
    
    # 使用YOLOv5模型进行预测
    prediction_result = get_prediction(
    image="path/to/image.jpg",
    model_type="yolov5",
    model_path="path/to/yolov5_model.pt",
    confidence_threshold=0.3,
    slice_height=512,
    slice_width=512,
    overlap_height_ratio=0.2,
    overlap_width_ratio=0.2
    )

DeepLab、U-Net 和 YOLO 在半导体领域高分辨率晶圆图像分割中的应用

1. DeepLab

1.1 优势

  • 空洞卷积 :通过空洞卷积技术实现DeepLab模型,在不增加参数和计算量的前提下显著地扩大了感受野的范围,并能有效地捕获图像中的更多上下文信息。这种技术对于在晶圆图像中识别不同尺寸与形状缺陷具有重要意义。
  • 多尺度特征融合 :DeepLab系统中的ASPP模块利用不同采样率的空间感知器来同时捕捉图像中的多尺度特征,并能在同一时间对这些特征进行融合处理。这对于提高晶圆图像中缺陷与结构检测的整体精度具有重要意义。
  • CRF后处理 :条件随机场(CRF)模型通过优化分割边界的质量,并显著提升分割精度的能力,在晶圆图像分割任务中能够帮助更加准确地定位缺陷边缘。

1.2 局限性

  • 计算复杂度较高 :DeepLab 的计算复杂度相对较高,在处理具有高分辨率的图像时可能会对计算资源和处理时间带来一定的挑战。

1.3 分割性能

  • DeepLabV3+ 在 WHU Building 数据集上的实验结果显示 *

  • DeepLabV2 :在 PASCAL 语义分割挑战中,在mIOU方面超越第二名7.2%。

  • DeepLabV1 :基于 VGG-16 架构的基础上,在经过空洞卷积和CRF后处理后实现mIOU较显著提升。

2. U-Net

2.1 优势

  • 编码器-解码器结构:U-Net通过分阶段地压缩图像信息来提取关键特征,在解码阶段则通过分层次地重建图像细节来恢复其复杂性。这种设计使得其特别适用于高分辨率图像处理任务,在晶圆制程 metrology 中能够有效保留丰富的细节信息。
  • 跳跃连接:U-Net通过建立连接将编码层与相应解码层的信息关联起来,在保留基础特征细节方面表现出色。这种机制对于晶圆 metrology 中精细结构的识别至关重要,在提高分割精度方面具有重要意义。
  • 小数据集训练:U-Net系统能够在有限的数据样本上实现高效的模型训练,在半导体制造领域中由于设备与流程限制导致的数据获取成本较高这一挑战下具有显著优势。

2.2 局限性

  • 在一定程度上存在局限性 :尽管 U-Net 在一定程度上能够实现对不同尺度特征的捕捉, 但其多尺度处理能力相对于 DeepLab 的 ASPP 模块来说较弱, 当应用于具有极端复杂多尺度特征的情况时, 可能表现不如 DeepLab.

2.3 分割性能

  • U-Net 基于 WHU Building 数据集的实验结果表明:

    • Precision 达到了 95.42%
    • Recall 达到了 88.26%
    • IoU 指标显示为 88.13%
    • F1-score 值为 91.35%
  • U-Net:在遥感图像的土地利用信息提取任务中,该方法的测试准确率达到90.95%,其Kappa系数值为0.86。

    • U-Net:在医学领域中的图像分割任务中,在此基准数据集上实现了平均Dice分数达到0.9582。

3. YOLO

3.1 优势

  • 目标识别与定位能力:YOLO 是一种高性能的目标识别与定位模型,在图像分析中展现出卓越的能力。其衍生机种如YOLOv8 已成功延伸至实例分割应用场景,在保证高精度的前提下显著提升了检测速度。该技术方案广泛应用于半导体芯片质量把关、智能安防系统等领域的实际问题求解。
  • 实时处理能力:YOLO 具备良好的实时性能,在复杂场景下仍能稳定运行并高效输出结果。该算法能在极短时间内完成任务处理,并对时效性要求较高的场景提供卓越支持。

3.2 局限性

  • 图像分辨率与精细度 :YOLO 在图像分辨率与精细度方面的性能较弱,相较于专业的图像识别模型如 DeepLab 和 U-Net 显著逊色。然而,在实例识别方面仍有提升空间。尽管 YOLOv8 等改进版本在实例分割方面表现出色,在像素级别的精细划分任务中仍显不足。

3.3 分割性能

YOLOv8 模型:针对实例分割任务领域,
YOLOv8 在 COCO 数据集上的平均精度(mAP)达到了 50% 以上,
YOLOv8 模型能够在实时应用场景中以较高帧率运行。

4. 适用性分析

4.1 DeepLab

  • 适用场景 :当晶圆图像包含多种尺度的缺陷以及复杂的背景信息,并且对分割的精确度有较高的要求时,DeepLab 通常是一个更为合适的选择。然而其计算量较大。通过优化算法设计以及借助硬件加速技术能够有效缓解这一挑战。

4.2 U-Net

当处理晶圆图像时,若需详细保留图像中的细微特征且样本数量有限,则U-Net方法表现出较高的效率。该网络架构简单明了,在训练速度上具有显著优势,并特别适合在资源受限的情况下实现快速部署与实际应用。

4.3 YOLO

  • 适用场景 :当任务要求为快速高效地完成晶圆图像中的缺陷区域检测时,YOLOv8 系统是一个理想的选择方案。该系统不仅能够维持高精度检测水平,在推理速度方面也表现优异,在实际应用中能够显著提升处理效率。
    YOLOv8 的显著优势在于其能够同时兼顾高精度检测与快速推理速度。

5. 结论

DeepLab、U-Net 和 YOLO 各具特色,在多个领域中均具有特定的应用价值。在半导体制造行业中的高分辨率晶圆图像分割任务中,则可以根据具体需求与资源条件进行合理选择。对于追求高精度像素级分割并兼顾多尺度处理能力的场景建议采用 DeepLab 等方法;若注重保持图像细节完整性同时面临数据资源有限的情况,则优先考虑 U-Net 系列算法;而对于需要实现高效缺陷区域检测与定位的应用则应重点选用 YOLOv8 等实时性更强的技术方案

期待这份综述对您有所帮助!如需进一步的问题或详细信息,请随时联系。

如需进一步的问题或建议,请及时联系。


语义分割


参考文献

全部评论 (0)

还没有任何评论哟~