Advertisement

OpenCV图像处理技术(Python)——答题卡识别

阅读量:

这篇文章介绍了使用OpenCV进行图像处理的技术,并详细讲解了如何通过预处理和轮廓检测实现透视变换和圆圈识别的应用。主要内容包括:
学习目标:

  • 灵活运用平滑处理、边缘检测、轮廓检测等技术。
  • 掌握轮廓对比方法并进行统计分析。
  • 综合应用数字图像处理知识解决实际问题。
    具体实现步骤:
  • 使用高斯模糊和Canny边缘检测进行预处理。
  • 通过 contours_img 绘制轮廓。
  • 对比排序后的四个顶点坐标以获得透视变换矩阵。
  • 使用 Otsu 阈值法找到圆圈轮廓并进行标记。
  • 按照从上到下排序的圆圈识别答案并统计正确率。
    总结:
  • 这种方法在实际应用中非常实用且复杂但值得掌握。

OpenCV图像处理技术(Python)——答题卡识别
© Fu Xianjun. All Rights Reserved.

文章目录

  • 引言
  • 课程安排
  • 课程内容
      1. 图像预处理与边缘检测
      1. 边界排序与几何变换
      1. 识别圆形边界
      1. 提取并分析每个圆圈的特征
    • 总结


前言

家人们好,我又又又来讲解知识了。


学习目标

  1. 深入掌握图像平滑化处理、边缘提取技术、投影变换方法以及坐标点坐标的运算操作等基本技能
  2. 掌握并实现轮廓对比分析法,并完成相应的统计分析计算
  3. 具备综合运用数字图像处理理论体系和相关算法知识解决实际应用中的图像识别与分析问题的能力

学习内容

1.预处理、轮廓检测

复制代码
    import cv2
    import numpy as np
    # 正确答案
    ANSWER_KEY = {0: 1, 1: 4, 2: 0, 3: 3, 4: 1}
    def cv_show(name,img):
        cv2.imshow(name, img)
        cv2.waitKey(0)
        cv2.destroyAllWindows()  
    # 读取输入
    image = cv2.imread("test_01.png")
    contours_img = image.copy()
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    blurred = cv2.GaussianBlur(gray, (5, 5), 0)
    cv_show('blurred',blurred)
    edged = cv2.Canny(blurred, 75, 200)
    cv_show('edged',edged)
    # 轮廓检测
    cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL,\
                        cv2.CHAIN_APPROX_SIMPLE)[0]
    cv2.drawContours(contours_img,cnts,-1,(0,0,255),3) 
    cv_show('contours_img',contours_img)

2.轮廓排序,透视变换

复制代码
    def order_points(pts):
    # 一共4个坐标点
    rect = np.zeros((4, 2), dtype = "float32")
    
    # 按顺序找到对应坐标0123分别是 左上,右上,右下,左下
    # 计算左上,右下
    s = pts.sum(axis = 1)
    rect[0] = pts[np.argmin(s)]
    rect[2] = pts[np.argmax(s)]
    
    # 计算右上和左下
    diff = np.diff(pts, axis = 1)
    rect[1] = pts[np.argmin(diff)]
    rect[3] = pts[np.argmax(diff)]
    
    return rect
    
    def four_point_transform(image, pts):
    # 获取输入坐标点
    rect = order_points(pts)
    (tl, tr, br, bl) = rect
    
    # 计算输入的w和h值
    widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))
    widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))
    maxWidth = max(int(widthA), int(widthB))
    
    heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))
    heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))
    maxHeight = max(int(heightA), int(heightB))
    
    # 变换后对应坐标位置
    dst = np.array([
        [0, 0],
        [maxWidth - 1, 0],
        [maxWidth - 1, maxHeight - 1],
        [0, maxHeight - 1]], dtype = "float32")
    
    # 计算变换矩阵
    M = cv2.getPerspectiveTransform(rect, dst)
    warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight))
    
    # 返回变换后结果
    return warped
复制代码
    # 确保检测到了
    docCnt = None
    if len(cnts) > 0:
    # 根据轮廓大小进行排序
    cnts = sorted(cnts, key=cv2.contourArea, reverse=True)
    
    # 遍历每一个轮廓
    for c in cnts:
        # 近似
        peri = cv2.arcLength(c, True)
        approx = cv2.approxPolyDP(c, 0.02 * peri, True)
    
        # 准备做透视变换
        if len(approx) == 4:
            docCnt = approx
            break
    
    # 执行透视变换
    
    warped = four_point_transform(gray, docCnt.reshape(4, 2))
    cv_show('warped',warped)

3.寻找圆圈轮廓

复制代码
    def sort_contours(cnts, method="left-to-right"):
    reverse = False
    i = 0
    if method == "right-to-left" or method == "bottom-to-top":
        reverse = True
    if method == "top-to-bottom" or method == "bottom-to-top":
        i = 1
    boundingBoxes = [cv2.boundingRect(c) for c in cnts]
    (cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),
                                        key=lambda b: b[1][i], reverse=reverse))
    return cnts, boundingBoxes
复制代码
    # Otsu's 阈值处理
    thresh = cv2.threshold(warped, 0, 255,
    cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1] 
    cv_show('thresh',thresh)
    thresh_Contours = thresh.copy()
    # 找到每一个圆圈轮廓
    cnts = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL,
    cv2.CHAIN_APPROX_SIMPLE)[0]
    cv2.drawContours(thresh_Contours,cnts,-1,(0,0,255),3) 
    cv_show('thresh_Contours',thresh_Contours)
    questionCnts = []

4.输出每个轮廓,对比答案

复制代码
    # 遍历
    for c in cnts:
    # 计算比例和大小
    (x, y, w, h) = cv2.boundingRect(c)
    ar = w / float(h)
    
    # 根据实际情况指定标准
    if w >= 20 and h >= 20 and ar >= 0.9 and ar <= 1.1:
        questionCnts.append(c)
    
    # 按照从上到下进行排序
    questionCnts = sort_contours(questionCnts,
    method="top-to-bottom")[0]
    cv2.drawContours(warped, questionCnts, 1,(0,255,255),2)
    cv_show("warp",warped)
    correct = 0
    
    # 每排有5个选项
    for (q, i) in enumerate(np.arange(0, len(questionCnts), 5)):
    # 排序
    cnts = sort_contours(questionCnts[i:i + 5])[0]
    bubbled = None
    
    # 遍历每一个结果
    for (j, c) in enumerate(cnts):
        # 使用mask来判断结果
        mask = np.zeros(thresh.shape, dtype="uint8")
        cv2.drawContours(mask, [c], -1, 255, -1) #-1表示填充
        cv_show('mask',mask)
        # 通过计算非零点数量来算是否选择这个答案
        mask = cv2.bitwise_and(thresh, thresh, mask=mask)
        total = cv2.countNonZero(mask)
    
        # 通过阈值判断
        if bubbled is None or total > bubbled[0]:
            bubbled = (total, j)
     # 对比正确答案
    color = (0, 0, 255)
    k = ANSWER_KEY[q]
    
    # 判断正确
    if k == bubbled[1]:
        color = (0, 255, 0)
        correct += 1
    
    # 绘图
    cv2.drawContours(warped, [cnts[k]], -1, color, 3)
    
    
    score = (correct / 5.0) 
    print("[INFO] score: {:.2f}%".format(score))
    cv2.putText(warped, "{:.2f}%".format(score), (10, 30),
    cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2)
    cv2.imshow("Original", image)
    cv2.imshow("Exam", warped)
    cv2.waitKey(0)

总结

哎这就是今天我要说的东西,有些复杂但是真的是很实用的东西!!!

全部评论 (0)

还没有任何评论哟~