计算机视觉————基础矩阵

阅读量：

1 简介

在计算机视觉领域中存在一种称为基础矩阵（Fundamental matrix）F的3×3矩阵，在双视体几何框架内描述了一组对应于同一三维空间中的点的不同二维投影坐标之间的关系。这些点位于由另一方生成的一条极线上（即极线），这表明所有这样的对应点都位于各自的极线上。

在计算机视觉领域中,F矩阵详细地反映了两个视图之间在成像时所存在的空间几何关系,其中包括外参数（即相机的位置与姿态）以及内参数（即相机内部校准信息）。这些具体包括旋转角位移、主点坐标以及焦距等关键要素,并且由于该矩阵具有二维秩特性,因此可以通过7对对应点来唯一确定其值。
这一概念最初是由Q.T.Luong在其博士论文中首次提出的[1]。随后,Faugeras在其1992年的著作[2]中进一步明确了F矩阵的定义,指出它基于上述空间几何关系。
值得注意的是,尽管Longuet-Higgins提出了一个满足相似关系式的本质矩阵,但这种矩阵并未包含相机内部校准信息的本质内容。
从上述讨论可以看出,F与 Essential Matrix 之间存在密切联系,这种联系可通过以下方程式加以描述：

其中K和K’分别为两个相机的内参数矩阵。

2 基础矩阵

2.1对极几何

对极几何概念
对极几何实际上是“两幅图像之间的对极几何”，它是图像平面与以基线为轴的平面束的交的几何（这里的基线是指连接摄像机中心的直线），以下图为例：对极几何描述的是左右两幅图像(点x和x’对应的图像)与以CC’为轴的平面束的交的几何

由直线CC’构成的轴线周围围绕着一个由多个平面组成的平面族；这些平面上分别对应着两个图像；通过下图可以看出这一结构特征；由此可见；这些平面上分别对应着两个图像；

上图中的灰色平面π仅限于过基线的一组特定平面上束中的一个成员（特别指出该特定平面是整个平面上束中最关键性且是我们重点研究的对象）

2.2本质矩阵

设X在C， C’坐标系中的相对坐标分别p， p’，则有

根据三线共面有：

又有：

将其改写成：

变化后得到：

通过建立本质矩阵E此处附图说明
本质矩阵表征了空间内的点在两套坐标系之间的坐标转换关系。

2.3基础矩阵

根据前述， K 和 K’ 分别为两个相机的内参矩阵，有：

带入上式，我们可以得到：

计算得到:

红色方框种的式子则为基础矩阵F:

基础矩阵被定义为空间中点在两个像平面之间的坐标对应关系。可用于简化匹配以及去除错配特征：第一和第二个。

2.4 8点算法估计基础矩阵F

八点估算
基本矩阵是由该方程定义的： x′TFx=0
其中x↔x′是两幅图像的任意一对匹配点。由于每一组点的匹配提供了计算F系数的一个线性方程，当给定至少7个点（3×3的齐次矩阵减去一个尺度，以及一个秩为2的约束），方程就可以计算出未知的F。我们记点的坐标为x=(x,y,1)T，x′=(x′,y′,1)T
又因为F为：

所以可得到方程：

即相应方程式为

给定n组点的集合，我们有如下方程：

如果存在确定（非零）解，则系数矩阵A的秩最多是8。由于F是齐次矩阵，所以如果矩阵A的秩为8，则在差一个尺度因子的情况下解是唯一的。可以直接用线性算法解得。
如果由于点坐标存在噪声则矩阵AA的秩可能大于8（也就是等于9，由于A是n×9的矩阵）。这时候就需要求最小二乘解，这里就可以用SVD来求解，f的解就是系数矩阵A最小奇异值对应的奇异向量，也就是A奇异值分解后A=UDVT中矩阵V的最后一列矢量，这是在解矢量f在约束∥f∥下取∥Af∥最小的解。以上算法是解基本矩阵的基本方法，称为8点算法。
上述求解后的F不一定能满足秩为2的约束，因此还要在F的基础上加以约束。通过SVD分解可以解决，令F=UΣVT，则

因为要秩为2，所以取最后一个元素设置为0，则

最终的解：

3 代码实现

3.1代码

1 sift提取特征
2 RANSAC去除错误点匹配
3 归一化8点算法估计基础矩阵

复制代码

    # -*- coding: utf-8 -*-
    from PIL import Image
    from numpy import *
    from pylab import *
    import numpy as np
    from PCV.geometry import camera
    from PCV.geometry import homography
    from PCV.geometry import sfm
    from PCV.localdescriptors import sift
    # -*- coding: utf-8 -*-
    
    # Read features
    # 载入图像，并计算特征
    im1 = array(Image.open('E:/picture/02/1.jpg'))
    sift.process_image('E:/picture/02/1.jpg', 'im1.sift')
    l1, d1 = sift.read_features_from_file('im1.sift')
    
    im2 = array(Image.open('E:/picture/02/2.jpg'))
    sift.process_image('E:/picture/02/2.jpg', 'im2.sift')
    l2, d2 = sift.read_features_from_file('im2.sift')
    
    # 匹配特征
    matches = sift.match_twosided(d1, d2)
    ndx = matches.nonzero()[0]
    
    # 使用齐次坐标表示，并使用 inv(K) 归一化
    x1 = homography.make_homog(l1[ndx, :2].T)
    ndx2 = [int(matches[i]) for i in ndx]
    x2 = homography.make_homog(l2[ndx2, :2].T)
    
    x1n = x1.copy()
    x2n = x2.copy()
    print(len(ndx))
    
    figure(figsize=(16,16))
    sift.plot_matches(im1, im2, l1, l2, matches, True)
    show()
    
    # Don't use K1, and K2
    
    #def F_from_ransac(x1, x2, model, maxiter=5000, match_threshold=1e-6):
    def F_from_ransac(x1, x2, model, maxiter=5000, match_threshold=1e-6):
    """ Robust estimation of a fundamental matrix F from point
    correspondences using RANSAC (ransac.py from
    http://www.scipy.org/Cookbook/RANSAC).
    
    input: x1, x2 (3*n arrays) points in hom. coordinates. """
    
    from PCV.tools import ransac
    data = np.vstack((x1, x2))
    d = 20 # 20 is the original
    # compute F and return with inlier index
    F, ransac_data = ransac.ransac(data.T, model,
                                   8, maxiter, match_threshold, d, return_all=True)
    return F, ransac_data['inliers']
    
    # find E through RANSAC
    # 使用 RANSAC 方法估计 E
    model = sfm.RansacModel()
    F, inliers = F_from_ransac(x1n, x2n, model, maxiter=5000, match_threshold=1e-4)
    
    print(len(x1n[0]))
    print(len(inliers))
    
    # 计算照相机矩阵（P2 是 4 个解的列表）
    P1 = array([[1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0]])
    P2 = sfm.compute_P_from_fundamental(F)
    
    # triangulate inliers and remove points not in front of both cameras
    X = sfm.triangulate(x1n[:, inliers], x2n[:, inliers], P1, P2)
    
    # plot the projection of X
    cam1 = camera.Camera(P1)
    cam2 = camera.Camera(P2)
    x1p = cam1.project(X)
    x2p = cam2.project(X)
    
    figure()
    imshow(im1)
    gray()
    plot(x1p[0], x1p[1], 'o')
    #plot(x1[0], x1[1], 'r.')
    axis('off')
    
    figure()
    imshow(im2)
    gray()
    plot(x2p[0], x2p[1], 'o')
    #plot(x2[0], x2[1], 'r.')
    axis('off')
    show()
    
    figure(figsize=(16, 16))
    im3 = sift.appendimages(im1, im2)
    im3 = vstack((im3, im3))
    
    imshow(im3)
    
    cols1 = im1.shape[1]
    rows1 = im1.shape[0]
    for i in range(len(x1p[0])):
    if (0<= x1p[0][i]<cols1) and (0<= x2p[0][i]<cols1) and (0<=x1p[1][i]<rows1) and (0<=x2p[1][i]<rows1):
        plot([x1p[0][i], x2p[0][i]+cols1],[x1p[1][i], x2p[1][i]],'c')
    axis('off')
    show()
    
    print(F)
    
    x1e = []
    x2e = []
    ers = []
    for i,m in enumerate(matches):
    if m>0: #plot([locs1[i][0],locs2[m][0]+cols1],[locs1[i][1],locs2[m][1]],'c')
        x1=int(l1[i][0])
        y1=int(l1[i][1])
        x2=int(l2[int(m)][0])
        y2=int(l2[int(m)][1])
        # p1 = array([l1[i][0], l1[i][1], 1])
        # p2 = array([l2[m][0], l2[m][1], 1])
        p1 = array([x1, y1, 1])
        p2 = array([x2, y2, 1])
        # Use Sampson distance as error
        Fx1 = dot(F, p1)
        Fx2 = dot(F, p2)
        denom = Fx1[0]**2 + Fx1[1]**2 + Fx2[0]**2 + Fx2[1]**2
        e = (dot(p1.T, dot(F, p2)))**2 / denom
        x1e.append([p1[0], p1[1]])
        x2e.append([p2[0], p2[1]])
        ers.append(e)
    x1e = array(x1e)
    x2e = array(x2e)
    ers = array(ers)
    
    indices = np.argsort(ers)
    x1s = x1e[indices]
    x2s = x2e[indices]
    ers = ers[indices]
    x1s = x1s[:20]
    x2s = x2s[:20]
    
    figure(figsize=(16, 16))
    im3 = sift.appendimages(im1, im2)
    im3 = vstack((im3, im3))
    
    imshow(im3)
    
    cols1 = im1.shape[1]
    rows1 = im1.shape[0]
    for i in range(len(x1s)):
    if (0<= x1s[i][0]<cols1) and (0<= x2s[i][0]<cols1) and (0<=x1s[i][1]<rows1) and (0<=x2s[i][1]<rows1):
        plot([x1s[i][0], x2s[i][0]+cols1],[x1s[i][1], x2s[i][1]],'c')
    axis('off')
    show()

sifi匹配

ransac算法

8点算法

基础矩阵

全部评论 (0)

还没有任何评论哟~

计算机视觉————基础矩阵

目录 1简介 2基础矩阵 2.1对极几何 2.2本质矩阵 2.3基础矩阵 2.48点算法估计基础矩阵F 3代码实现 3.1代码 1简介在计算机视觉中，基础矩阵（Fundamentalmatrix）F...

计算机视觉——基础矩阵

目录一、实验原理 1\.对极几何 2\.基础矩阵F 基础矩阵的几何推导（1）点通过平面转移（2）构造对极线 3\.通过匹配点对估算基础矩阵（8点算法） 4\.图像坐标归一化 5\.RANSAC算...

计算机视觉——基础矩阵

文章目录一、外极几何原理八点估算法二、实验分析 1、左右拍摄，极点位于图像平面上 2、像平面接近平行，极点位于无穷远 3、图像拍摄位置位于前后 4、结果分析三、实验中遇到的问题一、外极几何原...

【计算机视觉】基础矩阵

目录一、外极几何二、基础矩阵F 1.基础矩阵原理 2.基础矩阵性质 3.基础矩阵估算方法 3.1八点估算法 3.2RANSAC随机取样一致法估算（略）三、基础矩阵代码实现 1.相关代码 2.实验...

计算机视觉——基础矩阵

文章目录一、简介二、原理三、实验代码四、实验结果五、小结引用一、简介在计算机视觉中，基础矩阵（Fundamentalmatrix）F是一个3×3的矩阵，表达了立体像对的像点之间的对应关...

计算机视觉基础：矩阵运算

矩阵及其表示方式一个矩阵是由行row和列column组成的一个矩形数组，通常包含数字。我们可以用大写字母（如A、B）来表示一个矩阵。例如，矩阵A可能看起来像这样： A=[a11a12a13] [a2...

计算机视觉基础：【矩阵】矩阵选取子集

OpenCV的基础是处理图像，而图像的基础是矩阵。因此，如何使用好矩阵是非常关键的。下面我们通过一个具体的实例来展示如何通过Python和OpenCV对矩阵进行操作，从而更好地实现对图像的处理。 ...

计算机视觉学习（七）：由基础矩阵计算照相机矩阵

基础矩阵原理基本矩阵体现了两视图几何（对极几何，epipolargeometry）的内在射影几何（projectivegeometry）关系，基本矩阵只依赖于摄像机的内参KK和外参R,tR,t。

8点算法计算基础矩阵(计算机视觉)

源自OpenCV中的代码： intCvFMEstimator::run8PointconstCvMatm1,constCvMatm2,CvMatfmatrixdoublea[99],w[9],v[99...

【计算机视觉】多视几何之基础矩阵估计

目录一、对极几何 1.1对极几何的概念 1.2基本模型 1.3对极几何约束二、基础矩阵（F）三、基础矩阵估计方法 3.1八点估算法 3.2ransac随机采样一致法估算四、基础矩阵估计代码实现...

是否确定退出登录?

计算机视觉————基础矩阵

目录

1 简介

2 基础矩阵

2.1对极几何

2.2本质矩阵

2.3基础矩阵

2.4 8点算法估计基础矩阵F

3 代码实现

3.1代码

全部评论 (0)

相关文章推荐

计算机视觉————基础矩阵

计算机视觉——基础矩阵

计算机视觉——基础矩阵

【计算机视觉】基础矩阵

计算机视觉——基础矩阵

计算机视觉基础：矩阵运算

计算机视觉基础：【矩阵】矩阵选取子集

计算机视觉学习（七）：由基础矩阵计算照相机矩阵

8点算法计算基础矩阵(计算机视觉)

【计算机视觉】多视几何之基础矩阵估计