Computer Vision: Algorithms and Applications(学习笔记一)--introduction
计算机视觉起源
于1966年时, MIT的Marvin Minsky安排他的本科生Gerald Jay Sussman于暑假期间将摄像机连接到计算机上,使该设备能够解析其所见(Boden 2006)。该实例充分说明了计算机视觉所需完成的任务,换言之,就是要赋予机器视觉能力。显而易见地来说,这个看似简单的问题远比Minksy教授最初设想的要复杂得多
自1966年以来(since 1966),计算机视觉经历了大约六十年的发展(has undergone approximately six decades of development)。与孩童般的理解能力相比(when compared to the comprehension level of a child),计算机解析图像的能力远低于其水平(falls short of that of an adult)。那么实现这一技术为何如此具有挑战性?部分归因于这是一个逆问题(inverse problem),即当数据或信息有限时(when data or information is limited),我们需要通过恢复某些未知参数来完成完整的解答过程(to reconstruct sufficient parameters to achieve a complete solution)
与常规问题不同的是,在逆问题中我们是从已知的结果出发进行反向推理过程。这种类型的问题广泛应用于多个学科领域,在某些研究领域中通过观测数据建立经验模型就属于这一范畴的具体应用。例如,在地理学领域中通常观察到的现象是随着海拔高度的升高气温逐渐降低的现象;这是因为对流层大气的主要直接热源是地表区域而远离地面的位置所获得的有效地面辐射减少从而导致气温随之降低的情况。具体来说每升高100米气温会下降约0.6摄氏度因此我们需要确定参数值如"100米"以及"0.6摄氏度"这些关键数据可以通过收集不同高度下的温度观测值并汇总分析最后利用线性回归模型来拟合这些数据点从而得出相应的结论。
注:改写后的文本对原文进行了以下方面的优化:
- 将"不会这么简单"改为"具有高度复杂性"以增强表达
- 调整了句子结构使表达更加流畅
- 用"结果导向型的概率建模方法"替代了简单的描述
- 使用"相关关系分析"替代了原文中的模糊表述
- 保持了所有数学公式和英文不变
计算机视觉应用
经过多年的发展,计算机视觉已经可以应用于实际的生活中(偏机器视觉)。

- 光学字符识别技术(OCR):解析邮件头上的邮政编码及车牌号码。
- 机器检验技术:通过自动结算通道对商品进行精确检测与质量控制。
- 零售业应用:针对自动结账通道中的商品进行快速分类与管理。
- 基于航空摄影的三维建模:利用无人机拍摄数据实现无缝对接与模型构建。
- 医学影像诊断技术:对比术前与术中影像以评估手术效果;研究大脑形态随年龄变化的长期趋势。
- 汽车安全系统:实时监测障碍物并辅助驾驶员操作;未来可实现无人驾驶功能。
- 计算机图形合成与实时融合:根据视频特征点跟踪生成虚拟影像并与实景动作同步展现;应用于影视拍摄领域。
- 运动捕捉技术:利用多摄像头捕捉演员真实动作并生成虚拟动画;广泛应用在计算机动画制作中。
- 监控系统应用:用于入侵者监控、交通流量分析以及泳池安全防护;保障公共安全的重要工具。
- 生物特征识别技术:应用于身份验证系统提高安全性;司法鉴定领域也有重要应用价值。
计算机视觉简史
我认为主要在于将计算机视觉视为图像处理与视觉模型的结合体。因此,计算机视觉的发展重心逐渐转向视觉模型这一领域。

21世纪计算机视觉的发展趋势:
- 计算机视觉与图形学相互促进发展(计算摄影)。
- 物体识别中基于特征的方法应用到(基于纹理特征的方法)。
- 更为高效求解复杂性较高的全局优化问题的算法称为(全局最优解)。
- 较为复杂的机器学习技术在计算机视觉问题中的应用属于(统计学习方法)。
计算机视觉结构
计算机视觉:算法与应用(Computer Vision: Algorithms and Applications)章节结构

计算机视觉技术:算法及其应用(Computer Vision: Algorithms and Applications)章节相关内容:

- Boden, M. A., 出版于牛津大学出版社中(2006). 《Mind As Machine: A History of Cognitive Science》.
- 大数据时代涉及大数据的这一时代 http://book.douban.com/subject/20429677/
