Advertisement

Computer Vision(CS131,CS231n)学习笔记(1)

阅读量:

选用了Stanford University的CS131还有CS231n这两门课程作为素材,很多资料已经可以在这两门课程的网站上找到。

开这个新坑的目的是为了督促自己学习 ,同时也顺路把自己的研究项目合并到一块。

目录

In cs231

Lecture 2: Image Classification Pipeline 图像识别的流水线

Python Numpy Tutorial

图像识别是计算机视觉中的一项主要任务,想像一下,当我们已经有了一个候选标签池{dog, cat, truck, plane..}时,我们该如何将图片与这些标签池中的标签相对应呢?

这个问题,在计算机的角度看来: 一张图片,如果采用RGB模式编码的话,最终会生成一个大小为 N*M*3 的多维矩阵,其中N 为图片的长度(上至下), M 为图片的宽度(左至右)

从而我们面临的挑战可以分为以下六类
  • 观测点变化
  • 光照环境影响
  • 形变
  • 遮挡物
  • 杂乱的背景环境
  • 类间变化(多出现于某种族内部的区分)

下面介绍一个简单的图片分类器(Image Classifier)
Nearest Neighbor Classifier
数据集: CIFAR-10
数据集介绍: 这是一个包含10个类标签,5万张训练图片,以及1万张测试图片的数据集,每个图片的大小为32像素*32像素

线性分类器(Linear Classifier)

简单地说,这是一个能够将图片中每个像素,经过一个特殊的权矩阵 W后转换为各类评分的函数
之后我们还会介绍
- Loss function
- 优化过程
- ConvNets

需要用到的工具:

资源:
http://www.dataguru.cn/thread-371987-1-1.html


欢迎使用Markdown编辑器写博客

本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:

Markdown和扩展Markdown简洁的语法
- 代码块高亮
- 图片链接和图片上传
- LaTex 数学公式
- UML序列图和流程图
- 离线写博客
- 导入导出Markdown文件
- 丰富的快捷键


快捷键

  • 加粗 Ctrl + B

  • 斜体 Ctrl + I

  • 引用 Ctrl + Q

  • 插入链接 Ctrl + L

  • 插入代码 Ctrl + K

  • 插入图片 Ctrl + G

  • 提升标题 Ctrl + H

  • 有序列表 Ctrl + O

  • 无序列表 Ctrl + U

  • 横线 Ctrl + R

  • 撤销 Ctrl + Z

  • 重做 Ctrl + Y

Markdown及扩展

Markdown 是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档,然后转换成格式丰富的HTML页面。 —— [ 维基百科 ]

使用简单的符号标识不同的标题,将某些文字标记为粗体 或者 斜体 ,创建一个链接等,详细语法参考帮助?。

本编辑器支持 Markdown Extra , 扩展了很多好用的功能。具体请参考Github.

表格

Markdown Extra 表格语法:

项目 价格
Computer $1600
Phone $12
Pipe $1

可以使用冒号来定义对齐方式:

项目 价格 数量
Computer 1600 元 5
Phone 12 元 12
Pipe 1 元 234

定义列表

Markdown Extra 定义列表语法:

项目1

项目2

复制代码
定义 A
定义 B

项目3

复制代码
定义 C

定义 D

定义D内容

代码块

代码块语法遵循标准markdown代码,例如:

复制代码
    @requires_authorization
    def somefunc(param1='', param2=0):
    '''A docstring'''
    if param1 > param2: # interesting
        print 'Greater'
    return (param2 - param1 + 1) or None
    class SomeClass:
    pass
    >>> message = '''interpreter
    ... prompt'''
    
    python
    
    
![](https://ad.itadn.com/c/weblog/blog-img/images/2025-07-12/XjWyYgxhfRKv5ZFTQq9dVJlOsm7w.png)

脚注

生成一个脚注1.

目录

[TOC]来生成目录:

    • 目录

      • In cs231
    • 从而我们面临的挑战可以分为以下六类

    • 线性分类器Linear Classifier

  • 欢迎使用Markdown编辑器写博客

    • 快捷键

    • Markdown及扩展

      • 表格

      • 定义列表

      • 代码块

      • 脚注

      • 目录

      • 数学公式

      • UML 图

    • 离线写博客

    • 浏览器兼容

数学公式

使用MathJax渲染 LaTex 数学公式,详见math.stackexchange.com.

  • 行内公式,数学公式为:\Gamma(n) = (n-1)!\quad\forall n\in\mathbb N
    • 块级公式:

更多LaTex语法请参考 这儿.

UML 图:

可以渲染序列图:

Created with Raphaël 2.1.0 张三 张三 李四 李四 嘿,小四儿, 写博客了没? 李四愣了一下,说: 忙得吐血,哪有时间写。

或者流程图:

Created with Raphaël 2.1.0 开始 我的操作 确认? 结束 yes no

复制代码
  * 关于 **序列图** 语法,参考 [这儿](http://bramp.github.io/js-sequence-diagrams/),
  * 关于 **流程图** 语法,参考 [这儿](http://adrai.github.io/flowchart.js/).

离线写博客

即使用户在没有网络的情况下,也可以通过本编辑器离线写博客(直接在曾经使用过的浏览器中输入write.blog..net/mdeditor即可。Markdown编辑器 使用浏览器离线存储将内容保存在本地。

用户写博客的过程中,内容实时保存在浏览器缓存中,在用户关闭浏览器或者其它异常情况下,内容不会丢失。用户再次打开浏览器时,会显示上次用户正在编辑的没有发表的内容。

博客发表后,本地缓存将被删除。

用户可以选择 __把正在写的博客保存到服务器草稿箱,即使换浏览器或者清除缓存,内容也不会丢失。

注意: 虽然浏览器存储大部分时候都比较可靠,但为了您的数据安全,在联网后,请务必及时发表或者保存到服务器草稿箱

浏览器兼容

目前,本编辑器对Chrome浏览器支持最为完整。建议大家使用较新版本的Chrome。
IE9以下不支持
IE9,10,11存在以下问题

复制代码
1. 不支持离线功能
2. IE9不支持文件导入导出
3. IE10不支持拖拽文件导入


这里是 脚注内容. ↩

全部评论 (0)

还没有任何评论哟~