机器视觉培训

Report
图像处理及机器视觉
王军南
2010.10.24
浙江大学控制系
浙江大学控制系
任务描述
浙江大学控制系
视觉在比赛中的应用
• 历届比赛没有应用视觉来完成或者辅助完
成比赛任务,主要原因可能在于以下两
点:
– 校赛的比赛环境是高度结构化的,不需要依赖
于视觉就可以完成。
– 机器视觉具有的特点
• 数据量大
• 计算量大
浙江大学控制系
一种可能的硬件配置
• 机器人运动底盘+上网本+网络摄像头
浙江大学控制系
主要内容
• 主要讲述机器视觉的基本内容,以及可能
在比赛中应用的相关技术。
1. 数字图像处理基础
2. 摄像机几何基础
3. OpenCV应用基础
4. 一些应用的例子
浙江大学控制系
数字图像处理基础
浙江大学控制系
主要内容
• 主要介绍图像以及在机器人上常用到的图
像处理算法:
– 图像的表示
– 直方图
– 边缘、角点检测
– 基于颜色的区域分割
– 形态学操作
浙江大学控制系
图像的表示
• 数字图像是一般是一个m*n*k的矩阵,
m*n表示图像的大小,k表示每个像素占
据的字节。
• 图像常见的有以下几种:
– 1位二值图像
– 8位灰度图像
– 24位彩色图像
• 彩色模型
浙江大学控制系
一位二值图像
浙江大学控制系
8位灰度图像
浙江大学控制系
24位彩色图像
• 24位彩色图像:通常真彩色用三字节的R,
G,B来表示,即8:8:8=24位。可以表示
16777216种不同的颜色。
• R、G、B (三基色波长(CIE)Blue:
435.8nm, Green: 546.1nm,Red: 700nm)
浙江大学控制系
24位彩色图像
浙江大学控制系
颜色模型
• RGB模型
浙江大学控制系
颜色模型
• HSB模型
• 基于人类对颜色的感觉,HSB模型描述颜色的三个基本特征。
又称为HSI空间。
• 色相(或色度Hue)
– 是从物体反射或透过物体传播的颜色。在 0 到 360 度的标准色轮
上,色相是按位置度量的。在通常的使用中,色相是由颜色名称
标识的,比如红、橙或绿色。
• 饱和度(Saturation)
– 有时也称色品,是指颜色的强度或纯度。饱和度表示色相中灰成
分所占的比例,用从 0%(灰色)到 100%(完全饱和)的百分比
来度量。在标准色轮上,从中心向边缘饱和度是递增的。
• 亮度(Brightness/Intensity)
– 是颜色的相对明暗程度,通常用从 0%(黑)到 100%(白)的百
分比来度量。
浙江大学控制系
颜色模型
•HSB颜色模型图示
浙江大学控制系
图像存储格式
• 常见的存储格式有bmp,jpeg这样两种
• Bmp图像:直接按顺序存储像素的RGB值,
占用大量的存储空间。
• Jpeg图像:是一种经过压缩的图像,其压缩
遵循JPEG标准。将图像分块后进行变换,如
DCT,小波变换等,然后对变换后的系数进
行编码存储,以大大节省存储空间。
浙江大学控制系
直方图
• 灰度直方图(histogram)是灰度级的函数,描述的是
图像中每种灰度级像素的个数,反映图像中每种灰度
出现的频率。横坐标是灰度级,纵坐标是灰度级出现
的频率。
浙江大学控制系
直方图
• 直方图反映了一幅图像灰度统计信息,相似的图
像具有相似的直方图,而反过来则不成立。
• 直方图常用于图像分割阈值的确定以及基于直方
图的匹配。
浙江大学控制系
直方图
• 直方图用于匹配
• 直方图数据量远远小于源图像,利用直方
图能进行快速的匹配。
• 对直方图进行图像均衡,可以抵抗图像亮
度变化带来的干扰。
浙江大学控制系
边缘检测
• 什么是边缘检测
– 边缘是指图像中灰度发生急剧变化的区域。图像灰
度的变化可以用图像的梯度反映。
– 边缘检测:求连续图像f(x,y)梯度的局部最大值和
方向。 f  x , y  沿 r的 梯 度
f
r
使

f
r
f x
x r

f y
y r
 f x cos   f y sin 

最大的条件是
f
r  0

浙江大学控制系
边缘检测
• 边缘检测的常用算法
– 差分检测
– 梯度检测
– Sobel边缘检测
– Laplace边缘检测
– Canny边缘检测
浙江大学控制系
边缘检测
浙江大学控制系
边缘检测
浙江大学控制系
角点检测
• 角点是图像中具有高曲率的点,一般有高曲率边
缘,或者是边缘相交叉形成。
• 相对于边缘来说,角点在各个方向上都有梯度的变
化,具有目标几何形状信息,通常作为描述目标的
特征,在特征提取,运动估计等领域有重要的应
用。
• 角点检测算法总的可以分为两类:
– 检测边缘,然后寻找边缘的角点作为角点
– 直接对灰度图像进行操作,或是计算灰度分布曲率,
以曲率最大点作为角点,或是统计领域内的灰度分布
信息,以判断是否为角点。
• 主流的角点检测以第二种方法为主。
浙江大学控制系
角点检测
• 最为常用的角点检测算法为Harris角点检测算法
• Harris角点检测算法检测图像局部自相关函数的曲率特
性。局部自相关函数为
E ( x, y ) 

w u , v I ( u  x , v  y ), I ( u , v )
2
u ,v
其中 w u , v 表示图像窗口,I表示图像灰度,x,y表示偏移。
• 图像上任何一点的E(x,y)可能表现为如下三种情况
– 在任何方向上的偏移都产生较小的E(x,y)----平坦区域
– 在某一个特定方向上产生较大的E(x,y)------- 边缘区域
– 在任何方向上都产生较大的E(x,y)--------------角点区域
浙江大学控制系
角点检测
浙江大学控制系
Hough变换
• Hough变换用于检测图像中可以参数化表示
特定形状。
• Hough变换的原理是利用图像空间和参数空
间的对应关系,将图像空间有一定关系的
像素在进行聚类,并以解析形式转化到参
数空间,以获取同类像素的解析参数。
• 常见的Hough变换有Hough直线变换,
Hough圆变换。
• 以Hough直线变换为例说明Hough变换原理
浙江大学控制系
Hough变换
• 设直线方程为y=kx+b,其中k为斜率,b为截
距项。
• 每个点(x,y)对应到参数k-b空间中的一条直
线,即b=xk-y,其中x为斜率,-y为截距项。
• 对于在图像空间中位于同一条直线上的两
个点(x1,y1)和(x2,y2)来说,在参数空间中对
应于同一个点(b,k)。
• 通过Hough变换,参数空间中某个点处的值
对应于符合共线标准的像素点数量。
浙江大学控制系
Hough变换
• 通过检测参数空间中值超过一定阈值的点,就
可以检测出图像空间中的直线。
b
y
x
k
• Hough圆变换的原理和直线变换一样,只要将
直线方程替换为圆方程即可
浙江大学控制系
Hough变换
浙江大学控制系
形态学操作
• 形态学操作用于二值图像,用于去除二值化图像中的噪声
点及内部空洞。
• 形态学基本操作为两种:
– 腐蚀
– 膨胀
• 设定图像邻域为s,原图为f,处理后图为g
• 腐蚀操作
– 对于像素
f ij
,若 f ij
 1 ,若其领域都为1,则 g ij  1,否则 g ij  0
• 膨胀操作
– 对于像素 f ij ,若 f ij
否则 g ij  0
 0 ,若其领域至少一个像素为1,则 g ij  1
浙江大学控制系
,
形态学操作
• 通过对腐蚀膨胀的合理组合运用,可以实现去除二值图像
的空洞和孤立点,细化线条等效果。
• 上述图像表示利用5*5邻域对第一幅图像进行膨胀和腐蚀
操作后的结果
浙江大学控制系
基于颜色的区域分割
• 颜色是物体的重要特征,通过检测物体的
特有颜色就能实现物体的检测。
• 比如人脸的皮肤颜色常用于人脸检测
• 基于颜色的区域分割简单的说就是将像素
点的颜色值(RGB,HSB或者其他颜色空间)
与目标颜色值进行比较,若误差在一定阈
值范围内则认为该像素属于该颜色。
• 关键在于如何确定阈值
浙江大学控制系
基于颜色的区域分割
• 这里介绍两种基于颜色的区域分割方法:
– 基于物体颜色直方图的反向投影法
– 基于颜色统计模型的阈值分割方法
• 一般而言,选择HSB颜色空间进行颜色分
割:
– RGB颜色空间中光照对RGB各分量的影响较大
– HSB空间中光照对HS分量的影响较小,能较好
的反映物体的本质颜色。
浙江大学控制系
直方图反向投影法
• 直方图反向投影法根据物体直方图确定图像中
的像素是否在物体上
– 获得物体区域,并转换到HSB颜色空间
– 计算物体区域的直方图
– 将需要检测的图像中的每个像素值用该值在物体区
域直方图中相应的值代替,得到反向投影图
– 对反向投影图进行阈值操作,形态学操作得到分割
后的目标区域
• Color-segement demo.exe
浙江大学控制系
颜色统计模型
• 由于光照的影响,相同颜色在图像中呈现
为不同的值,故颜色分割不能很好的适应
光照变化的情形
• 反向投影法只是以一种光照条件作为分割
依据,也不能适应光照的变化
• 对同一物体在不同光照条件下的颜色分布
进行统计,得到颜色统计模型以进行颜色
分割,则能在一定程度上适合关照的变化
浙江大学控制系
颜色统计模型
• 建立颜色统计模型的步骤
– 获取在不同光照条件下目标物体颜色的HSB
值,即进行采样
– 根据H,S的样本建立统计模型
– 根据统计模型判断待分割图像中的像素点是否
以一定的置信度属于物体代表的颜色
• 简单起见,可以选在高斯分布,并假设H和
S不相关。统计样本中H和S分量的平均值和
方差即可建立颜色分布模型。
浙江大学控制系
颜色分割应用实例
浙江大学控制系
摄像机几何基础
浙江大学控制系
概述
• 摄像机几何研究摄像机成像几何性质。由于摄
像机成像过程为一个投影过程,所以摄像机几
何研究所采用的数学方法为射影几何。
• 摄像机几何的主要研究内容为:
从图像的对应特征点的图像坐标求解摄像机内
外参数,以及如何从图像坐标求解世界坐标。
由于摄像机几何涉及的参数较多,而图像坐标
又存在采样误差,所以参数求解过程中往往用
到大量的优化算法,以优化参数的求解精度。
浙江大学控制系
主要内容
•
•
•
•
摄像机几何中的坐标系介绍
摄像机成像模型
摄像机标定
双目定位
浙江大学控制系
坐标系介绍
• 摄像机几何中涉及三大坐标系
– 世界坐标系
– 摄像机坐标系
– 图像坐标系
• 其中世界坐标系是固定于真实世界中的坐标系,如
以房间的某个角落为坐标原点,以三个墙面为坐标
平面的坐标系。世界坐标系可以表示为 ( O , X , Y , Z )
w
w
w
w
• 摄像机坐标系是以摄像机的主光轴为z轴,以摄像机
成像平面的一边为x轴,以垂直的一边为y轴构成的
坐标系,坐标系随摄像机运动。摄像机坐标系表示
为 (o, x, y , z )
浙江大学控制系
坐标系简介
• 图像坐标系则定义在成像平面上,即平时所看到的图像,
一般以左上角为原点,向左为x正方向,向下为y正方向,
为了与摄像机坐标系区别,分别成为u和v,即 ( o i , u , v )
y
• 三个坐标系如下图所示:
o
成像平面 y
Yw
u
x
Zw
oi
z
o
Ow
Xw
浙江大学控制系
v
x
摄像机成像模型
• 在三个坐标系的基础上,可以建立摄像机的成像模型。
• 常见的成像模型有仿射模型,小孔成像模型等,以小孔成像模
型最为常用。
• 小孔成像模型的推导过程为:
• 设世界坐标系中的某个点 ( X , Y , Z ) ,摄像机坐标系和世界坐标系
之间的变换矩阵为R和t,则该点在摄像机坐标系中的坐标为
x
 
y  R
 
 z 
X

Y

 Z


t


• 以齐次坐标形式可以表示为
• 其中s为尺度因子,>0
x
X
 

y
Y
s    [R,t]
z
Z
 

1
 
1
浙江大学控制系






摄像机成像模型
• 设摄像机焦距为 f ,则从摄像机坐标系投影到成像平面可
以表示为  x  f  x
 i
z

y  f  y
 i
z
• 设像素的长宽分别为  x和  y 则有
 u  xi /  x  u 0

 v  yi /  y  v0
• 设
fx  f / x, fy  f /  y
u 0 , v 0为 图 像 中 心 在 图 像 坐 标 系 中 的 坐 标
,则小孔成像模型可以表示为
X 
u
 
 
Y
 


s v  A[ R , t ]
 
Z 
 1 
 
1
浙江大学控制系
摄像机成像模型
• 其中A为摄像机内参数矩阵
 fx

A 0

 0
0
fy
0
u0 

v0

1 
• 而 [ R , t ] 则称为摄像机外参数矩阵。
• 由于摄像机镜头存在一定程度的畸变,成像不是完
全遵循上述线性模型,需要对畸变进行校正。
• 需要校正的一般为径向畸变,畸变模型可以表示为
u  u  ( u  u 0 )[ k1 ( x  y )  k 2 ( x  y ) ]
2
2
2
2
2
v  v  ( v  v 0 )[ k1 ( x  y )  k 2 ( x  y ) ]
2
2
2
• 其中 u , v 为校正过的图像坐标
浙江大学控制系
2
2
摄像机标定
• 摄像机标定就是求解摄像机的内外参数
• 摄像机标定可以分为传统标定技术和自标
定技术,其中传统标定技术需要借助已知
坐标点进行摄像机参数的求解,而自标定
技术则不需要借助已知坐标点就可以求解
摄像机参数。
• 常用的标定方法为传统的标定方法,而其
中较为常用的方法有两种:
• Zhang的方法和Tsai的方法。
浙江大学控制系
摄像机标定
• Zhang的方法
– Zhang的方法利用一块平面标定板,标定板上的
特征点在板平面的坐标已知。通过获取标定板
在不同位置的图像实现摄像机的标定。
– Tsai的方法则需要已知一个三维标定靶标,其上
的特征点三维坐标已知,通过获取一次图像完
成摄像机的标定。
• 相对来说Zhang的方法由于标定板的制备及
使用较为方便,在实际应用中较为常用。
浙江大学控制系
双目定位
• 利用两台已知内参以及相互位置的摄像机
可以完成目标点的定位。
R,t
浙江大学控制系
双目定位
• 设以左摄像机坐标系为基准坐标系,则左右摄像机成像方
程为
 xl 
 
s y l  Al  I
 
 1 
X

Y
0 
Z

1






 xr 
 
s y r  Ar  R
 
 1 
X

Y
t
Z

1






• 由上面两个方程可以得到4个约束方程,而需要求解的未
知数为3个。
• 联立4个方程并利用最小二乘法可以求解 ( X , Y , Z )
• 最小二乘法求解结果相当于两条投影线的中垂线中点在左
摄像机下的坐标。
浙江大学控制系
双目定位
• 通常应用中,两个摄像机的定位精度较差,
主要是因为两方面的因素:
– 摄像机标定误差
– 目标点在两幅图像中的检测位置误差
• 采用多于两个摄像机,形成三目甚至更多
目的定位系统,以增加在定位计算时的约
束条件,提高定位精度。
浙江大学控制系
OpenCV应用基础
浙江大学控制系
OpenCV应用基础
• What is OpenCV?
• OpenCV是一个非常优秀的开源图像处理算法
库,包含一系列C函数以及少量C++类,实现了
图像处理和计算机视觉方面的很多通用算法。
• Why OpenCV?
• OpenCV提供了从图像采集,预处理到图像分
割,物体检测等视觉处理中常用的算法,利用
OpenCV可以快速搭建视觉系统,同时OpenCV
的算法经过优化,执行效率高。
浙江大学控制系
OpenCV应用基础
• OpenCV主要由六大部分构成
1. CxCore:基本数据结构及其相关的基本运
算,如矩阵数据结构及矩阵运算等。
2. Cv: 图像处理和机器视觉功能,包括图像
处理,结构分析,运动分析,物体跟踪,
模式识别,摄像机标定等内容。
3. CvAux:附加库函数,主要是一些实验性的
函数,如三维跟踪,PCA函数等。
浙江大学控制系
OpenCV应用基础
4. Highgui:用户交互部分(GUI),显示图
像、字符,以及获取用户的输入,如鼠标
点击等
5. ml:新加入的机器学习模块,主要为分类
器,如SVM等。
6. CvCam:图像采集模块。
浙江大学控制系
OpenCV应用基础
• OpenCV的优点:
• 平台无关性,OpenCV独立于操作系统,硬件
与图形管理器,利用OpenCV构建的视觉处理
系统可以方便移植到不同平台。
• 免费,所有代码开源,可以在商业及非商业中
免费使用。
• 速度快,OpenCV的算法经过优化,有较高的
运行效率。
• 良好的扩展性
浙江大学控制系
OpenCV应用基础
• OpenCV资料获取
• OpenCV中文站http://www.opencv.org.cn
• OpenCV英文:
http://opencvlibrary.sourceforge.net
• 源码下载:
http://sourceforge.net/projects/opencvlibrary
• 另外在OpenCV的安装文件夹下面有参考手
册,对OpenCV的各种函数使用有详细说
明。
浙江大学控制系
OpenCV应用基础
•
•
•
•
•
•
主要内容
OpenCV基本数据结构
图像的获取与显示
基本图像处理函数
搭建一个简单的视觉处理程序
基于OpenCV的人脸检测程序设计
浙江大学控制系
基本数据结构
• OpenCV基本的数据结构有
• CvPoint,CvPoint2D32f,CvPoint2D64f:表
示图像中的一个点,坐标分别为整型,单
精度浮点型和双精度浮点型。
举例:定义一个CvPoint数据结构并初始化
CvPoint point = cvPoint(0,0);
point.x = 10; point.y = 10;
浙江大学控制系
基本数据结构
• CvSize,CvSize2D32f:表示矩形框的大小,
整型及单精度浮点型。
• CvRect:矩形框,表示矩形的左上角点坐标
及矩形的长宽。
• 举例:定义一个矩形并初始化
CvRect rect;
rect.x = 0, rect.y = 0;
rect.width = 10,rect.height = 10;
浙江大学控制系
基本数据结构
• CvMat:矩阵数据结构,定义了矩阵的数据
类型,行长度,指向数据的指针等。
• CvMat通过cvCreateMat()函数来创建以及进
行初始化的工作。
• OpenCV为CvMat类型提供了矩阵的加,
减,乘,除,转置,求逆等常见运算,以
及对矩阵元素、行、列进行访问的接口。
• CvMat常用于摄像机的标定,目标定位,三
维重建等摄像机几何相关的方面。
浙江大学控制系
基本数据结构
• IplImage:图像数据结构。包含图像头与图
像数据,其中图像头包含对图像的大小,
通道数,图像数据类型等信息,同时图像
头中包含一个指向图像数据的指针。
• OpenCV中获得的图像均存储为IplImage结构
• OpenCV提供的大部分功能都是针对IplImage
结构的操作,如图像的读取,保存,滤波,
边缘检测,目标检测等等。
浙江大学控制系
OpenCV编程环境配置
• 下载opencv1.0在windows下的安装程序
• 按安装程序默认设置安装好opencv,有时需要
手重启,使环境变量设置生效。
• 在VC环境中设置编程环境
– 工具->选项中配置包含文件路径及库文件路径
• 建立工程
• 包含头文件cv.h, cxcore.h, highgui.h, cvcam.h
• 设置链接中的附加依赖项cv.lib, cxcore.lib,
highgui.lib, cvcam.lib
浙江大学控制系
OpenCV编程环境配置
v
浙江大学控制系
OpenCV编程环境配置
浙江大学控制系
OpenCV编程环境配置
浙江大学控制系
图像的获取与显示
• 图像的来源一般有三种:
– 视频流
– 静态图像
– 摄像机
• OpenCV支持从上述三种图像源中获取图
像。
• 下面给出读取静态图像和摄像机图像的操
作方法。
浙江大学控制系
图像的获取与显示
• 读取静态图像并显示,保存
• 读取函数:cvLoadImage()
• 程序实例:
cvNamedWindow(“image”);
IplImage* pImage;
pImage = cvLoadImage(“image_test.bmp”);
cvShowImage(“image”,pImage);
cvWaitKey(0);
cvReleaseImage(&pImage);
cvDestroyWindow(“image”);
保存图像:cvSaveImage(“d:\\image.jpg”,pImage);
浙江大学控制系
图像的获取与显示
• 读取摄像机图像,详见程序演示
• 程序实例:
CvCapture *capture; IplImage *pImg;
cvNamedWindow(“Image”);
capture = cvCaptureFromCAM(0);
while(true)
{
pImg = cvQueryFrame(capture);
cvShowImage(“image”,pImg);
if(cvWaitKey(30)==27)
{
cvDestroyWindow(“image”);
cvReleaseCapture(&capture); break;
}
}
浙江大学控制系
基本图像处理函数
• OpenCV中包含大量图像处理函数,如图像
滤波,边缘检测,角点检测,Hough变换,
图像颜色空间变换等。
• 这里主要介绍边缘检测与Hough变换。
• 其他的图像处理函数可以参考OpenCV的参
考手册,有很详细的说明。
浙江大学控制系
基本图像处理函数
• 边缘检测
• 图像边缘是图像非常重要的特征,边缘对
应于图像上灰度变化强烈的区域,而边缘
检测也是基于边缘的这个特征。
• 常见的边缘检测算法有差分检测、梯度检
测、Sobel边缘检测、Laplace边缘检测等。
• 以Sobel边缘检测算法为例说明OpenCV中边
缘检测函数的使用。
浙江大学控制系
基本图像处理函数
• 检测函数 cvSobel()
• 已获得的单通道图像为IplImage *pGrey;
调用Solbe边缘检测算子
cvSobel(pGrey,pDst,1,1);
其中pDst是输出图像,为单通道灰度图
• 详见程序演示
浙江大学控制系
基本图像处理函数
• Hough变换
• Hough变换的原理是利用图像空间和参数空
间的对应关系,将图像空间有一定关系的
像素在进行聚类,并以解析形式转化到参
数空间,以获取同类像素的解析参数。
• 常见的Hough变换有Hough直线变换,
Hough圆变换。
• 以Hough直线变换为例说明Hough变换原理
浙江大学控制系
基本图像处理函数
• 设直线方程为y=kx+b,其中k为斜率,b为截
距项。
• 每个点(x,y)对应到参数k-b空间中的一条直
线,即b=xk-y,其中x为斜率,-y为截距项。
• 对于在图像空间中位于同一条直线上的两
个点(x1,y1)和(x2,y2)来说,在参数空间中对
应于同一个点(b,k)。
• 通过Hough变换,参数空间中某个点处的值
对应于符合共线标准的像素点数量。
浙江大学控制系
基本图像处理函数
• 通过检测参数空间中值超过一定阈值的点,就
可以检测出图像空间中的直线。
b
y
x
k
• Hough圆变换的原理和直线变换一样,只要将
直线方程替换为圆方程即可
浙江大学控制系
简单图像处理程序
• 利用上面提到的OpenCV函数来建立一个简
单的图像处理程序。
• 程序设计目的:读取视频图像,检测其中
的圆形物体边缘。
• 程序涉及的OpenCV函数:
图像的读取,显示,二值化,Hough圆检
测,图形绘制等。
• 详见程序示例
浙江大学控制系
基于OpenCV的人脸检测程序设计
• 这里完成一个较为复杂的视觉处理程序
• 程序任务:从摄像机读入图像,检测图像
中的人脸,并在显示的图像上标注出人脸
位置。
• 程序与上一个圆形物体检测程序在框架结
构上基本上一样,只要替换其中对图像进
行处理的部分即可。
浙江大学控制系
基于OpenCV的人脸检测程序设计
• 人脸检测原理
• 采用一种通用的目标检测算法:基于Harr特
征的级联boost分类器。
• 训练及检测过程为:
– 得到大量的人脸样本,并计算样本的Harr特征
– 利用Harr特征进行弱分类器训练
– 将训练得到的若分类器进行boost级联,得到强
分类器。
– 利用得到的分类器进行人脸检测。
浙江大学控制系
基于OpenCV的人脸检测程序设计
• Harr特征弱分类器
弱分类器具有这样的特点,其分类能力较差,有很大的
概率将反样本分为正样本,但将正样本分为反样本的
概率很低。
即弱分类器的误检率可以很高,但漏检率很低。
• 将这样的多个弱分类器进行级联得到boost的强分
类器。
弱分类器
错误
正确
弱分类器
正确
错误
浙江大学控制系
弱分类器
分类
结果
基于OpenCV的人脸检测程序设计
• 程序实例
• 利用OpenCV中已经训练好的人脸检测器进
行人脸检测
• OpenCV提供了训练函数,用于对给定样本
训练特定分类器,如人体检测,物体检测
等。
浙江大学控制系
机器视觉部分应用举例
浙江大学控制系
物体识别
• 基于SIFT特征的物体识别
– 基于SIFT特征的物体描述
– 对光照,尺度,旋转变化鲁棒
– 复杂背景下有效检测
浙江大学控制系
人体检测
• 基于深度相机的人体检测
– 基于Harr特征及adaboost的检测算法
– 对光照变化鲁棒
– 实时高速检测(10ms/frame)
浙江大学控制系
人脸识别
• 基于SIFT特征描述的开集人脸识别
– 基于Harris特征的人脸检测,在人脸区域进行识别
– 基于SIFT特征的人脸特征描述
– 开集人脸识别,给出known和unknow
浙江大学控制系
浙江大学控制系

similar documents