`
abruzzi
  • 浏览: 445010 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

人脸检测原理及示例(OpenCV+Python)

阅读更多

前言

关于opencv

OpenCV Intel 开源计算机视觉库 (Computer Version) 。它由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。

 

OpenCV 拥有包括 300 多个 C 函数的跨平台的中、高层 API 。它不依赖于其它的外部库 —— 尽管也可以使用某些外部库。 OpenCV 对非商业应用和商业应用都是免费 的。同时 OpenCV 提供了对硬件的访问,可以直接访问摄像头,并且 opencv 还提供了一个简单的 GUI(graphics user interface) 系统 :highgui 我们就通过 OpenCV 提供的一些方法来构造出这个人脸检测 face detection 程序来。

opencv的python包装

 

OpenCV 本身是有 C/C++ 编写的,如果要在其他语言中使用,我们可以通过对其动态链接库文件进行包装即可,幸运的是, Python 下有很多个这样的包装,本文中使用的是 Cvtypes

 

事实上,在 Python 中很多的包都是来自第三方的,比如 PIL(Python Image Library) 即为 C 语言实现的一个图形处理包,被包装到了 Python 中,这些包装可以让你像使用 Python 的内建函数一样的使用这些 API

 

人脸检测原理

人脸检测属于目标检测(object detection) 的一部分,主要涉及两个方面

  1. 先对要检测的目标对象进行概率统计,从而知道待检测对象的一些特征,建立起目标检测模型。
  2. 用得到的模型来匹配输入的图像,如果有匹配则输出匹配的区域,否则什么也不做。

 

计算机视觉

计算机的视觉系统,跟人的眼睛是大不相同的,但是其中也有类似之处。人眼之能够看到物体,是通过物体上反射出来的光线刺激人眼的感光细胞,然后视觉神经在大脑中形成物体的像。计算机通过摄像头看到的东西要简单的多,简单来说,就是一堆由数字组成的矩阵。这些数字表明了物体发出的光的强弱,摄像头的光敏元件将光信号转化成数字信号,将其量化为矩阵。

如何从这些数字中得出:"这是一个人脸"的结论,是一个比较复杂的事情。物理世界是彩色的,一般来说,计算机中的彩色图片都是由若干个色彩通道累积出来的,比如RGB模式的图片,有红色通道(Red),绿色通道(Green)和蓝色通道(Blue),这三个通道都是灰度图,比如一个点由8位来表示,则一个通道可以表示2^8=256个灰度。那样三个通道进行叠加以后可以表3*8=24位种色彩,也就是我们常说的24位真彩。

对这样的图片做处理,无疑是一件很复杂的事,所以有必要先将彩色图转为灰度图,那样可以减少数据量(比如RGB模式,可以减少到原图片的1/3),同时可以去掉一些噪声信号。先将图片转化为灰度图,然后将这个灰度图的对比度增高,这样可以使得图片本来暗的地方更暗,亮的地方更亮一些。这样处理以后,图片就更容易被算法设别出来了。

Harr特征级联表

OpenCV在物体检测上使用的是haar特征的级联表,这个级联表中包含的是boost的分类器。首先,人们采用样本的haar特征进行分类器的训练,从而得到一个级联的boost分类器。训练的方式包含两方面:

1.    正例样本,即待检测目标样本
2.    反例样本,其他任意的图片

首先将这些图片统一成相同的尺寸,这个过程被称为归一化,然后进行统计。一旦分类器建立完成,就可以用来检测输入图片中的感兴趣区域的检测了,一般来说,输入的图片会大于样本,那样,需要移动搜索窗口,为了检索出不同大小的目标,分类器可以按比例的改变自己的尺寸,这样可能要对输入图片进行多次的扫描。

什么是级联的分类器呢?级联分类器是由若干个简单分类器级联成的一个大的分类器,被检测的窗口依次通过每一个分类器,可以通过所有分类器的窗口即可判定为目标区域。同时,为了考虑效率问题,可以将最严格的分类器放在整个级联分类器的最顶端,那样可以减少匹配次数。

基础分类器以haar特征为输入,以0/1为输出,0表示未匹配,1表示匹配。

Haar特征

 

  •  边界特征,包含四种
  •  线性特征,包含8种
  •  中心围绕特征,包含两种


在扫描待检测图片的时候,以边界特征中的(a)为例,正如前面提到的那样,计算机中的图片是一个数字组成的矩阵,程序先计算整个窗口中的灰度值x,然后计算矩形框中的黑色灰度值y,然后计算(x-2y)的值,得到的数值与x做比较,如果这个比值在某一个范围内,则表示待检测图片的当前扫描区域符合边界特征(a),然后继续扫描。

关于这个算法的更详细描述已经超出了本文的范围,可以在参考资源中获得更多的信息。

 

非固定大小目标检测

因为是基于视频流的目标检测,我们事先不太可能知道要检测的目标的大小,这就要求我们的级联表中的分类器具有按比例增大(或者缩小)的能力,这样,当小的窗口移动完整个待检测图片没有发现目标时,我们可以调整分类器的大小,然后继续检测,直到检测到目标或者窗口与待检测图片的大小相当为止。

 

 

步骤一:图片预处理

在从摄像头中获得一个帧(一张图片)后,我们需要先对这张图片进行一些预处理:

  1. 将图片从RGB模式转为灰度图将灰度图
  2. 进行灰度图直方图均衡化操作


这两个步骤在OpenCV中是非常简单的:

image_size = cv.cvGetSize(image)#获取原始图像尺寸

grayscale = cv.cvCreateImage(image_size, 8, 1)# 建立一个空的灰度图
cv.cvCvtColor(image, grayscale, cv.CV_BGR2GRAY)#转换

storage = cv.cvCreateMemStorage(0)#新建一块存储区,以备后用
cv.cvClearMemStorage(storage)

cv.cvEqualizeHist(grayscale, grayscale)# 灰度图直方图均衡化

 

步骤二:检测并标记目标

OpenCV中,对于人脸检测的模型已经建立为一个XML文件,其中包含了上面提到的harr特征的分类器的训练结果,我们可以通过加载这个文件而省略掉自己建立级联表的过程。有了级联表,我们只需要将待检测图片和级联表一同传递给OpenCV的目标检测算法即可得到一个检测到的人脸的集合。

    # detect objects
    cascade = cv.cvLoadHaarClassifierCascade('haarcascade_frontalface_alt.xml',
                                                cv.cvSize(1,1))
    faces = cv.cvHaarDetectObjects(grayscale, cascade, storage, 1.2, 2,
                                    cv.CV_HAAR_DO_CANNY_PRUNING,
                                    cv.cvSize(50, 50))#设置最小的人脸为50*50像素

    if faces:
        print 'face detected here', cv.cvGetSize(grayscale)
        for i in faces:
            cv.cvRectangle(image, cv.cvPoint( int(i.x), int(i.y)),
                         cv.cvPoint(int(i.x + i.width), int(i.y + i.height)),
                         cv.CV_RGB(0, 255, 0), 1, 8, 0)#画一个绿色的矩形框

 

步骤三:用highgui画出视频窗口

    highgui.cvNamedWindow ('camera', highgui.CV_WINDOW_AUTOSIZE)
    highgui.cvMoveWindow ('camera', 50, 50)

    highgui.cvShowImage('camera', detimg)
 


可以看到,OpenCV的API相当清晰,使用Python的包装,可以使得代码非常小。好了,我们可以看看程序的运行结果:

 



 
 
由于视频流是动态的,所以我们可以在程序的入口中使用一个无限循环,在循环中,每次从视频中读入一个帧,将这个帧传输给人脸检测模块,检测模块在这个帧上进行标记(如果有人脸的话),然后返回这个帧,主程序拿到这个帧后,更新显示窗口。

 

opencv的其他特性

拉普拉斯边缘检测

 

def laplaceTransform(image):
    laplace = None
    colorlaplace = None
    planes = [None, None, None]

    image_size = cv.cvGetSize(image)
    if not laplace:
        for i in range(len(planes)):
            planes[i] = cv.cvCreateImage(image_size, 8, 1)
        laplace = cv.cvCreateImage(image_size, cv.IPL_DEPTH_16S, 1)
        colorlaplace = cv.cvCreateImage(image_size, 8, 3)

    cv.cvSplit(image, planes[0], planes[1], planes[2], None)

    for plane in planes:
        cv.cvLaplace(plane, laplace, 3)
        cv.cvConvertScaleAbs(laplace, plane, 1, 0)

    cv.cvMerge(planes[0], planes[1], planes[2], None, colorlaplace)
    colorlaplace.origin = image.origin

    return colorlaplace
 


效果图:
 
CVtypes中自带了一个关于图像色彩空间的直方图的例子:


 

结束语

OpenCV的功能十分强大,而且提供了大量的算法实现,文中涉及到的内容只是计算机视觉中很小的一部分。读者可以考虑将采集到的人脸进行标识,从而实现特定人的人脸识别。或者考虑将人脸检测移植到网络上,从而实现远程监控。试想一下,原来没有生命的机器,我们可以通过自己的思想,动作来使得它们看起来像是有思想一样,这件事本身就非常的有趣。

 

 

  • 大小: 2.9 KB
  • 大小: 299.3 KB
  • 大小: 495.8 KB
  • 大小: 109.7 KB
分享到:
评论
31 楼 mdjhny 2010-07-21  
嗯,这方面的资料真的奇缺,特别是中文的,楼主让本小白开眼了
30 楼 abruzzi 2009-09-28  
Durian 写道
yangsp1 写道
虽然发与代码无关的东西,是毫无意义的事。。。。

但是我还是想说一句:楼主很帅。。。。

-----
我也一直忍者想说,,,,  


呵呵,这两个帅哥真是,不要取笑我了。
29 楼 Durian 2009-09-28  
yangsp1 写道
虽然发与代码无关的东西,是毫无意义的事。。。。

但是我还是想说一句:楼主很帅。。。。

-----
我也一直忍者想说,,,,  
28 楼 kevin24067 2009-09-21  
这东西有意思
27 楼 lydawen 2009-09-17  
不错,楼上提供的信息很重要,看来又有得玩了
26 楼 jim19770812 2009-09-16  
java下有对opencv的封装,叫做 openjcv,google一下可以找到的
25 楼 whaosoft 2009-09-16  
很神奇的东西,学习一下
24 楼 下一站,火星 2009-09-11  
erikchang 写道
OpenCV做的人脸识别是很简易的,人模型\雕塑\侧面或者模糊等情况都是不可以的,这个代码值得研究,不实用的!

你想说啥?不实用还值得研究?

我个人的看法是,还是老老实实的调用c去这个事情吧
23 楼 erikchang 2009-09-11  
OpenCV做的人脸识别是很简易的,人模型\雕塑\侧面或者模糊等情况都是不可以的,这个代码值得研究,不实用的!
22 楼 BaSaRa 2009-09-11  
谢谢LZ,最近在玩PYTHON,也玩玩这个
21 楼 avi2 2009-09-08  
storm0912 写道
对于java,可以用JNI来直接调用这么些C库吗?

恩,完全可以的,不过自己要封装写接口,另外要特别小心OpenCV中的全局变量和静态变量
20 楼 下一站,火星 2009-09-08  
http://pypi.python.org/pypi/CVtypes/0.1
CVtypes还不是很成熟啊

引用
Development Status :: 3 - Alpha
19 楼 abruzzi 2009-09-08  
iaimstar 写道
没有用过 google的网络相册的人脸识别是干吗的 找朋友?

google的网络相册跟你的google账户绑定,比如你有个关于你自己的同事的相册,其中有300张照片,你想找其中有张三的,只需要搜张三,Google的系统可以帮你从预先识别出来的人脸中找到相关的图片。
18 楼 msg2jiang 2009-09-08  
这东西找女朋友用的,例如我要找章子怡类型的,让交友网站给我搜去。
17 楼 iaimstar 2009-09-08  
没有用过 google的网络相册的人脸识别是干吗的 找朋友?
16 楼 abruzzi 2009-09-08  
google的网络相册中的人脸设别功能我觉得已经非常好了,识别出来后再进行索引,方便使用。而且准确率相当高,我记得上传过一次毕业聚会的照片,有个帅哥已经被酒杯挡住了半张脸,而且拍照的人手也抖动了下,结果竟然还能被识别出来,哈哈。
15 楼 iaimstar 2009-09-08  
ls的网站确实很牛,但是我把头像提交发现没有识别出来
14 楼 achuanle 2009-09-08  
一个外国人开发的web人脸识别技术,不知道他们是怎么弄的。谁能讲讲。我把从网上下的成龙、刘德华的照片传上去都识别出来了
http://www.myheritage.cn/%E4%BA%BA%E8%84%B8%E8%BE%A8%E8%AF%86
13 楼 iaimstar 2009-09-08  
老早有个微软亚洲研究院出的小软件
用来把照片生成卡通形象,每次看见那个玩意我都万念俱灰
12 楼 abruzzi 2009-09-08  
下一站,火星 写道

这个东西不知道用在图片智能匹配上效果怎么样,比如我有1000张照片,然后可以根据一个样本图片进行模糊查询

文中的例子是关于人脸检测的,在检测的基础上可以考虑开发人脸识别(特定人脸和基于图片的模糊查询),这种肯定是可以实现的,因为人脸设别是可以实现的,只需要在判断的时候,阀值取成一个范围,应该就可以完成了。

有时间的话研究研究人脸识别,感觉这个比检测要难一些。

相关推荐

Global site tag (gtag.js) - Google Analytics