人脸检测原理及示例(OpenCV+Python)

abruzzi

浏览: 445010 次
性别:
来自: 西安

最近访客更多访客>>

wyx065747

zw1127

ymgjava

coolsteen

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

计算机科学与技术

Python Netbeans 网络应用 Google 算法

前言

关于opencv

OpenCV 是 Intel 开源计算机视觉库 (Computer Version) 。它由一系列 C 函数和少量 C++ 类构成，实现了图像处理和计算机视觉方面的很多通用算法。

OpenCV 拥有包括 300 多个 C 函数的跨平台的中、高层 API 。它不依赖于其它的外部库 —— 尽管也可以使用某些外部库。 OpenCV 对非商业应用和商业应用都是免费的。同时 OpenCV 提供了对硬件的访问，可以直接访问摄像头，并且 opencv 还提供了一个简单的 GUI(graphics user interface) 系统 :highgui 。我们就通过 OpenCV 提供的一些方法来构造出这个人脸检测（ face detection ）程序来。

opencv的python包装

OpenCV 本身是有 C/C++ 编写的，如果要在其他语言中使用，我们可以通过对其动态链接库文件进行包装即可，幸运的是， Python 下有很多个这样的包装，本文中使用的是 Cvtypes 。

事实上，在 Python 中很多的包都是来自第三方的，比如 PIL(Python Image Library) 即为 C 语言实现的一个图形处理包，被包装到了 Python 中，这些包装可以让你像使用 Python 的内建函数一样的使用这些 API 。

人脸检测原理

人脸检测属于目标检测(object detection) 的一部分，主要涉及两个方面

先对要检测的目标对象进行概率统计，从而知道待检测对象的一些特征，建立起目标检测模型。
用得到的模型来匹配输入的图像，如果有匹配则输出匹配的区域，否则什么也不做。

计算机视觉

计算机的视觉系统，跟人的眼睛是大不相同的，但是其中也有类似之处。人眼之能够看到物体，是通过物体上反射出来的光线刺激人眼的感光细胞，然后视觉神经在大脑中形成物体的像。计算机通过摄像头看到的东西要简单的多，简单来说，就是一堆由数字组成的矩阵。这些数字表明了物体发出的光的强弱，摄像头的光敏元件将光信号转化成数字信号，将其量化为矩阵。

如何从这些数字中得出:"这是一个人脸"的结论，是一个比较复杂的事情。物理世界是彩色的，一般来说，计算机中的彩色图片都是由若干个色彩通道累积出来的，比如RGB模式的图片，有红色通道(Red)，绿色通道(Green)和蓝色通道(Blue),这三个通道都是灰度图，比如一个点由8位来表示，则一个通道可以表示2^8=256个灰度。那样三个通道进行叠加以后可以表3*8=24位种色彩，也就是我们常说的24位真彩。

对这样的图片做处理，无疑是一件很复杂的事，所以有必要先将彩色图转为灰度图，那样可以减少数据量(比如RGB模式，可以减少到原图片的1/3)，同时可以去掉一些噪声信号。先将图片转化为灰度图，然后将这个灰度图的对比度增高，这样可以使得图片本来暗的地方更暗，亮的地方更亮一些。这样处理以后，图片就更容易被算法设别出来了。

Harr特征级联表

OpenCV在物体检测上使用的是haar特征的级联表，这个级联表中包含的是boost的分类器。首先，人们采用样本的haar特征进行分类器的训练，从而得到一个级联的boost分类器。训练的方式包含两方面：

1. 正例样本，即待检测目标样本
2. 反例样本，其他任意的图片

首先将这些图片统一成相同的尺寸，这个过程被称为归一化，然后进行统计。一旦分类器建立完成，就可以用来检测输入图片中的感兴趣区域的检测了，一般来说，输入的图片会大于样本，那样，需要移动搜索窗口，为了检索出不同大小的目标，分类器可以按比例的改变自己的尺寸，这样可能要对输入图片进行多次的扫描。

什么是级联的分类器呢？级联分类器是由若干个简单分类器级联成的一个大的分类器，被检测的窗口依次通过每一个分类器，可以通过所有分类器的窗口即可判定为目标区域。同时，为了考虑效率问题，可以将最严格的分类器放在整个级联分类器的最顶端，那样可以减少匹配次数。

基础分类器以haar特征为输入，以0/1为输出，0表示未匹配，1表示匹配。

Haar特征

边界特征，包含四种
线性特征，包含8种
中心围绕特征，包含两种

在扫描待检测图片的时候，以边界特征中的(a)为例，正如前面提到的那样，计算机中的图片是一个数字组成的矩阵，程序先计算整个窗口中的灰度值x，然后计算矩形框中的黑色灰度值y，然后计算(x-2y)的值，得到的数值与x做比较，如果这个比值在某一个范围内，则表示待检测图片的当前扫描区域符合边界特征(a)，然后继续扫描。

关于这个算法的更详细描述已经超出了本文的范围，可以在参考资源中获得更多的信息。

非固定大小目标检测

因为是基于视频流的目标检测，我们事先不太可能知道要检测的目标的大小，这就要求我们的级联表中的分类器具有按比例增大(或者缩小)的能力，这样，当小的窗口移动完整个待检测图片没有发现目标时，我们可以调整分类器的大小，然后继续检测，直到检测到目标或者窗口与待检测图片的大小相当为止。

步骤一：图片预处理

在从摄像头中获得一个帧(一张图片)后，我们需要先对这张图片进行一些预处理：

将图片从RGB模式转为灰度图将灰度图
进行灰度图直方图均衡化操作

这两个步骤在OpenCV中是非常简单的：

image_size = cv.cvGetSize(image)#获取原始图像尺寸

grayscale = cv.cvCreateImage(image_size, 8, 1)# 建立一个空的灰度图
cv.cvCvtColor(image, grayscale, cv.CV_BGR2GRAY)#转换

storage = cv.cvCreateMemStorage(0)#新建一块存储区，以备后用
cv.cvClearMemStorage(storage)

cv.cvEqualizeHist(grayscale, grayscale)# 灰度图直方图均衡化

步骤二：检测并标记目标

OpenCV中，对于人脸检测的模型已经建立为一个XML文件，其中包含了上面提到的harr特征的分类器的训练结果，我们可以通过加载这个文件而省略掉自己建立级联表的过程。有了级联表，我们只需要将待检测图片和级联表一同传递给OpenCV的目标检测算法即可得到一个检测到的人脸的集合。

    # detect objects
    cascade = cv.cvLoadHaarClassifierCascade('haarcascade_frontalface_alt.xml',
                                                cv.cvSize(1,1))
    faces = cv.cvHaarDetectObjects(grayscale, cascade, storage, 1.2, 2,
                                    cv.CV_HAAR_DO_CANNY_PRUNING,
                                    cv.cvSize(50, 50))#设置最小的人脸为50*50像素

    if faces:
        print 'face detected here', cv.cvGetSize(grayscale)
        for i in faces:
            cv.cvRectangle(image, cv.cvPoint( int(i.x), int(i.y)),
                         cv.cvPoint(int(i.x + i.width), int(i.y + i.height)),
                         cv.CV_RGB(0, 255, 0), 1, 8, 0)#画一个绿色的矩形框

步骤三：用highgui画出视频窗口

    highgui.cvNamedWindow ('camera', highgui.CV_WINDOW_AUTOSIZE)
    highgui.cvMoveWindow ('camera', 50, 50)

    highgui.cvShowImage('camera', detimg)

可以看到，OpenCV的API相当清晰，使用Python的包装，可以使得代码非常小。好了，我们可以看看程序的运行结果：

由于视频流是动态的，所以我们可以在程序的入口中使用一个无限循环，在循环中，每次从视频中读入一个帧，将这个帧传输给人脸检测模块，检测模块在这个帧上进行标记(如果有人脸的话)，然后返回这个帧，主程序拿到这个帧后，更新显示窗口。

opencv的其他特性

拉普拉斯边缘检测

def laplaceTransform(image):
    laplace = None
    colorlaplace = None
    planes = [None, None, None]

    image_size = cv.cvGetSize(image)
    if not laplace:
        for i in range(len(planes)):
            planes[i] = cv.cvCreateImage(image_size, 8, 1)
        laplace = cv.cvCreateImage(image_size, cv.IPL_DEPTH_16S, 1)
        colorlaplace = cv.cvCreateImage(image_size, 8, 3)

    cv.cvSplit(image, planes[0], planes[1], planes[2], None)

    for plane in planes:
        cv.cvLaplace(plane, laplace, 3)
        cv.cvConvertScaleAbs(laplace, plane, 1, 0)

    cv.cvMerge(planes[0], planes[1], planes[2], None, colorlaplace)
    colorlaplace.origin = image.origin

    return colorlaplace

效果图：

CVtypes中自带了一个关于图像色彩空间的直方图的例子：

结束语

OpenCV的功能十分强大，而且提供了大量的算法实现，文中涉及到的内容只是计算机视觉中很小的一部分。读者可以考虑将采集到的人脸进行标识，从而实现特定人的人脸识别。或者考虑将人脸检测移植到网络上，从而实现远程监控。试想一下，原来没有生命的机器，我们可以通过自己的思想，动作来使得它们看起来像是有思想一样，这件事本身就非常的有趣。

查看图片附件

分享到：

一个Swing的小应用(Todo-List) | Lisp之根源

2009-09-06 19:22
浏览 40526
评论(31)
论坛回复 / 浏览 (30 / 84360)
查看更多

31 楼 mdjhny 2010-07-21

嗯，这方面的资料真的奇缺，特别是中文的，楼主让本小白开眼了

30 楼 abruzzi 2009-09-28

Durian 写道

yangsp1 写道

虽然发与代码无关的东西，是毫无意义的事。。。。

但是我还是想说一句：楼主很帅。。。。

-----
我也一直忍者想说，，，，

呵呵，这两个帅哥真是，不要取笑我了。

29 楼 Durian 2009-09-28

yangsp1 写道

虽然发与代码无关的东西，是毫无意义的事。。。。

但是我还是想说一句：楼主很帅。。。。

-----
我也一直忍者想说，，，，

28 楼 kevin24067 2009-09-21

这东西有意思

27 楼 lydawen 2009-09-17

不错，楼上提供的信息很重要，看来又有得玩了

26 楼 jim19770812 2009-09-16

java下有对opencv的封装，叫做 openjcv，google一下可以找到的

25 楼 whaosoft 2009-09-16

很神奇的东西，学习一下

24 楼下一站，火星 2009-09-11

erikchang 写道

OpenCV做的人脸识别是很简易的,人模型\雕塑\侧面或者模糊等情况都是不可以的,这个代码值得研究,不实用的!

你想说啥？不实用还值得研究？

我个人的看法是，还是老老实实的调用c去这个事情吧

23 楼 erikchang 2009-09-11

OpenCV做的人脸识别是很简易的,人模型\雕塑\侧面或者模糊等情况都是不可以的,这个代码值得研究,不实用的!

22 楼 BaSaRa 2009-09-11

谢谢LZ，最近在玩PYTHON，也玩玩这个

21 楼 avi2 2009-09-08

storm0912 写道

对于java,可以用JNI来直接调用这么些C库吗？

恩，完全可以的，不过自己要封装写接口，另外要特别小心OpenCV中的全局变量和静态变量

20 楼下一站，火星 2009-09-08

http://pypi.python.org/pypi/CVtypes/0.1
CVtypes还不是很成熟啊

引用

Development Status :: 3 - Alpha

19 楼 abruzzi 2009-09-08

iaimstar 写道

没有用过 google的网络相册的人脸识别是干吗的找朋友？

google的网络相册跟你的google账户绑定，比如你有个关于你自己的同事的相册，其中有300张照片，你想找其中有张三的，只需要搜张三，Google的系统可以帮你从预先识别出来的人脸中找到相关的图片。

18 楼 msg2jiang 2009-09-08

这东西找女朋友用的，例如我要找章子怡类型的，让交友网站给我搜去。

17 楼 iaimstar 2009-09-08

没有用过 google的网络相册的人脸识别是干吗的找朋友？

16 楼 abruzzi 2009-09-08

google的网络相册中的人脸设别功能我觉得已经非常好了，识别出来后再进行索引，方便使用。而且准确率相当高，我记得上传过一次毕业聚会的照片，有个帅哥已经被酒杯挡住了半张脸，而且拍照的人手也抖动了下，结果竟然还能被识别出来，哈哈。

15 楼 iaimstar 2009-09-08

ls的网站确实很牛，但是我把头像提交发现没有识别出来

14 楼 achuanle 2009-09-08

一个外国人开发的web人脸识别技术，不知道他们是怎么弄的。谁能讲讲。我把从网上下的成龙、刘德华的照片传上去都识别出来了
http://www.myheritage.cn/%E4%BA%BA%E8%84%B8%E8%BE%A8%E8%AF%86

13 楼 iaimstar 2009-09-08

老早有个微软亚洲研究院出的小软件
用来把照片生成卡通形象，每次看见那个玩意我都万念俱灰

12 楼 abruzzi 2009-09-08

下一站，火星写道

这个东西不知道用在图片智能匹配上效果怎么样，比如我有1000张照片，然后可以根据一个样本图片进行模糊查询

文中的例子是关于人脸检测的，在检测的基础上可以考虑开发人脸识别(特定人脸和基于图片的模糊查询)，这种肯定是可以实现的，因为人脸设别是可以实现的，只需要在判断的时候，阀值取成一个范围，应该就可以完成了。

有时间的话研究研究人脸识别，感觉这个比检测要难一些。

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

人脸检测原理及示例(OpenCV+Python)

前言

关于opencv

opencv的python包装

人脸检测原理

计算机视觉

Harr特征级联表

Haar特征

非固定大小目标检测

步骤一：图片预处理

步骤二：检测并标记目标

步骤三：用highgui画出视频窗口

opencv的其他特性

拉普拉斯边缘检测

结束语

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

人脸检测原理及示例(OpenCV+Python)

前言

关于opencv

opencv的python包装

人脸检测原理

计算机视觉

Harr特征级联表

Haar特征

非固定大小目标检测

步骤一：图片预处理

步骤二：检测并标记目标

步骤三：用highgui画出视频窗口

opencv的其他特性

拉普拉斯边缘检测

结束语

评论

发表评论

相关推荐

JavaScript内核系列 第15章 服务器端的JavaScript

使用vim开发python及graphviz绘图

Java脚本技术应用实例

可编程计算器(phoc)的设计与实现

函数式编程(javascirpt)

C和指针

C和指针(续)

有限自动机与建模

事件和监听器

基于总线的消息服务(BBMS)的设计与实现

JavaScript内核系列 第9章 函数式的Javascript

JavaScript内核系列 第8章 面向对象的JavaScript(下)

JavaScript内核系列 第8章 面向对象的JavaScript(上)

JavaScript内核系列 第7章 闭包

JavaScript内核系列 第6章 正则表达式

JavaScript内核系列 第5章 数组

Swing小应用(Todo-List)之三

JavaScript内核系列 第4章 函数

JavaScript内核系列 第3章 对象与JSON

JavaScript内核系列 第2章 基本概念

最近访客更多访客>>

JavaScript内核系列第15章服务器端的JavaScript

JavaScript内核系列第9章函数式的Javascript

JavaScript内核系列第8章面向对象的JavaScript(下)

JavaScript内核系列第8章面向对象的JavaScript(上)

JavaScript内核系列第7章闭包

JavaScript内核系列第6章正则表达式

JavaScript内核系列第5章数组

JavaScript内核系列第4章函数

JavaScript内核系列第3章对象与JSON

JavaScript内核系列第2章基本概念