哈尔特徵(Haar-like features) 是用于物体识别的一种数字图像特徵。它们因为与哈尔小波转换 极为相似而得名,是第一种即时的人脸检测运算。
基本介绍
- 中文名:哈尔特徵
- 外文名:Haar-Link Features
- 用途:用于物体识别的图像特徵
- 特点:可以快速的计算
- 套用:很多实时系统
- 学科:数字图像处理
简介
哈尔特徵(Haar-like features) 是用于物体识别的一种数字图像特徵。它们因为与哈尔小波转换极为相似而得名,是第一种即时的人脸检测运算。
历史上,直接使用图像的强度(就是图像每一个像素点的RGB值)使得特徵的计算强度很大。帕帕乔治奥等人提出可以使用基于哈尔小波的特徵而不是图像强度。维奥拉和琼斯进而提出了哈尔特徵。哈尔特徵使用检测视窗中指定位置的相邻矩形,计算每一个矩形的像素和并取其差值。然后用这些差值来对图像的子区域进行分类。
例如,当前有一个人脸图像集合。通过观察可以发现,眼睛的颜色要比两颊的深。因此,用于人脸检测的哈尔特徵是分别放置在眼睛和脸颊的两个相邻矩形。这些矩形的位置则通过类似于人脸图像的外接矩形的检测视窗进行定义。
在维奥拉-琼斯目标检测框架的检测阶段,一个与目标物体同样尺寸的检测视窗将在输入图像上滑动,在图像的每一个子区域都计算一个哈尔特徵。然后这个差值会与一个预先计算好的阈值进行比较,将目标和非目标区分开来。因为这样的一个哈尔特徵是一个弱分类器(它的检测正确率仅仅比随机猜测强一点点),为了达到一个可信的判断,就需要一大群这样的特徵。在维奥拉-琼斯目标检测框架中,就会将这些哈尔特徵组合成一个级联分类器,最终形成一个强分类群。
哈尔特徵最主要的优势是它的计算非常快速。使用一个称为积分图的结构,任意尺寸的哈尔特徵可以在常数时间内进行计算。
哈尔特徵广义地分为三类:边缘特徵、线性特徵和中心特徵
特徵
一个矩形哈尔特徵可以定义为矩形中几个区域的像素和的差值,可以具有任意的位置和尺寸。这种特质也被称为2矩形特徵(2-rectangle feature)。 维奥拉和琼斯也定义了3矩形特徵和4矩形特徵。这个值表明了图像的特定区域的某些特性。每一个特徵可以描述图像上特定特性的存在或不存在,比如边缘或者纹理的变化。例如,一个2-矩形特徵可以表明一个边界位于一个亮区域和一个暗区域之间。
快速计算
维奥拉和琼斯的一个重要贡献是使用积分图。 积分图是一个二维矩形的查找表,与原始图像具有一样的尺寸。积分图的每一个元素是原始图像在对应位置左上角所有像素的和。这就使得在任意位置计算任意尺寸的矩形的像素和时,只需要进行四次查表:


每个哈尔特徵的查找次数取决于它的定义。维奥拉和琼斯的2矩形特徵需要六次查询,3矩形需要八次,而4矩形则需要九次。
倾斜的哈尔特徵
兰哈切和梅迪提出了倾斜的(45°)哈尔特徵。这种对特徵维度的扩充是为了提升对物体的检测。由于这些特徵对一些物体的描述更为适合,这种扩充是有效的。例如,一个倾斜的特徵可以描述一个倾斜45°的边缘。针对这种特徵的计算,也提出了倾斜的积分图。