人类平常是使用面部特征来识别一个人,在过去的几十年中,计算能力的提高现在可以自动实现类似的识别。早期的面部识别算法使用简单的几何模型,但是识别过程现已成熟为一门复杂的数学表示和匹配过程的科学。在过去的10到15年中,重大的进步和举措使人脸识别技术成为人们关注的焦点。


自动面部识别是一个相对较新的概念。1960年代开发的第一个用于面部识别的半自动系统,要求管理员在计算照片到公共参考点的距离和比率之前,先在照片上定位特征(例如眼睛,耳朵,鼻子和嘴巴),然后与参考数据相比。在1970年代,使用特定的主观标记(例如头发的颜色和嘴唇的厚度)来自动识别。


人脸识别技术是如何实现的


这两个早期解决方案的问题在于测量和位置是手动计算的。1988年,开发了一种新的应用主成分分析以及标准的线性代数技术来解决人脸识别问题。这被认为是一个里程碑,因为它表明准确编码适当对齐和标准化的面部图像所需的值小于100。


1991年,科学家发现,在使用特征脸技术的同时,残余误差可用于检测图像中的脸部-这一发现使可靠的实时自动脸部识别系统成为可能。尽管该方法在一定程度上受到环境因素的限制,但它对进一步发展自动面部识别技术产生了极大的兴趣。该技术首先从媒体对2001年1月的超级碗试验实施的反应中引起公众的注意,该超级碗捕获了监视图像并将其与数字面部照片数据库进行比较。


人脸识别技术是如何实现的


解决面部识别问题的主要方法有两种:几何(基于特征)和光度(基于视图)。随着研究人员对人脸识别的兴趣不断发展,开发了许多不同的算法,其中三种已在人脸识别文献中得到了很好的研究:主成分分析(PCA),线性判别分析(LOA)和弹性束图匹配(EBGM)。


PCA通常被称为特征脸的使用,是1988年首创的技术。使用PCA,探测图像和画廊图像必须具有相同的大小,并且必须首先进行标准化以使图像中对象的眼睛和嘴巴对齐。然后,通过数据压缩基础知识,将PCA方法用于减小数据的尺寸,并揭示出面部图案的最有效的低尺寸结构。尺寸的减小消除了无用的信息,并精确地将人脸结构分解为称为本征人脸的正交(不相关)分量。每个面部图像可以被表示为特征面部的加权和(特征向量),其被存储在1D阵列中。通过测量探针图像各自的特征向量之间的距离,可以将探针图像与图库图像进行比较。PCA方法通常要求每次都显示完整的正面。否则,图像会导致性能下降。该技术的主要优点在于,它可以将识别个人所需的数据减少到所显示数据的十分之一。


线性判别分析(LDA)是一种统计方法,用于根据已知类别的训练样本对未知类别的样本进行分类。该技术旨在最大化类间(即,跨用户)方差并最小化类内(即,用户内)方差。在处理高维人脸数据时,该技术面临的问题是样本空间较小,而样本空间的维数相对较少,而训练样本较少。


弹性束图匹配(EBGM)依赖于这样的概念,即真实面部图像具有许多非线性特性,而这些特性是前面讨论的线性分析方法所无法解决的,例如照明(室外照明与室内荧光灯)的变化,姿势(直立或倾斜)和表情(微笑与皱眉)。Gabor小波变换创建了一个动态链接架构,该架构将人脸投射到弹性网格上。Gabor射流是弹性网格上的一个节点,在下图中的圆圈表示,该节点描述了给定像素周围的图像行为。这是使用Gabor滤镜对图像进行卷积的结果,该滤镜用于检测形状并使用图像处理来提取特征。[卷积表示功能的重叠量,将功能混合在一起。识别是基于每个Gabor节点处Gabor滤波器响应的相似性。使用Gabor滤镜的这种基于生物学的方法是在高等哺乳动物的视觉皮层中执行的过程。这种方法的困难是需要精确地标定位,有时可以通过结合PCA和LDA方法来实现。


免责声明

我来说几句

不吐不快,我来说两句
最新评论

还没有人评论哦,抢沙发吧~