苗启广:猴脸识别如何分辨真假 “美猴王”?

技术讨论 Admin ⋅ 于 1周前 ⋅ 29 阅读

来源:九州连线@微信公众号 (ID : link_IT)


导读
听过人脸识别,但是你听过猴脸识别么?研究猴脸识别能干吗?难不成分辨真假美猴王?我们知道猴子和人类都属于灵长类动物,那可否用人脸识别的方法去识别猴子?然而,猴子生长在野外,且天生好动,又该如何获取猴子的影像呢?黄河连线带着这些疑问,特此专访了西安电子科技大学苗启广教授,苗启广教授是计算机视觉方面的专家,在猴脸识别领域有着深入的研究和实践基础。以下为专访实录:

file

1.黄河连线:非常感谢苗教授能接受黄河连线的专访,提到人脸识别大家可能还会比较熟悉,那提到猴脸识别让人感觉会很兴奋,但是感觉离我们的现实应用比较远,当时为什么会有这样的想法呢?
苗启广:金丝猴是国家一级保护动物,对其进行保护的重要性是不言而喻的。对金丝猴进行保护,就要了解它的个体和群体的习性,活动规律,生存状态以及社会群体的组织结构等。那么在此过程中,首要的任务就是个体识别。只有认识了每一个个体,才能进一步研究群体规模,社会结构等。

陕西有一个金丝猴保护区,首先,对动物饲养员来说,金丝猴具体有多少只,只能知道大概,那对金丝猴的保护是一个难题。其次,很多学校经常做金丝猴的动物实验,相关专业的学生需要到山上观察金丝猴的行为,往往蹲点观察1—2个月才能把金丝猴分别开来,然后进行正式工作,这样就很浪费时间。

对于金丝猴的个体识别,传统的方法就是采用人工标记或者是“照片相面”。人工标记方法指的是在金丝猴身体的某个部分打上标签,这种方法存在较大的局限性,随着金丝猴的成长会对金丝猴的身体造成一定的伤害,这也就违背了我们保护金丝猴的初衷。而“照片相面”方法其实就是人工记忆,这种方法很大程度上受限于个人经验,并且当群体规模较大时,人工记忆难度较大,极易产生相互混淆的情况,此外,人脑还存在遗忘的问题。为解决这些问题,又鉴于目前机器学习方法,特别是近年来深度学习方法在人脸识别方面取得辉煌成果,希望能够利用计算机视觉技术实现金丝猴的个体识别。这些工作,都是我和我的已经毕业的博士生许鹏飞博士共同做出的研究成果。

file

就目前的研究进展,利用金丝猴的面部特征进行个体识别是完全可行的。猴脸识别是通过拍照或者录像的方式获取图片数据,然后由计算机执行相应算法实现个体识别。这种方法不会对金丝猴产生任何伤害,也不会影响他们的活动规律,完全是一种非接触式的监测方式。

此外,拍照或录像可以长时间持续(这里指的是每天,每月,每年等等)进行,这样就可以持续记录每只金丝猴的“相貌”,并且计算机不存在人脑遗忘的情况。我们做的种种努力都是为了能够利用计算机视觉技术实现复杂情况下对金丝猴进行个体识别,这些研究成果将为后期对金丝猴个体的行为监控、群体生存状态检测和活动规律的研究奠定基础,进而为金丝猴保护政策和措施的制定提供更可靠的依据。

2.黄河连线:这需要解决哪些难点?
苗启广:猴脸识别需要解决的第一个难题就是建立猴脸数据库。与人脸识别一样,猴脸识别也需要首先建立一个猴脸数据库。但相对于人脸数据库,猴脸图像的获取存在更大难度。主要原因在于,我们无法让动物按照我们的意愿来接受我们对其进行拍摄,更多情况下是我们主动寻找机会去捕获他们的面部图像。

file

此外,金丝猴获得的场景较为复杂,特别是野生金丝猴,拍摄时会受到多种因素的影响。例如:

■ 野外环境的复杂性和不可控制性。金丝猴生活在野外环境,不同季节的野外环境存在巨大差异。并且,全球金丝猴分布区域广泛,不同国家、不同区域的金丝猴所栖息的野外环境也存在较大差异。

■ 布置在野外的红外相机或者可见光相机的位置和角度都是固定的,在面临各种环境光照的考验时,可能出现侧光、背光和高光等现象,同时还会出现各个时段光照不同的现象。

过去差不多一年的时间我们都在摸索如何能够快速有效地拍摄到金丝猴面部图像数据的方法。为了能够拍摄到有效的猴脸图像,我们经过多次拍摄实践,制定了相应的拍摄策略和方法,同时对拍摄设备和相关参数也进行了相关设置。目前我们已经捕获有220多只金丝猴的面部图像共计有30000余幅。

由于金丝猴面部特征的相似性和易变性,相同年龄阶段的不同金丝猴个体在其头部形状、面部结构、器官外形、头部毛发的颜色和纹理等方面都非常相似。这也就对识别算法的性能提高了更高的要求。此外,与人类相似,金丝猴也可以通过面部的变化产生多种表情,这些表情导致了其面部形状特征和纹理特征的不稳定。如果在野外环境下,金丝猴面部可能受到树枝、树叶等事物的遮挡,或者其面部粘有污泥等,这都会导致金丝猴面部特征的发生变化。由面部表情变化以及其他环境因素的变化所引入的非线性因素是金丝猴面部特征识别过程中需要解决的一个难题。

3.黄河连线:我们可以经常听到人脸识别,而且猴子和人类都属于灵长类动物,那么猴脸识别的原理与人脸识别类似么?是什么原理?
file

苗启广:金丝猴的面部特征和人脸的面部特征存在一定的相似之处,但同时也存在较大的差异,主要表现在面部结构和面部的纹理。当我们初次听说或看到猴脸识别时,多数人的直观的想法就是利用现有的人脸识别方法进行猴脸识别。而人脸特征和动物面部特征之间存在较大差异,如果将现有的人脸检测和识别方法直接应用于动物面部检测与识别会产生一系列问题。

虽然金丝猴面部特征与人脸特征之间存在一定的相似之处,但在面部结构、器官形状和面部纹理特征等诸多方面存在较大差异,主要体现在三个方面:

■ 第一,相对于人脸,金丝猴面部由毛发和皮肤两个部分组成;

■ 第二,金丝猴的面部(特别是面部毛发区域)具有更复杂的纹理特征;

■ 第三,相对于人脸特征的全局相似性,金丝猴面部特征具有显著的局部差异性。

因此,针对金丝猴面部图像的检测与识别,不能直接采用现有的人脸检测与识别的方法。
file

图1 金丝猴面部图像与人脸图像对比

基于深度学习的猴脸识别的基本原理其实是和人脸识别类似的,也就是利用深度学习算法提取金丝猴面部的有效特征,进而对其进行更有效的个体识别。但是我们不能直接使用现有的人脸识别的方法进行猴脸识别,我们需要根据具体的任务,对算法模型进行相应的改进,使其更适合于猴脸识别任务。

4.黄河连线:与人脸识别相比,猴脸识别的难度如何?精确度如何?

file
苗启广:相对于人脸识别,猴脸识别还是存在一定难度的,除了上边提到的环境复杂,面部角度和形态多样性之外,还有就是猴脸的相似性。相对于人脸,猴脸识别就类似于“多胞胎”的识别,相同年龄阶段同一性别的金丝猴的长相非常相似,人类仅凭视觉难以准确识别,这也给我们设计猴脸识别算法提出了较高的要求,也就是如何能够提取出长相相似的不同金丝猴个体面部的差异性特征,以及同一金丝猴个体在不同因素影响下面部的相似性特征。

好在目前具有多隐层的人工神经网络有着优异的特征学习能力,学习到的特征对数据有着更本质的刻画,更有利于对金丝猴个体的识别。相比于一些传统的学习方法,在精度上,有了很大的提高。目前已经对197只金丝猴进行了识别,识别准确率在97%以上,包括秦岭皇冠朝阳沟保护区的23只金丝猴,佛坪熊猫谷的48只金丝猴和周至的126只金丝猴。

5.黄河连线:猴子的活跃度远高于人,且不受控制,能否顺利识别?在技术上有什么解决办法?
file
苗启广:在野外,猴子的活跃度高,不受控制,但是事实上我们并不需要和猴子近距离接触,只需要拍摄记录下猴子的照片或视频即可,在图像或视频帧中猴脸分辨率在100×100左右,且不存在运动模糊和大面积遮挡,就可以进行识别。目前常用的有200万像素的智能手机就可以满足要求,当然单反相机就更好了。因此,获取猴脸图像在设备上不存在问题。而主要的问题在于如何能够拍到侧脸角度较小,也就是小于30°的侧脸,没有大面积遮挡的猴脸。对于不听指令,活跃度很高的金丝猴,这一任务具有较大的挑战。

在单个人拍摄的情况下,我们总结了相应的拍摄策略和参数要求,并且形成了相应的规范。目前我们在进行多物种动物拍摄过程中,基本都是按照这一规范进行的。我们可以在已拍摄的图像和视频中实现金丝猴面部的检测与识别,并且已经实现了基于浅层ResNet模型的金丝猴面部识别的实用软件,这个软件运行在基于Tegra K1的Jetson TK1嵌入式系统开发平台上。

而在后期,我们将会尝试多摄像头组合的方式(即布置摄像头点阵),这样就可以在不同方向对金丝猴进行拍摄,就能够很大程度上拍摄到他们的有效面部图像。进一步,再进行视频拼接,三维建模等研究,以更好地实现在大场景下对金丝猴进行面部检测、识别与追踪。

6.黄河连线:那猴脸识别在现实中会起到什么作用?
file
苗启广:在金丝猴保护和动物、生态研究方面,解决了研究人员需要对金丝猴个体进行人工记忆的难题,为他们更准确地计算群体规模提供了可靠数据。并且,我们后期的主要任务就是实现在复杂的野外背景下对金丝猴进行快速检测与追踪,为金丝猴个体和群体行为规律大研究奠定基础。这样可以让动物研究人员能够更好、更深入地了解金丝猴个体和群体行为。

对于计算机视觉研究方面,拓展了计算机视觉的应用范围,实现了计算机视觉技术的跨学科应用,同时,针对新的问题,对传统机器学习和深度学习方法进行了相应的改进,提高了算法的精度和速度。

此外,这种技术还可以应用于野生动物新个体的发现。如果金丝猴种群中,存在新加入的个体或者家庭,那么我们的算法可以准确识别,并及时将相应个体的图像数据加入数据库。如果后期这种技术能够应用于大熊猫等其他动物的识别中,那么对于野生大熊猫或者其他珍惜动物数量的调研将起到重要的有利作用。

7.黄河连线:猴脸识别的应用场景有哪些?市场需求是否足够大?
file

苗启广:目前,金丝猴脸部识别可以应用到以下几个方面:

■ 对动物科研人员来说,可以使他们更容易,更准确地获得动物个体的身份,以及个体和群体行为等信息。

■ 对动物园来说,可以利用这种技术实时监测不同动物群体和个体在笼舍中的情况,为科学饲养提供依据。

■ 对游客来说,随着旅游业的兴起,越来越多的人前往动物园或野生动物保护区,但是多数游客只是看看动物的种类,不同种类动物的长相,或者看下那些动物是不是比较可爱,而很少了解动物的个体和群体的关系或者相关行为规律。那么我们可以将猴脸识别应用到对金丝猴以及对动物园中其他动物的个体识别中,我们用手机拍下一只金丝猴或者其他动物的图像,通过算法进行个体识别,然后给游客返回这只金丝猴或其他动物的很多信息,比如:它的名字,年龄,甚至家庭成员,这也增加了游客游玩的乐趣,了解了很多动物的相关知识,也在一定程度上促进了人类保护动物的意识。


推荐文章
最前沿:视觉推理(Visual Reasoning),神经网络也可以有逻辑


file
△ 扫一扫关注 极市平台
每天推送最新CV干货

CV干货 微信公众号: 极市平台
ID: extrememart

成为第一个点赞的人吧 :bowtie:
回复数量: 0
暂无回复~
您需要登陆以后才能留下评论!