Back To List
三维人脸识别技术方案简介
Editor:小优智能科技有限公司 Time:Mar 11,2021 Hits:178

2017年,搭载结构光技术的iPhone X一经问世,便引来了国内各大手机厂商的纷纷效仿,由此三维人脸识别进入大众视野。人脸识别以其非接触、便捷、易采集等优势,在众多生物识别技术中脱颖而出,在门禁、考勤、安检通关等场景广泛应用。但目前应用的主要是基于可见光的二维人脸识别,由于三维立体信息的缺失,二维识别受环境光、遮挡等影响严重,且防伪能力较差,导致在支付等场景无法使用。三维人脸识别较好的弥补了二维识别的弊端,逐渐成为各家旗舰机型的标配。        

三维人脸识别的第一步就是要获得三维人脸模型,这里的关键技术是三维重建,在手机、门禁等消费领域主要用到光学重建。主流的重建方案有三种,分别是结构光方案(Structured Light)、TOF方案(Time Of Flight,时差测距技术)、双目立体成像方案(Stereo System)。接下来,我们对这三种方案进行简单介绍。

1、3D结构光方案

结构光方案的硬件主要由投射器和相机组成,其基本原理是,通过近红外激光器,将具有一定结构特征的光线投射到被拍摄物体上,再由专门的红外摄像头进行采集。这种具备一定结构的光线,会因被摄物体的不同深度区域,而采集不同的图像相位信息,然后通过运算单元将这种结构的变化换算成深度信息,以此来获得三维结构。

      结构光方案可以再细分为散斑结构光和编码结构光,二者基本原理相同,但细节上还是有差异的。采用散斑结构光的有iPhone X系列、微软Kinect等,激光通过一个透明散射体(如毛玻璃)时,在散射表面或附近的光场中可以观察到一种无规分布的亮暗斑点,这种散斑具有高度的随机性,而且随着距离的不同会出现不同的图案,也就是说,在同一空间中任何两个地方的散斑图案都不相同。只要在空间中打上这样的结构光然后加以记忆就让整个空间都像是被做了标记,然后把一个物体放入这个空间后只需要从物体的散斑图案变化就可以知道这个物体的具体位置。

 编码结构光又可以分为空间编码结构光和时间编码结构光。空间编码结构光特指向被测空间中投影经过数学编码的、一定范围内的光斑不具备重复性的结构光。由此,某个点的编码值可以通过其临域获得,即可得到物体的三维数据。采用该方案的厂商有小米、VIVO等。时间编码结构光即为在一定时间范围内,通过投影器向被测空间投射一系列明暗不同的结构光,如二值条纹、格雷码、正弦条纹等;然后,通过单个或多个相机拍摄被测表面即得结构光图像;最后,基于三角测量原理经过图像三维解析计算从而实现三维重建。我司生产的MEMS激光3D扫描模组即采用该方案,相较于其他方案精度更高,可达亚毫米级别,不过投射结构光需要时间,更适合相对静止的场景。


从建模效果以及集成成本来看,结构光这种方案在未来的优势还是很有前景的,可拓展空间会更加广阔。

2、TOF方案

TOF即为飞行时间法,其测距原理是通过给目标连续发送光脉冲,然后用传感器接收从物体返回的光,通过探测光脉冲的飞行(往返)时间来得到目标物距离。相对于3D结构光的点阵投射,TOF则是一面均匀的光源,虽然精度上逊色于结构光方案,但是速度更快,距离更远,范围更大,也得到了比较广泛的应用。TOF可细分为iTOF-Indirect TOF(间接测量飞行时间)和DTOF-Direct TOF(直接测量飞行时间)。

所谓间接测量,即通过测量相位偏移来间接测量光的飞行时间,而不是直接测量光飞行时间。iToF模组的核心组件包含VCSEL(垂直腔面发射激光器)和图像传感器,VCSEL发射特定频率的调制红外光,图像传感器在曝光(积分)时间内接收反射光并进行光电转换,计算发射信号和接收信号之间的相位差,从而获取目标物体的深度。iTOF硬件成本低,且集成度较高,目前应用较广,但是其深度精度在cm级,并且随着测量距离的增大,反射光的强度减小,相位测量的信噪比减小,绝对误差也会随之增大。在对精度有高要求的场景无法应用。

dToF,全称是direct Time-of-Flight。顾名思义,dToF直接测量飞行时间。dToF核心组件包含VCSEL、单光子雪崩二极管(SPAD)和时间数字转换器TDC。SinglePhoton Avalanche Diode(SPAD)是一种具有单光子探测能力的光电探测雪崩二极管,只要有微弱的光信号就能产生电流。VCSEL向场景中发射脉冲波,SPAD接收从目标物体反射回来的脉冲波。Time Digital Converter(TDC)能够记录每次接收到的光信号的飞行时间,也就是发射脉冲和接收脉冲之间的时间间隔。dToF会在单帧测量时间内发射和接收N次光信号,然后对记录的N次飞行时间做直方图统计,其中出现频率最高的飞行时间t用来计算待测物体的深度。

dToF的原理看起来很简单,但是实际能达到较高的精度很困难。除了对时钟同步有非常高的精度要求以外,还对脉冲信号的精度有很高的要求。dToF中的核心组件SPAD制作工艺复杂,能胜任生产任务的厂家并不多,并且集成困难。2020年,在最新款iPad Pro中,苹果首次引入激光雷达扫描仪(LiDAR),就是采用了dTOF的技术方案。除此之外,目前还没有其他公司能够商用dTOF方案。dTOF在精度、功耗、抗干扰等方面都具备iTOF不可比拟的优势,相信随着苹果的引入,会有更多厂家推进dTOF的研发与应用,未来可期。

3、双目立体成像方案

基于双目立体视觉的深度相机类似人类的双眼,和基于TOF、结构光原理的深度相机不同,它不对外主动投射光源,完全依靠拍摄的两张图片(彩色RGB或者灰度图),通过三角形原理计算物体距离,因此有时候也被称为被动双目深度相机。该方案作为比较早的三维人脸识别方案,成本最低,建模精度一般,注定只能沦为中端机型的权宜之计,后续发展空间不足。


本文仅做学术分享,如有侵权,请联系删文

给我们Message
验证码