搜索

谷歌公布亚毫秒级的人脸检测算法BlazeFace

gecimao 发表于 2019-09-15 19:37 | 查看: | 回复:

  谷歌近日公布亚毫秒级的人脸检测算法BlazeFace,这是一款专为移动推理量身定制的轻量级人脸检测器,能够以200~1000+ FPS的速度运行,且性能非常卓越!

  近年来,深度神经网络的各种架构改进使得实时目标检测成为可能。实验室可以不计一切地开发各种算法追求逼近极限的精度,而实际应用中,响应速度、能耗和精度都重要。这就要求算法的复杂度要低、适合硬件加速。

  在移动应用中,实时目标检测往往只是视频处理流程的第一步,接下来是各种特定的任务,如分割、跟踪或几何推理。

  因此,运行对象检测模型推理的算法要尽可能快,最好还具有比标准实时基准更高的性能。

  有多卓越呢?谷歌在其旗舰设备测试,结果发现BlazeFace能够以200~1000+ FPS的速度运行。

  这种超实时性能使其能够应用于任何需要准确的面部区域,作为特定模型输入的增强现实应用中,例如2D/3D面部关键点或几何估计、面部特征或表情分类、以及面部区域分割等。

  BlazeFace包括一个轻量级的特征提取网络,其灵感来自于MobileNetV1/V2,但又有所不同。还采取了一种修改过的SSD目标检测算法,使其对GPU更加友好。然后用改进的联合分辨率(tie resolution)策略来替代非极大抑制(Non-maximum suppression)。

  BlazeFace可用于检测智能手机前置摄像头捕捉到的图像中的一个或多个人脸。返回的是一个边界框和每个人脸的6个关键点(从观察者的角度看左眼、右眼、鼻尖、嘴、左眼角下方和右眼角下方)。

  提出一种在结构上与MobileNetV1/V2相关的非常紧凑的特征提取器卷积神经网络,专为轻量级对象检测而设计。

  提出了一种基于SSD的GPU-friendly anchor机制,旨在提高GPU的利用率。Anchors是预定义的静态边界框,作为网络预测调整的基础,并确定预测粒度。

  提出一种替代非极大抑制的联合分辨率策略,在重叠预测之间实现更稳定、更平滑的tie resolution。

  虽然大多数现代卷积神经网络架构(包括MobileNet)都倾向于在模型图中使用3×3的卷积核,但我们注意到深度可分离卷积计算主要由它们的点态部分控制。

  本研究发现,增加深度部分的内核大小成本并不会增加很多。因此,我们在模型架构中使用了5×5的卷积核,用kernel size的增加来交换达到特定receptive field大小所需的bottlenecks总数的减少。

  深度卷积的低开销还允许我们在这两个点卷积之间引入另一个这样的层,从而进一步加速达到所需receptive field。这形成了一个double BlazeBlock,如上图右边所示。

  在实验中,我们将重点放在前置相机模型的特征提取器上。它必须考虑更小的对象范围,因此具有更低的计算需求。提取器采用128×128像素的RGB输入,包含一个2D卷积,以及5个BlazeBlock和6个 double BlazeBlock,如下表所示:

  类似于SSD的对象检测模型依赖于预定义的固定大小的基本边界框,称为priors,或者Faster-R-CNN中提出的术语“Anchor”。

  我们将 8×8,4×4 和 2×2 分辨率中的每个像素的 2 个 anchor 替换为 8×8 的 6 个 anchor。由于人脸长宽比的变化有限,因此将 anchor 固定为 1:1 纵横比足以进行精确的面部检测。

  pipeline示例。红色:BlazeFace的输出。绿色:特定于任务的模型输出。

  由于我们的feature extractor并没有将分辨率降低到8×8以下,所以与给定对象重叠的anchor的数量会随着对象的大小而显著增加。在典型的非极大抑制场景中,只有一个anchor“胜出”,并被用作最终的算法结果。当这样的模型应用于随后的视频帧时,预测往往会在不同的anchor点之间波动,并表现出明显的人脸框抖动。

  为了最小化这个问题,我们用一种混合策略代替了抑制算法,该策略将一个边界框的回归参数估计为重叠预测之间的加权平均值。它实际上不会给原始的NMS算法带来额外的成本。对于我们的人脸检测任务,这个调整使准确率提高了10%。

  超实时性能。解锁需要面部区域作为输入的“任务特定”模型的实时AR pipeline:

  原文标题:亚毫秒级手机人脸识别!谷歌BlazeFace算法重大突破, 面向移动GPU

  文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

  首发labview人脸识别编程,识别率达到97%。在“刷脸”技术不断趋于成熟的今天,提前掌握最新技术,意味先于别人获得职

  神经网络语言模型(NNLM)克服了维数的限制,提升了传统语言模型的性能。

  为了配合公司海外业务的发展,OPPO在2018年5月在印度正式推出旗下全新的子品牌realme 。作....

  近日,谷歌发布了一个名为Eddystone的Beacon平台,正式进军Beacon领域。这是继201....

  全球首款搭载Tango技术的AR大屏智能手机 PHAB2 Pro帮你实现所有假想。

  这款手机搭载了Android 9 Pie操作系统,不过HMD表示,已经为这款机型已经准备好了Andr....

  病理科被“现代医学之父”威廉·奥斯勒称为“医学之本”,而病理医生被认为是医生的医生。病理科的含金量自....

  数据增强策略通常包括剪切、填充、翻转和旋转等,但这些基本策略对于深度网络的训练还是太简单,在对于数据....

  获取图像的方式有两种,第一种是直接从源头获取,通过对接前端各类相机、NVR录像存储等设备。第二种是间....

  需将手机抬起来或者“唤醒”,即可进行人脸识别解锁;用户也可以隔空用手势控制手机,可以用来换歌、让电话....

  下诺夫哥罗德市政府日前对在索尔莫夫斯基第85中学试点人脸识别系统的项目进行总结。随着这项为期半年的实....

  外媒《CNET》转述《The Information》消息,多位知情人士透露,在华为被列入美国实体管....

  谷歌的测试工程师们(TEs)专注于用实证过的最佳测试方法来使我们的产品精益求精。我们快速地精心安排用....

  目前艾迈斯3D传感方案主要应用在手机前置的脸部识别,如VR、AR等应用中。

  最近,Google Brain团队的研究人员发表了一篇论文,提出了一种名为概念激活向量(Concep....

  多家媒体披露,谷歌员工始终在美国城市的街道上游荡,为那些愿意接受面部扫描的人提供5美元的礼券。

  在移动互联网时代,民众普遍租用互联网巨头的云存储服务来保存个人照片或者视频,各家厂商也展开了激烈竞争....

  如今人工智能这个话题被人们所关注,人们抱着好奇的心态去看。的确,智能给人带来了太多的想象。就像手机有....

  “情感识别”虽然在各方面的研究有了较大的突破,但最近许多科学家提出并不靠谱。

  2018年11月, Greene在谷歌云官网上公开了辞职信,正式宣告卸任谷歌云CEO职位,一下子整个....

  针对人工智能(AI)算法的网络攻击新闻已不再罕见,现在几乎每天都在发生。研究人员发现,无论是在实验室....

  人脸支付技术是利用受理终端的人脸采集能力,通过人脸识别技术(1:1 or 1:N)获取持卡人支付账户....

  人脸识别在公租房等保障性住房的应用,是落实保障性住房实人制的有效措施,可进一步保障社会资源的公平利用....

  AI 可以通过语音识别、视觉识别、文字识别、表情识别等数据,结合深度学习,再加上人工的标记,从而具备....

  人脸识别所具备的非接触性、便捷、可扩展性等应用优势,使其在诸多应用场景迎来了广泛应用。

  人脸识别确实在生活中给人们带来许多便利,但更让人担心的是,人脸识别技术仍存在一定的隐私风险。

  随着消费者意识到他们在互联网上留下的数据能够产生的巨大威力,人脸识别数据集正在加剧人们对隐私和监控的....

  我们现在有了很多非常厉害的深度学习框架,比如Tensorflow,CNTK,PaddlePaddle....

  人工智能在国内狂飙突进,科技巨头扎堆布局,越来越多的产业资本也开始关注人脸识别,人脸识别等自动识别技....

  人脸识别最大的优势在于免接触、快速的通行,这些特点符合了现代人的快节奏生活需求。

  谷歌AI最近分享了两篇研究论文,描述了在医疗保健领域类似图像搜索的人机交互研究进展。

  人脸识别技术以及其他新兴技术的发展是时代趋势所向,自然有其巨大的益处。

  我国生物识别产业,尤其是指纹识别技术领域,已进入成熟发展期,但在金融领域的应用却还处于初期探索。

  由于采集和利用的都是人像数据这种具有人类生物识别特征的关键信息,如果过度使用或者滥用,甚至可能引发更....

  人脸识别技术可以适用的场景还有很多,这固然令人欢欣鼓舞,但也必须注意到技术的“双刃剑”作用。

  在信息爆炸的时代,数据的处理、分析、应用很多都是由算法来实现的,越来越多的决策正被算法所取代。

  目前生物识别技术已经相对成熟,尤其是人脸识别技术和虹膜识别技术不断出现新突破。

  FPGA作为未来强大的计算加速器,不但影响主要企业的决策和市场趋势,而且加速企业中的工作负载,促进超....

  这次没有了罚款的累赘,本季度谷歌母公司 Alphabet 的业绩表现平稳上扬,在即将到来的监管风险之....

  人脑中的神经系统精密而复杂 成人的大脑拥有超过1000亿个神经元[MOU1] 每天要进行数万次的计算 计算机系统发展到今天 仍...

  目前,在许多需要在本地进行数据分析的“永远在线”的物联网边缘设备中,神经网络正在变得越来越普及,主要是因为可以有效地同时...

  今天学习了两个神经网络,分别是自适应谐振(ART)神经网络与自组织映射(SOM)神经网络。整体感觉不是很难,只不过一些最...

  BP神经网络 首先给出只包含一个隐层的BP神经网络模型(两层神经网络): BP神经网络其实由两部分组成: 前馈神经网络:...

  卷积神经网络(CNN)究竟是什么,鉴于神经网络在工程上经历了曲折的历史,您为什么还会在意它呢? 对于这些非常中肯的问题,我们...

  今年嵌入式视觉峰会的论文为以光为输入的嵌入式系统建议了多种方法,以及使这些输入发挥作用所需要的各种算法和硬件实现。应用包...

  在这个高度依赖图像的时代,英特尔® FPGA 可利用 OpenCL™ 平台满足巨大的图像处 理和分类需求 简介 从 2015 年到 202...

  导语:人脸识别已经在我们生活中随处可见,但人脸识别将会给我们生活带来便利的同时,也会重新改写我们社交的本质,以及引发隐私...

  随着人脸识别技术的不断发展与成熟,以及图像采集设备成本日渐降低,数码相机、摄像机、拍照手机的不断普及极大地拓展了人脸识别...

本文链接:http://baumseelen.com/duiouchanshengqi/802.html
随机为您推荐歌词

联系我们 | 关于我们 | 网友投稿 | 版权声明 | 广告服务 | 站点统计 | 网站地图

版权声明:本站资源均来自互联网,如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

Copyright @ 2012-2013 织梦猫 版权所有  Powered by Dedecms 5.7
渝ICP备10013703号  

回顶部