首页 / 行业
小米夜枭算法团队获大众评审和摄影师评审两项世界冠军
2022-05-09 10:02:00
不久前,小米相机部迎来好消息
小米夜枭算法团队在被誉为“影像算法奥林匹克”的CVPR NTIRE 夜景渲染比赛中,获得了大众评审和摄影师评审的两项世界冠军。消息一出,公司上下,米粉及影像圈内外投来了惊喜、惊叹以及称赞的目光。
于是,这不,活儿就应运而生了。我被委任了一项光荣任务,要和夜枭算法团队的技术专家聊聊,“夜枭”这项技术到底咋(duo)回(niu) 事 (bi) 。文科女孩不怕困难,在肝了2周,流下一些含有技术含量的泪水后,终于,肝出来了!
顶级盛会天花板
夜枭团队双夺冠
首先,来隆重介绍一下有“影像算法奥林匹克”之称的CVPR NTIRE 系列赛。
CVPR,是计算机视觉领域全球最具影响力、内容最全面的顶级学术会议。说得具象一点,与我们耳熟能详的Nature 、Science的学术影响力可等量齐观。NTIRE,是 CVPR中关于影像恢复与增强相关任务的专题研讨会,是世界规模最大、水平最高的图像恢复与增强的研讨会和比赛。
NTIRE 提出业界前沿困难任务,用竞赛形式吸引全球专家学者参与挑战,而竞赛中提出的解决方案也常被学术圈和工业界所借鉴,因而备受关注。今年是第七届NTIRE 比赛,吸引了南开大学、米兰大学、华为等众多国内外顶尖大学、研究机构和公司参加。
小米夜枭团队本次参加的是NTIRE首次提出的比赛赛道,大赛提供单张夜景原始RAW图,参赛者通过研发夜景渲染解决方案,生成夜景视觉效果图像。(RAW图,可以理解为图片的原始档案,是没有被加工,也没有任何损失的一种格式图。)
为兼顾专业性与大众性,最终夜景效果图由大众评审和摄影师评审共同投票评定。这次小米夜枭团队获得的双冠军,可以说是来自专业人士与普通用户的双重肯定。
与 NTIRE 的其他赛道相比,夜景渲染挑战需要参赛者自发摸索和定义目标效果,相当于开放性考试,不仅考验团队的技术能力,也考验“技术审美”,难度更大,更具挑战性。
夜枭算法有多牛
背后技术是一流
首先,来为大家科普一下「夜枭算法」。算法是用计算机解决问题的方法、步骤。解决不同的问题,需要不同的算法。夜枭算法是聚焦于暗光场景,小米自研的深度学习AI拍照算法,用于提升手机相机拍照和视频的画质效果。
引用米粉的描述,小米手机+夜枭算法≈小米“夜视仪”。即在黑暗条件下,手机相机在夜枭算法加持下,突破手机相机感光下限,让照片焕发「光彩」的技术。
打个比方,当原始夜景照遇上夜枭算法,立刻碰撞出火花。照片将在不到3秒的时间里,经历去噪、提亮、色彩还原等环节,最终恢复出一张细节清晰、颜色真实、画面干净的夜景照片。
经过夜枭算法处理的照片,背后调用了数十个核心算法,包括AI噪声估计,AI去噪、AI细节增强、AI颜色还原、AI提亮、AI夜景深度估计、AI场景分割、AI选帧、AI对齐等。
那么让夜景照越夜越美,夜枭算法是如何做的呢?
1 夜太黑,「去噪」辨是非
在伸手不见五指的黑夜,未经算法处理的照片,自然是漆黑一片。
当对照片进行一点提亮,将得到一张噪声很大的照片。噪声,指一切不规则的信号,体现在照片里的即为图片噪声。肉眼看,噪声大的照片有“糊”的感觉,有时候甚至看不到具体的东西。
造成图片噪声的原因有很多,比如夜晚亮度低,灯光复杂,导致采集图像存在噪声。以及图像在手机设备内传输成像的过程,也会产生噪声。
噪声对图像是一种“破坏”,去噪则可理解为去除图像污染,恢复和重建图像数据的过程。小米夜枭算法,通过自主研发夜晚场景噪声标定系统,对夜晚场景噪声的分布和形态进行数学建模,在干净的图像上同样添加噪声,从而补充大量模拟噪声数据,提升训练数据的丰富度,让去噪更有针对性。
与此同时,小米夜枭算法还自主研发了极暗光数据采集系统,使用多种真实相机进行数据采集,补充的数据能让去噪效果更好。
万事开头难,图像去噪是算法处理照片的重中之重,是起点也是重点。
2 夜太美,更需要「完美」的细节
暗光情况下,拍张好看的人像照不容易。有米粉曾提出疑问,小米 11Ultra 在夜晚拍摄人像时,怎么做到把发丝、睫毛拍摄的丝丝分明的?
这其实本质是一个如何在有效去除图像噪声的同时,恢复出更多图像细节的问题。从算法原理上看,需要更好地对齐。
打个比方,当你在夜晚举起手机拍一张夜景照,小米相机里的“算法小机灵鬼”已准备就绪。
当你按下快门,算法其实拍摄了多张照片,它们紧锣密鼓地进行多张照片的画面对齐,并分析每张照片特征,择优录取「真实」的画面部分,从而融合出一张优秀的夜景作品。
通俗解释容易,背后的技术不简单。小米算法团队首次提出自引导的多尺度融合AI去噪算法,当多帧原图输入时,进行亚像素特征对齐和特征级别信息融合,降低拍摄手抖的影响,实现多帧信息的互相补充。
当单帧原图输入时,进行多尺度的特征重建,实现单帧内信息充分利用。结合噪声指导图,还可以引导算法对不同区域进行不同程度的融合去噪,指导局部信息残缺的区域实现细节恢复,在获得更好去噪效果的同时,恢复更加丰富的细节信息。
当我们看到恢复了更多细节的照片,在视觉上能感受到干净、舒服。因为算法区分出了细节和噪声,并保留好细节,比如纹理、发丝、睫毛,而不是直接抹掉。
如果用解一道难题来比喻,夜枭算法相当于在解决暗光拍照这道考题时,发现了8种解题思路,并通过深度学习,融合不同思路的完美之处,最终提交了一个近似“圆满”的答案。
3 夜太深,明暗色彩要分明
夜晚拍摄,由于灯光比较多,发出的光线不均匀,动态范围大。“动态范围大”就是亮度信息太多,从最亮到最暗的幅度大。此时用手机拍摄,可能出现高光的地方很亮但丢失细节,稍微暗点的地方则只剩黑暗。
为处理多种光源混合的情况,夜枭算法提出了基于内容自适应的AI提亮模型。通过对图像中不同的区域进行不同程度提亮,在保证图像对比度同时,保留亮区和暗区的信息,实现让亮度过渡区域更平滑、自然。
图像明暗过渡丝滑后,要想获得更真的“夜感”,还需要准确地还原夜景的颜色。
还原夜色,需要精准的白平衡估计。白平衡就是白色的平衡,我们看到物体的颜色,会随着环境光线出现偏差。夜晚光源较多,比如一只白色的狗在黄色的路灯下会偏黄,出现颜色失真。精确的白平衡估计,是让照片更真实的必要条件。
Xiaomi 12 Pro 夜枭2.0 VS 友商
为让夜景颜色更准确,小米夜枭团队使用deepAWB来实现多光源的白平衡估计,并首提AI色彩还原模型,通过提取图像中有效内容,让不同区域有不同的计算权重,避免受到过亮和过暗区域干扰造成混合光源颜色失真,提升了夜枭算法对环境的自适应能力。
Xiaomi 12 Pro 夜枭2.0 VS 友商
也就是说,夜枭算法中的AI提亮模型和颜色矫正模块,能根据不同环境的亮度和场景中的内容,实现不同程度的亮度提升和色彩还原,最终得出清晰、明亮的图像。
哪些坑
可以不踩
和夜枭算法专家雷老师聊完,我基本对夜枭算法从云里雾里到了五体投地的地步。优秀算法的关键,源自优秀头脑的写就,是一群优秀工程师的技术理想。
夜枭团队已成立近3年,成员多为热爱研究技术的年轻工程师。他们主要负责结合AI 深度学习技术,提升手机相机拍照和视频的画质效果,研究方向包括去噪、高动态、颜色增强等,已经交付了不少深受用户喜爱的研究成果,比如AI大片、夜枭极暗光拍照、夜枭视频、夜景抓拍等多个有自主知识产权的核心算法。
夜枭算法最初筹备时,并非是备受关注的热门项目。当时为解决夜景拍摄的技术难题,5位算法工程师凭借对技术的执着、痴迷,以及对待工作的全力以赴,利用不到半年的时间创造出了夜枭算法1.0。夜枭算法更像是一次技术探索中,意外收获的惊喜。
夜枭算法推出后,很快得到了多方肯定,并从幕后走到台前,登上了发布会。团队的小伙伴们既兴奋又紧张,期待着用户使用后的反馈。一段时间里,工程师们泡在微博、B站等社交媒体平台上,听用户的反馈,有时候听得很高兴,有时候也会有点小失落。“但对改进有用的,还是会认真看的。”
这个年轻的团队始终活力十足,成长速度越来越快,规模也日渐扩大。
当我问算法专家雷老师,能否提供夜景拍摄的技巧时,这其实并不在工程师的射程范围内。对于夜枭算法的专家来说,相比于拍出一张好看的照片,他们更在意的是底层算法的准确性,以及算法对色彩、场景还原的真实性。“准”与“真”是工程师相信的标准。
但他也从算法的逻辑角度,提出了3个小建议
1/ 稳住,才有赢的机会该稳定既是情绪上的稳定,还有就是手要稳,这可以让算法进行更好地对齐。虽然算法已经在一定程度上降低了手抖的影响,但如果拍摄中,手如帕金森般剧烈抖动或者大幅动弹,对于拍摄将毫无益处,稳住,赢的几率更大。
如果你天生手抖,建议可以配一个三脚架或者其他固定工具,用来保持画面的稳定。如果不想配三脚架,也可以把手机放在可以倚靠的固定地方,比如栏杆,或者也可以邀请手部稳定同伴帮忙。
2/ 避免拍摄“亮瞎眼”强光源强光源,不是指光头,而是指光线比较强的物体,当你试图拍强光源或者强光源下的人时,由于光线进入手机相机镜头内,发生了多次的折射与反射,会让画面出现难以预测的意外,以及也可能会让光线跑偏,当然最直接的可能就是被拍摄人打。
3/ 拥有一台夜拍神器最后,要想得到一个细节丰富、纯净度好的照片,最好的办法是拥有一台配置了夜枭算法的小米手机。目前夜枭算法已经应用到小米11 Ultra、小米12 Pro 等小米旗舰手机上,将助力你拍出更美的夜色。
每一次手机影像上的进步,背后都离不开宝藏工程师们。在工程师眼中,代码是语言,是表达的工具,是创新的力量。未来,伴随手机硬件和算法的不断提升,相信小米的工程师们将为手机影像的发展带来更多新的体验。
提到未来的展望,夜枭算法专家雷老师说,手机影像算法不仅会朝着拍照更快、更清晰、颜色更准确、动态范围更高的方向发展,还会根据用户更多元的需求,不断攻坚与创新,为米粉们带来更好的拍照体验。
虽然距离「最好」,还有很长的路要走,但务实的工程师们相信,只要钻研,耐心用时间去实践,总能开创出远大前程。
审核编辑:彭菁最新内容
手机 |
相关内容
重庆东微电子推出高性能抗射频干扰
重庆东微电子推出高性能抗射频干扰MEMS硅麦放大器芯片,芯片,推出,算法,抑制,音频,信号,重庆东微电子有限公司最近推出了一款高性能新一代8通道脑电采集芯片研制成功,
新一代8通道脑电采集芯片研制成功,铠侠与西部数据已中止合并谈判,合并,芯片,脑电,新一代,通道,产品,近日,一项重要的科技突破在全球范高精度3D视觉技术,助力工业机器人实
高精度3D视觉技术,助力工业机器人实现汽车零部件高效上下料,工业机器人,助力,视觉,高精度,3D,算法,高精度3D视觉技术在工业机器人上DigiKey 凭借品牌更新荣获四项 Mar
DigiKey 凭借品牌更新荣获四项 MarCom 大奖,四项,机构,明尼苏达州,公司,行业,产品,全球供应品类丰富、发货快速的商业现货技术元件芯朋微:服务器配套系列芯片已通过客
芯朋微:服务器配套系列芯片已通过客户验证 可应用于AI服务器,服务器,客户,芯片,验证,人工智能,公司,芯朋微是一家专注于人工智能芯片嵌入式视觉技术如何赋予机器观察能
嵌入式视觉技术如何赋予机器观察能力,能力,视觉,嵌入式,跟踪,特征,计算,嵌入式视觉技术是一种将人的视觉能力赋予机器的技术。通过ASML不惧佳能纳米压印光刻机!
ASML不惧佳能纳米压印光刻机!,提升,分辨率,产品,公司,芯片,市场,佳能最近发布了一款被称为能够生产2纳米芯片的新一代纳米压印光刻机数据中心短缺:人工智能未来的致命阻
数据中心短缺:人工智能未来的致命阻碍?,人工智能,数据中心,采用,需求,算法,存储技术,数据中心短缺是人工智能未来发展的一个重要致命