From: Google;编译: T.R
为了让手机用户也能在移动设备上创造出优秀的作品,谷歌研究人员利用机器学习算法开发了一种名为“肖像打光器(Portrait Light)”的应用,它可以利用模拟光照为照片中的人像重新打光,从而在手机端对图像实现完全可控的光照调整。
受肖像摄影中外置闪光灯的启发,Portrait Light实现了光源重放置的建模,可以自动选择照片中现有的初始光源和强度,在此基础上,自动将光源位置进行重新放置和调整。在这一工作中,研究人员构建了一系列的机器学习模型,并利用大形的照明拍摄装置Light Stage构建了丰富的训练数据集,实现了自动光源放置和自动打光的效果。
这些创新成果为图像构建有效的重光照成为可能,即使是在移动设备端也能有效实现。
摄影师通常利用感知线索来改善外置光源与环境中的照明条件,他们通常会根据落在人脸上的光照来评估光线的方向和强度,并通过调整人物头部的朝向来获取最佳的照明效果。这一新开发的算法同样基于这两种感知信号来实现自动光照调节。
首先,研究人员训练了一个可以从输入图像中估计出场景全局的高动态范围光照条件。这种算法创造性地利用人脸作为光线检测器,可以得到场景中所有方向光源的方向、光强和颜色信息。此外,还利用了MediaPipe中的人脸网格来检测面部的朝向。这些信息决定了合成光线需要的朝向。
在给定需要重新打光的方向和输入肖像图后,需要新的机器学习模型来将合成的光照添加到原有的图像中。训练这样的模型需要数百万张包含和不包含外部打光的人像配对数据。在真实场景中拍摄如此庞大的数据集几乎是不可能完成的任务,因为这需要对在不同光照条件下拍摄的肖像进行近乎完美的配准。
为了解决这一问题,研究人员利用了大型的照片和摄影数据收集平台以及计算成像系统Light Stage来进行数据集收集,在球形空间内安装了64个相机和331个独立的LED照明系统。当每个LED照亮的时候,就进行拍照和数据收集,由此可以得到人物在球形空间中不同光照条件下的反射场。反射场可以编码人物的皮肤、头发和衣服等独特的颜色和光强信息(每种材料的光泽或者暗淡程度)。
基于光的叠加原理,可以将这些不同光照方向下的图像进行叠加,渲染出对象在任意给定光照方向下逼真的图像,同时还能满足像次表面散射这样复杂的光传输现象。
利用Light Stage,研究人员拍摄了不同脸型、性别、肤色、发型和衣着的人物。每个人物都生成了许多不同环境光照下的肖像(包含额外光照和没有光照的配对结果),渲染出了数百万的配对图像用于训练。这一数据集可以让模型学会有效处理不同方向、环境和人物的肖像结果。
与先前直接预测重光照后的图像不同,这一模型通过预测低分辨率的商图像作为中介来实现重光照效果。在上采样后,商图像可以作为乘数与输入图像相乘来得到期待的重光照结果(增加了额外的光照)。由于商图像仅仅只需得到低分辨结果,使得计算更为简洁和高效。同时作为乘数的上采样商图像直接作用到原始图像上,不会影响原始图像的细节。
当摄影师将额外的光源增加到场景中,光源与拍摄对象面部的相对朝向和面对的几何形状就决定了每个部分的反射强度。为了对这一光学过程进行建模、学习光线在人脸这类材质上的反射行为,研究人员首先利用机器学习模型估计了输入人像主体的法向量信息,而后基于朗伯反射定律计算出给定光源的光强可见图。光强可见图作为商图像预测器输入,随后估计出用于与原始图像相乘的商图像,保证了重光照和图像生成过程符合物理定律。
优化后的模型可被压缩到10MB的大小,可在移动端流畅地进行交互式运行。
滑动查看参考资料~
扫码观看!
本周上新!
关于我“门”
将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及将门创投基金。
将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。
如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:
bp@thejiangmen.com
点击右上角,把文章分享到朋友圈
扫二维码|关注我们
微信:thejiangmen
bp@thejiangmen.com
点个“在看”,分享好内容