在线看伦理片

杨超越 ai换脸 CVPR 2025:无需物理引擎,一个模子惩处图像渲染与判辨

发布日期:2025-03-18 04:32    点击次数:133

杨超越 ai换脸 CVPR 2025:无需物理引擎,一个模子惩处图像渲染与判辨

无需物理引擎杨超越 ai换脸,单个模子也能已毕"渲染 + 逆渲染"了!

在诡计机图形和视觉范围,渲染是指将 3D 模子酿成传神的 2D 图片,逆渲染则是从 2D 图片分析出 3D 模子的万般属性(如材质、光照等)。

自拍偷拍网

当今,从材质判辨(逆渲染)——材质裁剪——物体渲染的统共这个词经过,齐被救济到了一个框架中,且在性能方面达到了新 SOTA。

该参谋出自港科大广州以及趣丸科技,他们首创双流扩散框架 Uni-Renderer,将渲染(生成图像)与逆渲染(判辨材质、光照、几何)救济到单一扩散框架,已毕"生成即判辨"的闭环智力。

关系后果已被 CVPR 2025 接管,代码与数据全面开源。

参谋团队暗示,这一后果将来将重塑影视、游戏、AR/VR 等产业的视觉生成管线。

首创双流扩散框架

正如开首提到,渲染是通过色泽跟踪或旅途跟踪,生成高质料的图像;逆渲染是在 RGB 图像中索求出对象属性,比如金属度、爽直度以及光照细节。

传统步调需孤苦建模检修渲染器与逆渲染器,诡计资本高效劳低泛化差,两个过程也浮泛有计划,精度和属性判辨效果齐有限。

而 Uni-Renderer 的双流扩散架构将两个过程建模为双条目生成任务,生成时以材质、光照为条目输出图像,判辨时以图像为条目反推内在属性:

其中渲染流珍爱生成 RGB 图像:以 VAE 编码材质、法线、光照为条目,通过扩散过程生成图像,撑握动态转圜爽直度 / 金属值(如"光滑棒球"秒变"金属质感")。

而逆渲染流珍爱处理内在属性:以图像为输入,通过噪声展望齐集判辨属性, 并在齐集里面进行跨流交互,已毕信息传递和会优化协同。

此外,团队还经受了互异化的 timestep 转机计策,通过不同的 timestep 使模子区别渲染和逆渲染的映射关系,让这两者能更好协同。

终末,鉴于传统逆渲染因"材质 - 光照 - 几何"耦合性导致判辨暗昧。

因此,他们将逆渲染判辨取得的属性,再次输入到渲染模块进行再渲染,并借助轮回看守确保判辨收尾可再行生成一致图像,透顶告别"判辨即失真"。

实测对比,性能碾压 SOTA

1、材质裁剪

对比 Subias(过曝)、InstructPix2Pix(布景缺欠),Uni-Renderer 精确放荡高光与漫反射,如下图中"金属橙子"名义反射环境光照,细节传神。

2、重光照

如下图所示,输入单张图像,平直替换环境光为"夕阳 / 霓虹",模子自动转圜漫反射与镜面反射,光影过渡当然,非凡 NvDiffRec 的生硬效果。

3、信得过场景

下图中,"水壶"逆渲染到手想法高频环境光,金属质感与爽直度舛误仅 3%。

详细而言,通过在生成阶段,以材质、光照为条目输出图像;判辨阶段,以图像为条目反推内在属性,效劳擢升了200%。

同期,Uni-Renderer 强制内在属性与图像的一致性,在公开测试集上材质猜度舛误缩短 40%,光照判辨 PSNR 擢升 30%。

另外,参谋基于 Objaverse 构建业界最大范围多材质合成数据集,涵盖 20 万 3D 对象、121 种材质 / 光照组合,撑握高分辨率(1024 × 1024)检修。模子在未见过的信得过场景中(如金属水壶、手机支架)仍能精确判辨高光、爽直度与复杂光照。

在渲染任务中,PSNR 达30.72(对比基线 28.09),逆渲染任务中,材质猜度 MSE 仅0.118(优化步调 0.316);重光照效果非凡 GaussianShader 等有谋略,信得过感拉满。

开源即用

目下团队对 Uni-renderer 同步进行了开源,包括:

代码库:撑握一键检修 / 推理,兼容 PyTorch 生态;

合成数据集:20 万对象 + 百万级材质 - 光照组合,涵盖数理化生多范围;

预检修模子:即插即用于游戏钞票生成、影视后期、工业想象等场景。

这项参谋的作家为陈知非 , 许添硕以及葛汶杭,他们是来自于香港科技大学(广州)ENVISION 执行室的博士生,师从陈颖聪教练。

(ENVISION 执行室专注于视觉生成模子的参谋,发愤于探索其基应承趣,以提高模子的质料、效劳、万般性和可控性。)

小结一下,Uni-Renderer 的提议,秀气着视觉生成与想法从"分而治之"迈入"救济智能"期间。

其双流架构与轮回看守机制,为跨任务聚首优化提供了全新范式。

将来,团队将进一步和会信得过数据,攻克复杂动态场景,让东谈主工智能成为"万能视觉工程师"。

论文邻接:

https://arxiv.org/pdf/2412.15050

GitHub 代码:

https://yuevii.github.io/unirenderer-page/

执行室官网:https://envision-research.hkust-gz.edu.cn/index.html#news

—  完  —

学术投稿请于责任日发邮件到:

ai@qbitai.com

标题注明【投稿】,告诉咱们:

你是谁,从哪来,投稿本体‍

附上论文 / 时势主页邻接,以及有计划方式哦

咱们会(尽量)实时回答你

一键祥和 � � 点亮星标

科技前沿证据逐日见

一键三连「点赞」「转发」「留神心」

迎接在驳斥区留住你的念念法!杨超越 ai换脸