无需物理引擎杨超越 ai换脸,单个模子也能已毕"渲染 + 逆渲染"了!
在诡计机图形和视觉范围,渲染是指将 3D 模子酿成传神的 2D 图片,逆渲染则是从 2D 图片分析出 3D 模子的万般属性(如材质、光照等)。
自拍偷拍网当今,从材质判辨(逆渲染)——材质裁剪——物体渲染的统共这个词经过,齐被救济到了一个框架中,且在性能方面达到了新 SOTA。
该参谋出自港科大广州以及趣丸科技,他们首创双流扩散框架 Uni-Renderer,将渲染(生成图像)与逆渲染(判辨材质、光照、几何)救济到单一扩散框架,已毕"生成即判辨"的闭环智力。
关系后果已被 CVPR 2025 接管,代码与数据全面开源。
参谋团队暗示,这一后果将来将重塑影视、游戏、AR/VR 等产业的视觉生成管线。
首创双流扩散框架
正如开首提到,渲染是通过色泽跟踪或旅途跟踪,生成高质料的图像;逆渲染是在 RGB 图像中索求出对象属性,比如金属度、爽直度以及光照细节。
传统步调需孤苦建模检修渲染器与逆渲染器,诡计资本高效劳低泛化差,两个过程也浮泛有计划,精度和属性判辨效果齐有限。
而 Uni-Renderer 的双流扩散架构将两个过程建模为双条目生成任务,生成时以材质、光照为条目输出图像,判辨时以图像为条目反推内在属性:
其中渲染流珍爱生成 RGB 图像:以 VAE 编码材质、法线、光照为条目,通过扩散过程生成图像,撑握动态转圜爽直度 / 金属值(如"光滑棒球"秒变"金属质感")。
而逆渲染流珍爱处理内在属性:以图像为输入,通过噪声展望齐集判辨属性, 并在齐集里面进行跨流交互,已毕信息传递和会优化协同。
此外,团队还经受了互异化的 timestep 转机计策,通过不同的 timestep 使模子区别渲染和逆渲染的映射关系,让这两者能更好协同。
终末,鉴于传统逆渲染因"材质 - 光照 - 几何"耦合性导致判辨暗昧。
因此,他们将逆渲染判辨取得的属性,再次输入到渲染模块进行再渲染,并借助轮回看守确保判辨收尾可再行生成一致图像,透顶告别"判辨即失真"。
实测对比,性能碾压 SOTA
1、材质裁剪
对比 Subias(过曝)、InstructPix2Pix(布景缺欠),Uni-Renderer 精确放荡高光与漫反射,如下图中"金属橙子"名义反射环境光照,细节传神。
2、重光照
如下图所示,输入单张图像,平直替换环境光为"夕阳 / 霓虹",模子自动转圜漫反射与镜面反射,光影过渡当然,非凡 NvDiffRec 的生硬效果。
3、信得过场景
下图中,"水壶"逆渲染到手想法高频环境光,金属质感与爽直度舛误仅 3%。
详细而言,通过在生成阶段,以材质、光照为条目输出图像;判辨阶段,以图像为条目反推内在属性,效劳擢升了200%。
同期,Uni-Renderer 强制内在属性与图像的一致性,在公开测试集上材质猜度舛误缩短 40%,光照判辨 PSNR 擢升 30%。
另外,参谋基于 Objaverse 构建业界最大范围多材质合成数据集,涵盖 20 万 3D 对象、121 种材质 / 光照组合,撑握高分辨率(1024 × 1024)检修。模子在未见过的信得过场景中(如金属水壶、手机支架)仍能精确判辨高光、爽直度与复杂光照。
在渲染任务中,PSNR 达30.72(对比基线 28.09),逆渲染任务中,材质猜度 MSE 仅0.118(优化步调 0.316);重光照效果非凡 GaussianShader 等有谋略,信得过感拉满。
开源即用
目下团队对 Uni-renderer 同步进行了开源,包括:
代码库:撑握一键检修 / 推理,兼容 PyTorch 生态;
合成数据集:20 万对象 + 百万级材质 - 光照组合,涵盖数理化生多范围;
预检修模子:即插即用于游戏钞票生成、影视后期、工业想象等场景。
这项参谋的作家为陈知非 , 许添硕以及葛汶杭,他们是来自于香港科技大学(广州)ENVISION 执行室的博士生,师从陈颖聪教练。
(ENVISION 执行室专注于视觉生成模子的参谋,发愤于探索其基应承趣,以提高模子的质料、效劳、万般性和可控性。)
小结一下,Uni-Renderer 的提议,秀气着视觉生成与想法从"分而治之"迈入"救济智能"期间。
其双流架构与轮回看守机制,为跨任务聚首优化提供了全新范式。
将来,团队将进一步和会信得过数据,攻克复杂动态场景,让东谈主工智能成为"万能视觉工程师"。
论文邻接:
https://arxiv.org/pdf/2412.15050
GitHub 代码:
https://yuevii.github.io/unirenderer-page/
执行室官网:https://envision-research.hkust-gz.edu.cn/index.html#news
— 完 —
学术投稿请于责任日发邮件到:
ai@qbitai.com
标题注明【投稿】,告诉咱们:
你是谁,从哪来,投稿本体
附上论文 / 时势主页邻接,以及有计划方式哦
咱们会(尽量)实时回答你
一键祥和 � � 点亮星标
科技前沿证据逐日见
一键三连「点赞」「转发」「留神心」
迎接在驳斥区留住你的念念法!杨超越 ai换脸