CGPC2024 第一日
全息数字人
鲍虎军,浙江大学
多媒体 -> 三维重建与渲染 -> 沉浸式自由视角
关键问题:高精度、多模态
现有技术
- 几何建模
- 仿真与渲染
- 视觉插值(View interpolation)
- 重建
重建
多视图立体几何(Multiple View Stereo)
- 开销大、噪点多(需要很多相机)
- 难点:精度,如何抽取二维特征点
神经辐射场(NeRF)
传统重建
位姿求解->深度计算->点云融合->网格提取
流程长、不可微
神经网络重建
- 隐式场渲染,可微
低成本方法
- Sparse multi-view video -> Volumetric video
- Neural Body
- SMPL Human Model
- 体渲染(Volume Rendering)
问题:多人近距离交互情况下,遮挡关系、骨架结构
数字人驱动
多模态信息交互
- 文本/语音驱动 ASR/TTS
- 视频驱动 单目/多目影像重建
- AD-NeRF
未来工作
- 基于物理的环境交互
- 数字人-自然人交互
- 自交互(Audio-Lip/Motion)
渲染
NeRF速度较慢(体渲染)
Efficient NeRF: 生成深度图,导引采样
- 720p+ 5FPS
发展:4K4D实时渲染
- EasyMocap
- EasyVolcap
图像/视频生成:从PBR到基于数据的合成
刘利刚,中科大
基于数据的生成:SoRA等基于深度学习的绘制方法
颜色计算:数据表示、计算方法
PBR:基于第一性原理计算
- 数据表示:Scene
- 计算方法:Rendering->Color
建模:几何仿真 渲染:色彩仿真 动画:运动仿真
1. 建模
Model + Texture
2. 渲染
Projection & Shading
解渲染方程:采样、缓存
- 蒙特卡洛方法:光路采样
- 有限元方法:辐射度等
GAMES303 要出了!
已知三维场景的渲染
传统:面表达和面渲染
复杂情况:体表达(透明物理,散射光路)
问题
- 输入:单视点/多视点采集
- 输出:新视点的图片
方法
- 3D重建,渲染计算
- 可微渲染(Inverse Rendering)
- 不显式计算场景,图像插值2D算法(IBR)
IBR
光路复杂,不可微
方案:体表达,假设直线光路
- 应用于CT成像可视化
NeRF:场表达
3D物体内部点(坐标)与光量
重要技术:位置编码
3D场表达
高斯函数拟合,点表达
基于数据的合成
纹理生成:根据一定方法,取邻域内的像素生成
Siggraph2019:GauGAN
Sora:text-to-video
国内CG研究成果fast-forward
DRGraph:图布局优化,ZJU SE
三维智能感知与高精表达
物理仿真、学习仿真,任博,NKU
视觉大模型,XVERSE元象
鸿蒙OS、媒体AIGC,华为
动捕、人体重建渲染,北师
智能柔性传感动作捕捉,厦门大学
OctFormer,北大
几何处理,高林,中科院
基于基函数渲染(实时渲染)、光追去噪、可微神经渲染等,徐坤,THU
多视角重建、手势AIGC、Shader简化、连续插帧,霍宇驰,ZJU
NPR+可动文生图,Image-3d,NeRF fast inference,易冉,SJTU
Taichi Graphics,https://www.taichi-graphics.com/
视频生成动态流体仿真,mchu@pku
各向异性材质物理仿真,Data-Physics模型,高阳,BUAA
开放大世界建模&重建、实时体积云、全动态GI,腾讯IEG
物理仿真,无人机重建,https://taodu-eecs.github.io/
材质恢复、神经网络材质、参与介质渲染,王贝贝,NJU
后略
离线绘制:光线追踪算法原理
徐昆,THU
数理原理
随机变量、概率、分布
CDF、PDF
无偏估计:
逆变换采样
求CDF
求CDF的逆函数
对[0,1]的随机变量a,令X=P(a)
拒绝采样法
- e.g: 单位圆的均匀分布
- 略
二维流形采样
- 参数曲面描述二维流形
- 如何保证曲面仍是均匀分布?构造“保面积映射”
蒙特卡洛积分
- 给定某随机变量X,按其PDF采样,求f(x)/p(x)的期望即为f(x)的积分
- 无偏性、收敛性
- 降低估计量方差方法:重要性采样、分层采样、拟蒙特卡洛方法
重要性采样
- 找一个和f(x)形状相似的p(x)
多重重要性采样
Balance heuristic:TODO
拟蒙特卡洛方法
采样时使用低差异序列代替随机数
优点:收敛速度更快
缺点:部分情况出现走样
俄罗斯轮盘赌
给定终止概率q,对积分F构造F’,1-q的概率取(F-qc)/(1-q),q的概率直接取c(c、q任意)
E[F’] = E[F]
增大方差,但舍弃了代价高昂的计算(递归深度大的情况)
光线追踪算法:路径追踪
主流算法:Path Tracing,由Kajiya与渲染方程一同提出
基本概念:辐照度、辐亮度、BSDF(BRDF+BTDF)
反射光强 = BRDF(入射光)的积分
入射光必须递归计算,无穷维积分得到渲染方程,只能采用蒙特卡洛方法求数值解
路径采样
从相机出发逆采样,对每个结点进行采样
全路径概率p(x) = p(x0,x1,….,xk) = 条件概率乘积
问题:
- 路径长度限制(何时停止)
- 设置最大深度:有偏方法,能量不守恒
- RR:可以根据当前材质反射率、当前路径总体贡献、深度等动态计算终止概率q,收敛速度变快方差变大
- 收敛速度慢
- 重要性采样
- 根据交点的BRDF确定一个和它接近的BRDF
- NEE(Next Event Estimation)
- 在路径中的中间节点直接和光源采样(减少相关性)
- 无论RR是否通过,在光源上采样给得到一个最终节点x0
- 返回xk xk-1…x0
- 如果RR通过,方向采样得到下一个中间节点
- 直接光照估计:MIS
- BRDF重要性采样:大光源、光滑表面(Glossy材质反射比较集中)
- 光源重要性采样:小光源、粗糙表面
- 重要性采样
参考
PBRT
LuisaRender
前沿渲染
路径引导
学习场景中的光场分布:S-D Tree,在线更新PDF
神经方法:将神经网络视为生成随机数的生成器
渲染降噪
滤波、回归、深度学习
从低spp的渲染结果,利用反射率贴图、法线贴图、深度贴图降噪
离线降噪:权重预测网络
路径复用
神经辐射缓存:使用轻量神经网络你和、存储场景个点辐射场信息
求交加速&GPU光追
求交加速
层次包围体 / 空间剖分
GPU
20系:10Grays/s
30系:同时追踪和着色
40系:硬件光线排序、表面细分
框架:OptiX
LuisaCompute LuisaRender:跨平台统一、编程灵活
实战中的实时渲染
腾讯前沿游戏技术中心引擎专家,袁亚振
项目 vs. 研究
- 项目的短板不能太短
- PPT、源代码,是否能快速复现
- 方案是否Production Proven
全动飞行模拟项目
同步渲染、工业适配
渲染:地球级别的数据组织、标线和灯光渲染、PBR大气云雾
标线、城市:锯齿和闪烁问题
TAA:模糊
方案:UE5 TSR、DLSS、DLAA
UE整合:Aggregate G-Buffer AA(https://research.nvidia.com/publication/2016-07_aggregate-g-buffer-anti-aliasing-unreal-engine-4)
光照烘焙
困难路径采样(间接光采样)
- Practical Path Guiding
超大规模光源
- Light Grid + Light BVH
超大规模场景
- 爆显存问题
游戏资产的智能创建
网易伏羲
3D AIGC
捏脸数据AI
捏脸系统:变量多,输入维度多
角色智能创建:图像识别捏脸、文字生成捏脸数据
- 生成式模型作为渲染器,模拟渲染
通过神经网络定义人脸相似度,反向传播求解骨骼参数
NPC生成,提升开发效率
- 玩家自定义,提升沉浸感
交互式多轮编辑
- 可以通过对话来生成捏脸数据,可以和玩家讨论
交互场景AI
文字生成交互场景
- 书法风格补全
- 地图生成