日前,CCF YOCSEF合肥在中国科学技术大学先进技术研究院举办了题为"三维场景信息建模和传输技术未来发展之路"的深度技术论坛,由CCF YOCSEF合肥主席李礼和AC委员袁明磊共同担任执行主席。来自国内知名高校和产业界的四十余位专家学者的企业代表参与思辨。与会嘉宾围绕三维场景信息的高效建模、存储传输与实时渲染等关键技术展开了深入交流,以期推动该领域快速发展和技术突破。
论坛活动由报告环节和讨论环节组成,重点围绕论坛主题的多角度深度思辨研讨。在引导发言环节,中国科学技术大学陈雪锦教授做了题为《三维表征的未来:统一还是多样?》的引导报告。她首先从传统计算机图形学的角度回顾了三维表征技术发展脉络。然后,重点阐述了基于显式几何表达与运动表达相关的研究进展,包括自监督物体表面网格重建和基于层级结构的动态场景神经渲染,并从三维表征的显示、传输、编辑与生成等角度出发对统一表示与多样表示两种技术路径进行了对比分析。
清华大学深圳国际研究生院金欣教授做了题为《ISO/IEC MPEG微镜光场视频编码标准进展与展望》的引导报告。她首先介绍了光场相机的工作原理、光场采集与成像方式、以及基于微镜视频的光场统一表征结构。随后,重点阐述了微镜视频编码在MPEG的标准化历程,涵盖应用场景、技术需求、数据集与评估方法、压缩架构、以及性能评价,并对后续的标准化工作计划进行了展望。
浙江大学廖依伊研究员做了题为《MPEG GSC标准化探索与展望》的引导报告。她首先介绍了MPEG对于沉浸式媒体编码的发展历程:从点云到mesh再到多视角视频,并介绍了辐射场编码从NeRF到3D Gaussian Splatting的演进。随后,重点介绍了GSC在标准化过程中面临的挑战与问题,以及由此而发展来的I-3DGC Track、A-3DGS Track和I-3DGS 1-F Track三种技术路线的进展,最后介绍了软件平台GSCodec Studio等工作。
上海交通大学胡强教授做了题为《面向沉浸式通信的跨尺度重建与呈现》的引导报告。他首先介绍了沉浸式体积视频智能编码的应用场景,以及体积视频重建面临的挑战。随后重点介绍了基于高斯表征的体积视频压缩3DGC、分层渐进式体积视频编码4DGCPro、边云协同体积视频实时传输与交互的平台构建、对齐几何语义的稀疏室内重建AlignGS以及基于云渲染平台的实时呈现与交互等工作。
在论坛集体思辨环节,与会嘉宾对齐了三维信息建模、传输和渲染场景;探讨了完美的三维信息载体应该具备的特点,不仅包括方便获取、表达紧致、实时渲染、编辑友好等,还包括信息近无损、易于与其他格式相互转换等。此外,嘉宾们还思辨了多视角视频、光场视频、NeRF、以及3D Gaussian等现有三维信息载体的优势和劣势。
下午的讨论中,与会嘉宾首先分两组分辨展开讨论,分别从"用于静态和动态场景的直接采集数据(包括多视角视频和光场视频等)高效压缩传输"和"用于静态和动态场景的中间生成数据(包括NeRF和3D Gaussian等)高效压缩传输"两个方面展开深入讨论。随后基于两组的讨论成果共同研讨,与会嘉宾形成了直接采集数据和中间生成数据高效编码传输的技术路线和标准化路径。此外,与会嘉宾还深入思辨了"三维信息真的会有‘流’起来的一天吗"这一有趣话题,与会嘉宾认为,人类对于三维信息的追求包括沉浸感和立体感等是一定存在的,但是未来三维信息的载体可能并不一定是"三维"的。
论坛的讨论成果正在进一步梳理并将于近期发布,以期为三维信息表征和压缩传输的技术演进和最终大规模落地带来一定的促进和引导作用。(齐琪)