杭州六小龙开源Aholo Viewer:3D高斯浏览器支持10亿高斯点渲染,性能全面碾压Spark 2.0
今年4月中旬,李飞飞创立的World Labs开源了3D高斯泼溅渲染引擎Spark 2.0,在全球开发者社区引发一阵轰动。这款引擎能在浏览器中轻松渲染上亿个3D高斯点的精细场景,甚至在手机上也能流畅运行,这一突破着实令人振奋。然而仅仅时隔一月,一款名为Aholo Viewer的国产3D高斯浏览器也正式开源,并在多项核心性能指标上实现了对Spark 2.0的全面超越。最令人震撼的数据是:Spark 2.0的上限为1亿高斯点,而Aholo Viewer能够扛住10亿高斯点的渲染,性能差距整整一个数量级。海外技术社区正对此展开火热讨论。

项目概况:Aholo Viewer是什么?
Aholo Viewer是一款完全在浏览器中运行的3D高斯泼溅(3D Gaussian Splatting)渲染引擎。这个词听起来充满科技感,通俗来说,它用大量模糊的圆点拼接重构出栩栩如生的3D场景。但3D内容一直以来的痛点在于数据文件过于庞大,传输困难、加载缓慢。像Aholo Viewer和Spark 2.0这类项目的开源,使得普通用户无需安装任何额外客户端,在不同终端设备上打开网页就能流畅浏览包含亿万高斯点的超大规模3D场景。这让3D内容的传播和消费变得像观看视频一样简单、高效。

开源地址:GitHub:github.com/manycoretech/aholo-viewer
不用装任何客户端,打开浏览器,手机、电脑、VR头显都能用。你可以在浏览器里直接漫游一座城市级别的3D场景,比如将整个杭州西湖区域的实景3D重建塞进网页中,像刷短视频那样随意闲逛。这个项目来自群核科技,它也是杭州“六小龙”之一,今年4月刚刚在港交所上市,一直深耕空间智能领域。

群核科技在3D渲染领域已有长达15年的技术积累,这次直接将核心能力开源,Aholo Viewer能实现这番性能表现并不令人意外。事实上,群核科技一直在向开源方向积极迈进,此前已经发布了3D高斯语义数据集InteriorGS、空间语言模型SpatialLM、空间生成模型SpatialGen,在3D空间智能赛道上布局极为深远。
下面是Aholo Viewer的实际运行效果:
性能对决:Aholo Viewer vs. Spark 2.0
3D高斯泼溅是近两年3D重建领域最炙手可热的技术方向。其核心思路是借助数以亿计的3D高斯点云来重建真实世界的场景,并实时渲染呈现。当李飞飞的World Labs在4月开源Spark 2.0时,主打卖点就是在浏览器中跑通1亿以上的高斯点,同时适配所有设备,当时这一指标已足够震撼。但Aholo Viewer的到来,重新定义了性能边界。

直接看对比:在场景承载力上,Spark 2.0最多支持1亿高斯点,Aholo Viewer则支持10亿,拉开了10倍的差距。在同一个3亿高斯点的场景下实测,结果更是一边倒:
- 内存占用:Aholo只有Spark的1/2
- 加载速度:Aholo快1倍
- 渲染速度:Aholo快3倍
- 画面效果:Aholo更优
这不是微弱的领先,而是全方位的技术碾压。Spark 2.0基于Three.js和WebGL2构建,走的是传统的Splat‑based技术路线,Aholo Viewer则选择了一条完全不同的道路。
核心技术揭秘:区块式LOD架构如何实现高性能?
性能差距的根源在于底层架构。Spark 2.0采用Splat‑based方案,以单个高斯点作为基本单元进行调度和渲染。场景较小时还算流畅,但场景一旦扩大,数据量会指数级爆炸,内存与显存都会不堪重负。Aholo Viewer则创新性地采用了Chunk‑based LOD Tree,即区块式细节层级树。
它的思路完全不同:它将整个3D场景切分成一个个区块(Chunk),每个区块拥有独立的细节层级(LOD)。当你浏览时,近处的区块加载高精度细节,远处的区块仅呈现低精度版本。这样的设计让内存变得更加可控:同一时刻只需加载视野范围内的区块,不必将整个场景完全塞进显存。一个10亿高斯点的场景,你的浏览器其实完全不需要一次性装下10亿个点。
区块化管理也让缓存命中率大幅提升,远比逐点管理高效。当你在一片区域内环顾四周时,已经加载过的区块会被缓存在本地,切换视角时无需重新下载。扩展性同样极佳,如果想支持城市级甚至更大规模的场景,只需增加区块数量即可,核心架构无需任何改动。配合流式分批拉取技术,Aholo Viewer可以实现首屏10秒内进入场景,之后根据视锥优先级逐步加载剩余内容。你看哪里,它就加载哪里,不看的部分完全不占资源。这借鉴了游戏引擎中经典的LOD思想,但Aholo将其深入应用在更加复杂的3D高斯泼溅场景中,而且做得极为彻底。
全链路工具与开箱即用体验
仅有一个渲染引擎还不够,开发者还需要一整套工具,才能把原始3D数据转化为可实时渲染的场景。Aholo Viewer直接提供了一条完整的工具链:
格式兼容: 支持ply、spz、sog、splat、lcc、ksplat等主流3DGS格式。市面上常见的格式几乎都能直接吃进去,不用自己再编写格式转换脚本。
LOD生成: 自动将原始3DGS数据转换为分层细节的流式资源,开箱即用。你只需丢入一个原始文件,后续所有处理都自动完成。
物理碰撞体生成: 这个功能很有创意。它可以把3DGS重建的空间转换为可查询的碰撞边界,支持射线检测、胶囊体碰撞、地面检测、墙体阻挡等。你可以在3D场景内启用行走模式、第三人称相机避障、区域限制等交互,而不止是被动漫游。
下面的演示展示了行走模式下的碰撞检测与交互效果:
此外,群核Aholo空间智能平台还开放了云端渲染、空间重建、3D AI模型生成等一系列API。云端混合渲染可以将3DGS与高保真Mesh放在同一个场景中,在云端实时混合渲染并串流输出。空间重建允许你仅凭一段视频,就将物理世界1:1复刻到数字空间。而3D AI模型生成支持图生3D和文生3D,能产出材质细节更丰富的模型,并顺畅接入3D内容生产工作流。低配设备也能流畅预览高精度场景。
同时提供多档位渲染配置:效果优先、性能优先、极限性能三种模式,按需平衡性能与画质,适配不同设备和场景需求。从数据输入到最终画面呈现,开发者几乎不再需要依赖第三方工具。
开发者社群基于Aholo Viewer已经探索出不少有趣的项目,比如游戏场景和数字化博物馆:
快速开始:五分钟上手Aholo Viewer
只需一条命令即可安装依赖:
npm install --save @manycore/aholo-viewer
如果想先不写代码直接体验,可以访问官网Playground在线玩耍:
aholojs.dev/zh-CN/playground
3D互联网这件事似乎正在加速成为现实,一切开始变得有趣起来。



