WebGPU尚未发布,Orillusion提前公测,我们和创始人聊了啥?
1. 您好白老师,很荣幸有机会采访到您,先简单介绍一下您自己?
大家好,我叫白景文,目前是Orillusion 创始人 & CEO。2012 年本科毕业于北京邮电大学,同时取得英国伦敦大学玛丽女王学院双学士学位。本科毕业后,获得国家建设高水平大学公派留学直博项目奖学金,前往英国伦敦大学玛丽女王学院攻读计算机博士学位。博士毕业后,加入帝国理工大学数据科学实验室,进行数字渲染可视化方向的博后研究工作,主要负责全球数据观察站 GDO 分布式渲染架构的设计和研发。目前在国内创业,成立北京鸥睿零世科技有限公司。专注于基于WebGPU标准的Web3D引擎底层技术研发工作。
2. 您之前在学术领域做了近10年,为何考虑创业?
很多事情都是“缘分”。我早接触 3D 是在 13 年,真正开始入坑是在15年,组织了几个兴趣相投的同学参加了 Oculus' Mobile VR Jam 2015,算是早的 VR 内容创作参与者。当时我们用的还是三星的 Gear VR 设备,通过 Unity 完成了一个简易 VR 版“密室逃脱”。之后,对 3D 领域就产生了浓厚的兴趣。
博士毕业后,选择了3D渲染方向的博后工作机会,来到帝国理工大学进行学习和研究工作。随着海外SketchFab的崛起,国内也出现了很多类似产品包括的墨多客、腾讯磨坊等等。当时,预感到通过Web平台来展示和分享3D内容,有非常大的优势。因此,决定尝试结合Research和Industry的不同特点,边学习边开发一款类似于SketchFab的3D内容分享平台。经过和另外几位小伙伴半年的努力,产品成功上线。这也是我们后面一直致力于从事Web3D方向产品研发的基础,很多当时的代码一直陪着我们走了近10年。
随着元宇宙的概念的提出,它必将成为下一代社交、媒体、娱乐、消费、工作、生活的空间平台。我们认为元宇宙肯定不是一个或者几个独立的超级APP来构建的,而应该像World Wide Web (3W)开放网络一样,通过统一的标准,保证我们随时随地接入元宇宙,并且在任何设备上都可以获得相同的体验。这样的一种开放元宇宙形态,可以让我们自然的想到通过Web浏览器做为Access入口。未来构建元宇宙复杂空间,内容开发和创作是里面非常核心的一环,也是渲染引擎的主要任务。现有的Web渲染引擎,更多的是基于WebGL实现,虽然有很明显的性能瓶颈,但是已经创造了Web3D丰富的内容生态,随着新标准WebGPU的推出,才是真正能使得浏览器逼近原生图形API渲染效果的终解决方法。当下市面上大部分Native渲染引擎比较重,适合专业场景,学习成本高,创作门槛高。因此,我们决定打造一款完全开源的基于WebGPU标准的轻量级渲染引擎,目标是在浏览器中实现桌面级的渲染效果,同时支持超大复杂场景的3D呈现,降低3D内容创作门槛,让更多的人参与进来一起铸造未来的3D世界。
3. 您以前的个人经历对您当下的工作和选择产生了怎样的影响?
思维方式的改变,也就是认知的改变吧!
我自己并不是学霸,高考失利后的不甘,让我鼓起勇气选择去衡水一中复读。关于“衡中”的传说很多,但是对我来讲,它终给我的不只是一份满意的高考答卷,更重要的是给了我一份永远不怕失败的坚强和勇敢向前的毅力。那一年过后,我感觉没有再大的压力我扛不住,也没有再难的事情我做不成。
在博士期间,做Research的同时,我特别喜欢研究新的产业技术,经常给自己设计一些小项目,小应用。边学习,边思考,边实现。当然很多都是跟3D和VR/AR相关,也恰恰这种综合的多领域的技术研究积累,在选择博后研究工作时,帮助我赢过了几个Local的候选人,终拿到了帝国理工大学的Offer,负责全球数据观察站(GDO)的分布式渲染架构的设计和研发工作。这次经历也让我认识到,不要被自己的*佳“舒适圈”所限制,强迫给自己更多的选择和可能性,努力打破自以为的天花板,会发现新的世界一直都在那里。
后来再次选择突破自我,放弃了Reseach,选择创业,这也是我成长大快的经历了。期间有糟心的故事:穷过,用自己的积蓄来发工资;被骗过,十几万块钱至今也没有追回来;被恶意“合作”过,要到我们的核心产品后直接抄;当然也有在关键时刻贵人相助:迷茫时期帮着一起想主意的创业伙伴,弱小时期依然选择相信我们的KA客户,成长时期愿意一起陪我们共担风险的资本VC等等。经过这几年的创业经历,让我明白,我们的人生一半是掌握在自己手中,另外一半其实是奇妙的运气。而掌握在自己手中的这部分要做到极*致,剩下的交给掷色*子的人,所谓尽人事听天命,只求不愧对自己的内心。
我喜欢当下的选择,也享受当下的选择。愿意折腾,不停的挑战自我,突破自己的上限,看看到底自己有多少可能,产品和公司有多少可能。这也就是创业的魅力吧。
4. 在自研工作中曾遇到过哪些问题?又是如何解决的?
我们坚信WebGPU是未来Web3D的方向,因此我们的引擎框架是完全基于WebGPU标准研发,而没有考虑兼容WebGL。这样的优势是完全没有历史包袱,可以更有针对性的进行极*致的性能优化,这是我引擎。我们引擎大的特点。当然,做个吃螃蟹的人,就意味着这同时也是我们面对的大的困难和挑战。
首先,很自信的说,我们在四年前就开始关注WebGPU的发展,是国内早涉足WebGPU标准引擎研发的团队。同时,我们的引擎团队具备十年以上Web3D引擎研发行业经验,甚至是从Flash时代,就已经和Web3D结缘,都是身经百战的老兵。图形算法的底层逻辑是相通的。这是我们有选择新的标准来做一款全新引擎的信心来源。但是,在研发初期,由于WebGPU的标准仍然处在早期阶段,API的变化频率比较高,经常今天做好的功能,明天就无法正常使用了。甚至,不小心升级一下浏览器的版本,整个项目就无法运行了。 而使用WGSL这种新的 Shader语言,对于一些算法实现、优化、封装也会有一些探索尝试性的工作需要耐心去实践完成。这些情况还是有些影响我们的研发进度的。
因此,我们和WebGPU标准的核心研发团队-Intel Web Graphics Team和Google WebGPU Team,在初期就取得了直接联系,他们都表示非常关注我们的WebGPU引擎发展,而且为我们在WebGPU使用中遇到的Issue提供针对性的解决方案,这也让我们在引擎研发的过程中得到了更大的支持和信心。
可以说,WebGPU的整体生态还处在一个非常早期的阶段,而我们恰恰处于全世界的梯队。我们相信,提前布局一件未来肯定是正确的事情是值得的。
5. 可以简单描述下Orillusion的技术架构和优势吗?
从整体上来看,首先Orillusion是基于浏览器的Web渲染引擎,采用了新的WebGPU标准来提供底层的图形能力。引擎的整体框架也是采用了现代引擎遵循的ECS组件式架构。同时,考虑到整体项目的复杂度和规范性,采用了更为严谨的*cript作为开发语言。基于整体的这些特点,我们在Web3D引擎领域,做出了非常多世界*领先的技术实现突破。通常Native引擎才具有的能力,在Web上依靠WebGPU也都得到了非常好的实现。
从技术上来看,我们实现了集群前向渲染和动态全局光照,使得整体的3D场景计算效率和渲染效果得到了质的提升;通过DO连续内存存储和WebGPU的Compute Shader,实现视椎体剔除功能,减少额外的场景计算消耗;实现基于GPU的骨骼动画系统,通过并行计算能力更高效的支持更复杂精细的动画场景;正在利用Copute Shader开发基于GPU的物理引擎,可以高效实现粒子,软体,钢体等仿真能力。引擎还处于不停的快速迭代升级阶段,很多其他已经实现的技术和正在实现的技术,都将因为WebGPU标准的出现,给了Web3D领域巨大的想象空间。
当然基于浏览器的Web环境,天然的也赋予了我们很多应用层面的优势。比如易分享,易协作、易上手,跨平台等等。通过我们Orillusion引擎可以更加方便的在浏览器中体验到近乎桌面级的渲染效果。
6. 如何理解国内开源生态链,有什么关于开源方向的意见和建议吗?
开源不等于免费。曾经,国内主要是开源世界成果的享受者,所以长期以来会给大家留有一个印象就是开源的项目就是免费,为自己做的产品赚钱。客观讲,这确实是可以的,但这个过程并不是开源的本质。
开源不等于公开代码。如果只是把项目代码公开放到Github或者Gitee上,只能说这是初级的开源形式。在当下,一些是技术KOL或者明星团队,曾经有过比较成功的案例,这样诞生的开源项目的确会很快吸引到社区关注,也很快能为社区发挥价值。但开源发展到今天,社区里充满了各种开放源代码的项目,其中有兴趣项目或者是学习实验为目的的业余项目。相当于只是把源代码放到一个公开的网盘上,其实很难真正的被大家看到,即使项目很也很难被快速了解它们的价值。即使跨过很难被看到的初期阶段,后续项目更新迭代不规律,节奏慢,或者说是项目文档不完善,社区交流不及时,也很难让项目被广泛应用到生产环境中,也就慢慢失去了关注。简单说,当下的开源是需要长期维护和运营的,而且这至关重要!
我理解开源是一种开放、共享的创新协作模式,它突破物理边界,通过高效敏捷的沟通和协同,实现技术创新。技术人员可以花更多的精力放到创造性事务上,而不是做重复性的工作,也就是我们经常说的避免重复造轮子。从整个软件产业的供应链上看,开源已经成为未来信息技术的主战场。
通过开源生态的开放自由属性,可以降低学习、复用和改进成本,打破技术封锁。无论是在全球还是国内,开源必将会为未来数字经济的发展带来新活力,推动着信息技术数字经济的创新发展。
对于国内来说,开源发展起步较晚,国内的开源基础软件需要更多的时间。所有想参与其中的角色,不论是技术人员,开源公司,还是投资人,都需要更大的耐心!
7. 开源 Orillusion 的契机和底层逻辑是什么?
我们来看一下World Wide Web世界(Web世界)。Web的繁荣首先得益于HTML标准的发展,当然还包括JS和CSS。有了统一的HTML标准,才有了网页内容呈现的基石,人们才能在同一标准下创造丰富的互联网内容。如果我们做的网页内容,用的是不同的语言、格式或编译解析逻辑,这肯定是行不通的。当然有了统一内容呈现的标准,还需要内容传输的标准,那就是HTTP协议。它不仅可以传输HTML内容,还可以传输声音,图片,视频等。当然还有各种各样其他的技术和标准,比如cookie/cache/server/security等,构成了一个开放的Web世界。我们可以通过浏览器自由的穿梭,也可以通过搜索引擎获得想要的信息。
随着元宇宙或者VR/AR概念的火爆,将彻底改变各种内容呈现的形式,从文字,到图片,到视频,后再到3D。虽然3D内容的标准统一还需要时间,但终一定会实现。因为这种统一的本质是人类知识积累形式的要求,Web世界中的内容都是人类知识的体现。USD目前被认为可能会成为未来3D世界的HTML标准,这一点上英伟达已经做出了领先,而且Ominiverse,利用USD已经实现了3D内容创作的平行化打通,把整个串流的工作流变成了并行的工作流,大大提高了效率。我们非常期待国人也能出现自己主导和引领的3D模型格式标准,来推动元宇宙时代的发展。
对于知识的承载必然发生在一个开放的世界当中,这也是我们更加坚信元宇宙的入口属于开放Web世界,而不是独立的超级APP。对于Web这样一个天然的开放世界,原本就有良好的开源传统,已经孕育了大量开源项目,比如Vue.js, React.js, Three.js, Babylon.js等。作为Web开放世界中的组成部分,Orillusion渲染引擎也将以开放心态,完全开源的形式来加入元宇宙世界的创造中。
更重要的一点,Web环境中一直没有出现可以实现和桌面级渲染能力相媲美的革命性技术,然而这一现状随着WebGPU标准的提出,即将得到改变,这是非常让人振奋的变革,我们将迎来网页图形的全新时代!
Orillusion在创立之初就坚定地拥抱开源,开放包容、共创共赢是基本理念。通过开源可以帮助社区更好地了解技术,也可以通过社区影响力对技术进行推广,邀请更多开发者参与。社区积极快速反馈也能帮我们汲取更多的需求场景输入,帮助技术迭代更新。期望在未来的数字经济时代能够发挥更大更积极的作用。我们一直坚信,软件再,如果没有构建起良好的生态,没有开发者和合作伙伴的共建,是很难走得更好更远的。一个开源产品,社区的文化氛围和协同创造力,才是区别于他人大的不同。在社区共享、共创、共赢,将会激发出无限的创造力,这就是开源大的魅力!
8. 您认为未来的 3D 渲染工具市场会形成怎样的格局?在其中,Orillusion 会占据怎样的地位、会发挥什么样的作用?
一个3D应用场景的搭建一般需要4步:建模型,搭场景,编逻辑,发应用。每一步都有成熟的产品和解决方案。比如建模型可以从无到有的创造3D内容,或者通过用激光雷达(Luminar、LiDAR)采集周围环境信息来生成3D内容,后要通过3Dmax和Maya这类建模软件完成。搭场景和编逻辑,让独立的 3D 模型变成更加丰富的场景,同时用代码赋予其应用逻辑,让场景动起来,变成真正的3D应用,我们的游戏就是这样的一个制作过程。这个过程在桌面级应用里已经几乎被Unity和Unreal统治了。后的发应用,其实就是各种云服务厂商领域,我们要建立各种云服务和数据库来支持3D应用的正常运作,当然很多国内企业也有私有云部署的需求。
目前我们处于一个3D应用场景爆发式增长的前期,随着元宇宙持续的发展,无论从技术人员还是设计师角度,都需要大量的生产力来满足未来更多的3D内容制作和呈现需求。专业级应用固然有它的优势,但我们认为轻量级的解决方案可以降低3D内容制作门槛,覆盖更多的用户。我们相信,未来元宇宙入口很可能不是一些独立的超级APP来构建,而是依托于浏览器的开放的Web世界。Web生态中的巨量的技术人员,都可以为元宇宙时代做出贡献,这是非常令人兴奋的事情。
未来构建元宇宙复杂空间,内容开发和创作是里面非常核心的一环,也是渲染引擎的主要任务。目前,在Web生态中,大的一个空白就是缺少一个底层的平台级的引擎产品。我们认为一直没有出现的原因是Web的发展原本比Native慢很多,而WebGL时代虽然Web3D内容已经得到了极大的丰富,但由于性能原因,企业和技术人员很难有动力花更多精力去做应用创新。就比如3G时代不可能出现移动支付和短视频,因为技术实现的前提还不成熟。但是有了WebGPU,情况就有可能得到彻底的改变。
这是我们Orillusion正在探索的事情,这是个非常前沿且非常有挑战的事情。我们更多是在思考怎样在这样一个全新的轻量级Web赛道,利用好它的技术优势和场景优势,捉住好的时机,在底层搭建一套完整成熟易扩展的通用底层基础工具。
这是一个新技术支持的新赛道,面临的是一个未来具有非常大想象空间的新场景。做好底层技术,搭建基础能力,面对随时出现和爆发的未来场景,是驱动我们前进的逻辑。而这也是我们开源的内在驱动力,是我们快速获得创新的有效的方式,期待和业内广大技术人员一起思考,共同进步。
9. Orillusion引擎下一步规划是什么?
Orillusion引擎的下一步规划非常明确,就是全面拥抱AI。从根本上降低3D内容的创作门槛。
近大家都已经被ChatGPT的相关内容刷屏。由于OpenAI目前并没有对新训练模型进行开源,导致中国企业如果做出类似的产品,从技术算法角度来看可能至少需要一到两年的时间。但是“大模型”的训练不只是单纯的算法问题,还需要算力和数据的支持,所以这导致可能需要更长的研发迭代时间。
• 算力指的就是芯片(GPU):“大模型”训练需要效率更高的更先进的芯片工艺支持,由于技术封锁,目前看很难在14nm以下的制程上快速实现国产化的突破。
• 数据指的是有价值的标注数据:国内的企业很多都会把平台内容当做私有财产,放到自己的APP里,无法公开的被获取到。海外的主要互联网内容几乎都有Web版形态,这样会便于通过搜索引擎进行数据分析。有了大量的原始数据池,才能激励完成优质数据的标注工作。
因此,我们更加相信开放的Web生态在元宇宙时代前景非常光明。虽然从AI的infra层来看,国内确实需要努力追赶。但是基于infra层的商业应用和模式创新,才是AI行业真正的爆发点。我们做为一款开源的引擎产品,它诞生天必然就是面相Global市场的。所以,我们必须尽早的介入AI领域,利用现有的Infra层的基础能力,做好数据准备工作。数据的准备需要大量的时间和经验,需要不停的实验和摸索,基于现有的LLM怎么生成高质量的数据,是非常值得探索和研究的事情。有了高质量的数据才是未来AI时代,真正的企业护城河壁垒,才能实现AI赋能行业的终目标。
10. 对准备创业的小伙伴有哪些意见和建议?
1. 首先,要理解什么是创业,这对是否选择创业是非常重要的。
“创业”和“作坊”、“生意”、“买卖”这些词儿,虽然很多人都在混用,但是我认为它们之间还是有一些本质区别的。我自己经历到现在,对于“创业”真的是有很强的敬畏之心的。因为我把创业和其他区分开的唯*一的标准就是:拿到市场化VC的认可,也就是获得真正的市场化基金的投资。“作坊”的特点就是,人少,活多,干的挺累,赚的不多,没有管理,没有规划,来一单做一单,做一单是一单。其实,我觉得很多创业者可能都经历过这段时间,有的人熬了过来,而大部分人可能就放弃了。可以拿到市场化基金投资的创业,其过程更加专业,更加复杂,也能承载更大的可能性。
2. 其次,可以思考下创业需要哪些条件。我自己总结为四点:
• 性格:主要是创始人的性格,是不是爱折腾,能折腾。欲戴皇*冠,必受其重,能不能忍住孤独,抗住压力,孤注一掷的坚持到底。
• 团队:一个人是什么都做不成的,团队才是成功的基石。人在,希望就在。创业需要的永远都是一个钢刀连,不是某个特种兵。而且,创业团队没有好的,只有合适的。建立起团队后,需要对团队的每个人负责,因为他们背后代表的是一个个家庭。
• 资金:没钱的时候,就自己多花时间,用本来可以正常工作赚钱的时间,去实践自己的创业想法。即使失败了,也会有收获。如果拿到钱,那就开始了创业的步。切记,别人的钱是当下对你的认可,而你要兑现的是未来的承诺。
• 运气:都说创业九死一生。我们的人生一半是掌握在自己手中,另外一半其实是运气的成分,创业过程也是如此。掌握在自己手中的这部分你必须全力以赴,努力做到极*致。如果运气到来,你要非常敏锐的感知到它,同时必须有把握住它的能力。
3. 后,踏上创业征程的小伙伴需要,仰望星空,脚踏实地。
创业要“眼高手低”,目光看得远,但是要踏踏实实的做好当下的事情。时时刻刻提醒自己,踏踏实实做事,认认真真做人。尽量不要被外界的好消息或者坏消息影响。要想成功,你首先不能下牌桌,要努力活着。
相关文章