元宇宙底层技术挑战与产业应用前景探讨

作者：每日干货分享

发布时间：2025-11-13 20:14:23 浏览量：1 0

源起于科幻小说的元宇宙概念，已然在真实世界里成为流行语，围绕此新兴概念，一场涉及产、学、研的实践正渐次展开，在数字化转型进程中，元宇宙究竟可否承担重任，这些新概念于中国语境里怎样实现落地，为此南财合规科技研究院数字娱乐课题组精心策划了《瞭望元宇宙》系列报道，旨在为行业以及社会公众提供用以理解元宇宙的敲门砖。

数字人身为元宇宙的“原住民”，成了近些年来业界以及学界探讨的关键要点，当下业界普遍觉得，数字人的大规模运用依靠高写实度的成效、良好的生产效率以及可控的成本。然而与此同时，终端的运行加上算力方面的需求对实时云渲染能力构成了挑战。在系列报道的第六篇里，我们探究元宇宙赖以运转的底层技术，以及其背后的实际产业应用。

近些年来，伴随人工智能、虚拟现实等新的技术迅速地发展，虚拟数字人开端步入平常人的生活，在新奇的外观形象、灵巧的互动效果以外，行业也正挖掘出数字人更多的潜力。

郭建君是蔚领时代的创始人兼CEO，其在接受21世纪经济报道专访的时候表明，未来数字人的发展呈现出从静态变为动态、从2D转向3D、从卡通朝着写实、从单向迈向多向互动的趋势，数字人领域如今已度过萌芽期而进入快速成长阶段，在不久的将来会迎来爆发期，这也意味着行业开始进入商业化变现探索的关键阶段，标准化也将慢慢建立。

可是放在丰富的想象空间以外部分呐，一些能够落地的问题呢，依旧困扰着从事相关行业的人员和使用用户，在往后的日子里呀，数字人能不能够达成高度的实时性，能不能够拥有高度的可灵活性，能不能够很好地适应落地的场景，并且和人类开展有效的交互呢，这仍然需要时间去进行验证呀。

面临品质成本双难题

《虚拟数字人发展白皮书》由中国人工智能产业发展联盟发布，其显示，“虚拟数字人”一词最早源自1989年美国国立医学图书馆发起的“可视人计划”（Human，YHP），2001年，国内以“中国数字化虚拟人体的科技问题”为主题的香山科学会议第174次学术讨论会提出了“数字化虚拟人体” 的概念。

但处于当时那个时候，这些被称作“虚拟数字人”的，主要是针对人体结构的可视化而言，会以三维的形式去显示人体解剖结构的大小情况，以及其形状如何，还有所处位置怎样，以及器官彼此之间相互的空间关系是怎样的。这跟当下所探讨的元宇宙里的“原住民”数字人，在含义方面存在较大的出入。

深度学习算法在近五年取得突破，籍此，数字人的制作过程被有效简化，进而虚拟数字人开始步入正轨。

同时，这也吸引到政策层面的关注。

北京市经济和信息化局，在2022年8月，发布了国内首个数字人产业专项支持政策，也就是《北京市促进数字人产业创新发展行动计划（2022—2025年）》，也被简称为《计划》。《计划》提出，要抓住以数字人为代表的互联网3.0创新应用产业机遇，充分发挥国际科技创新中心建设优势，打造数字人产业创新高地。

《计划》提出了发展目标，到2025年，北京会培育1至2家营收超过50亿元的头部数字人企业，会培育10家营收超过10亿元的重点数字人企业，会建成10家校企共建实验室和企业技术创新中心，会打造5家以上共性技术平台，会培育20个数字人应用标杆项目，会建成2家以上特色数字人园区和基地等目标。

却行业当前状况好像同《计划》所提出来的目标依旧存在着一定程度的差距，《21世纪经济报道》的记者通过多种途径了解得到，就目前情形而言，部分企业于塑造数字人的进程当中依旧会碰到诸如渲染质量欠佳、制作所需成本高昂，以及IP塑造周期漫长等诸多难题。

京东集团副总裁，京东智能产品与服务部总裁何晓冬，在接受21世纪经济报道采访时称，数字人是数字原生、人机交互等技术落地阶段中，极为被寄予希望的形态之一，然而在实际应用进程里，有些数字人的动作相当僵化，仅能起到展示作用，没法提供实际办理业务的交互。

何晓东拿银行场景的数字人来举例，讲道，要是数字人想把整套银行业务给办理妥当，就得攻克几个特别实际的问题。“头一个是得避开噪音，毕竟银行柜台是较为嘈杂的地方。再一个是银行数字人得和后台的业务支持系统有成效地对接上，务必能够处理许多银行具体的业务问题。”何晓东举例表明，转账、取钱、改密码等业务行为，无不意味着数字人在知识推理、语音推理等方面都得达到很高的水准，所以这些方面的同步也是相当大的挑战。

三种商业模式

郭建君在采访当中也表达过类似的看法，他讲道，数字人成熟的背后，一方面存在技术整合能力，另一方面具备IP运营能力。数字人是一个产业链很长的领域，既需要底层引擎技术的进步，又需要对上层工具以及生产管线进行优化，才能够同时达成数字人形象良好、生产效率高以及成本可控制的三重成效。

IP运营能力展现于对数字形象塑造的思路与经验当中。郭建君讲，当前行业较为常见的情形是，技术制作更具信心，运营思维相对匮乏。在这一领域，蔚领时代正在探寻的一条路径是——挑选更专业的生态伙伴共同开展商业化活动。

近日，蔚领时代跟文娱企业海西传媒集团一块儿组建了个独立运营的公司蔚海灿娱，推出了龚俊的数字人“霁风”，郭建君讲，后续会围绕可互动数字IP的矩阵搭建、共创虚拟空间的构建等方面开展多重合作。

需特别指出的是，借助契合特定场景的 IP 来加速表演型数字人创新属于《计划》所规划的主要任务范畴，它提出要推动技术人才与艺术人才展开联合创新，加速数字人 IP 的孵化进程，培育创作者经济，与此同时打造精品数字人品牌，支持数字人投身广告营销、品牌代言活动，强化数字人运营管理工作，树立并传播正能量的数字人形象。

实际上，从事IP运营，提供客户服务以及进行流量变现，恰恰是当下数字人主要具备的三种不同的商业模式。

腾讯云在近日发布了《数字人产业发展趋势报告（2023）》，该报告指出，内容/IP型数字人的商业变现主要是依靠数字人的商业IP运营来达成，功能服务型数字人是通过交付给客户从而实现变现，至于虚拟分身，则是需要结合虚拟空间的设定以及规则来进行流量变现。

内容/IP型数字人，更多是项目制，以定制为主;功能服务型，是产品和定制化相结合，在通用产品上，进行定制化开发;虚拟分身，更多是产品制，用户利用平台工具产品进行数字人形象的制作并在相应虚拟场景内进行活动。三种数字人的制作方式和周期存在差异，数字人的制作成本和周期伴随定制化程度的下降而递减，一般而言，内容/IP型数字人的成本和周期最高，虚拟分身型数字人最低。

大规模应用依赖可控成本

有三个条件是数字人的大规模应用必不可少的，那便是，要有高写实度的效果，还要有较高的生产效率，再者要有可控的成本。在郭建君看来，虽说对比传统离线渲染的影视级别的写实度效果来讲仍然是需要提升的，不过当前行业应用的实时渲染的技术，在生产效率方面具备了优势，在可控成本方面具备了优势，在数字人可互动性方面同样具备了优势。

向21世纪经济报道记者讲述有关情况的，是身为科技部信息通信专家，且担任上海流程智造科技创新研究院院长这一职务的贺仁龙，表示构造虚拟世界的技术正逐步趋向成熟，其应用场景也越发丰富起来，所呈现的效果也极为逼真，然而在感知交互这一方面，数字人依旧面临着一连串的问题。

于创建元宇宙之际，会去构造一种世界的秩序以及逻辑呢，然而这个世界究竟有没有重力呀，重力又到底是多少，就目前情形而言，统统都是技术所要探索的方向哟。与此同时，虚拟世界的逻辑得靠规律以及算法来生成呢，在这一过程当中呀，怎样能够有效地让数字人在视觉、听觉之外的情况下，与用户展开触觉感知交互呀，这同样是行业所面临的难题呢。

郭建君觉得，未来超写实世界会把可视化当成主要特性。实现这样的世界得进行海量图形运算。VR/AR终端会成为元宇宙入口，不过终端运行依靠算力的高速运转，而实时云渲染能力解决的就是将超写实的世界引进到终端体验上面的问题。

只有当云端实时渲染处于达到较高标准的情形下，才能够切实带来足够写实、具备互动性、拥有沉浸感的图像画质。这便是蔚领时代所认定的GaaS（ as a ）时代已然到来的逻辑依据。

郭建君觉得，往后给实时云渲染予以支撑的底层技术主要是云原生方面的技术，像多GPU协同渲染，还有借助C+S架构达成的单个进程输出几十路视频流以供几十个玩家游玩的技术。“这些具备创新性的云原生技术是未来元宇宙的支撑，与此同时，围绕着类似云游戏的串流能力以及云端虚拟化的能力，同样是未来元宇宙所需要的。”。

郭建君说道，有一个现象是可喜的，我们看到头部渲染引擎的技术发展得很快，现在已经开始将其应用于影视级效果了。

在云原生技术以外，3D重建技术的进步，也给数字人的大规模实现，带来了更多的潜在机会。

上述那份《报告》明确指出，2D数字人与3D数字人的生成以及建模方式存在差异，2D数字人其本质是进行图像生成，所以主要的方式乃是借助深度学习技术，依据视频来生成和真人一模一样的图像，这种技术相对而言较为成熟。

3D数字人要建立3D模型，其方式主要有利用软件传统的手工建模，还有静态扫描建模，也就是相机阵列扫描建模，另外还有动态光场或者AI建模，即通过3D重建技术来生成3D模型。当下手工建模和静态扫描建模技术比较成熟并且应用范围广泛，借助3D重建技术或动态光场重建能够极大地节约建模时间，提高建模效率，这是未来至关重要的布局方向。报告指出。

在科大讯飞总裁吴晓如看来，机器若要更自然地同人类展开交互，需借由听觉获取信息，需借由视觉获取信息，需借由语义获取信息，还需借助各种传感器的组合去获取更多有用信息，如此一来，AI感知方式定然要从单模态朝着多模态发展，并且要逐步实现拟人化。

在2021年10月的时候，科大讯飞正式发布了AI虚拟人交互平台，该平台具备多模感知这一交互特点，它还具备多维表达这种交互特点，以及情感贯穿这一交互特点，还有自主定义这一交互特点。它能够在客户的不同业务场景之下，对AI虚拟人进行赋能，进而提供一站式的AI虚拟人应用服务。

目前，科大讯飞所推出的数字人，已着手将视觉、手势、视线以及语音予以结合，达成数字虚拟人交互的多维表达。对此，吴晓如在接受包括21世纪经济报道等媒体的采访时这般说道。