首页 每日干货分享 后起之秀真人复刻数字人:利用多项技术完美复制实体人

后起之秀真人复刻数字人:利用多项技术完美复制实体人

发布时间: 浏览量:22 0

后起之秀,“真人复刻数字人”实现弯道超车

存在着一种数字化的事物,它被称作真人复刻数字人,其所具备的形象包含2D或者3D的样式,这种事物是借助计算机视觉、图形渲染、动作捕捉、深度学习、语音合成等诸多先进技术而形成的,它能够在外观形象、行为表达、思想交互这三个方面达成对实体人的完美复制,进而成为一种数字化的存在。艾瑞咨询做出了预测,指出真人复刻数字人将会历经三个阶段,并且在《流浪地球2》当中皆有具体的体现,体现在图2那里。

图 2 真人复刻数字人发展的三个阶段与特征

来源:根据相关资料绘制

第一阶段,是借助CG技术的这个阶段来实现对真人表情以及动作予以还原的阶段,像是影片里头已经去世的那个香港演员吴孟达,那便是依靠CG技术所渲染塑造出来的虚拟形象 。 第二阶段,是运用脑机接口把意识、记忆植入到数字备份里,并且凭借电脑进行还原的一个阶段,比如影片当中已经逝世的图丫丫,仅仅能够反复做出预设好的程序化动作,去开展简单的初步对话 。 第三阶段,是经由量子计算机实行深度神经网络的学习,从而对思维以及意识进行全面还原的一个阶段 。像影片里死去的图恒宇,他的数字分身一块儿进入图丫丫身处的虚拟空间,开展实时交互 。

虽身为新兴于数字人领域者,可无疑之事乃,真人复刻数字人于数字人行业所呈趋势恰似“星星之火,可以燎原”那般。数字人行业正历经一场变革,除于舞台之上正气势磅礴施展身手的头部企业外,亦为中小企业演绎展出全新的使其得以进入此局之机遇。

当下,那些有着提供真人复刻数字人服务想法的中小企业,或者是打算借助数字人特性来推动业务发展、促使场景实现升级的中小企业,面临着两大需求,其一为进入元宇宙虚拟空间的数字形象需求,其二是用户针对数字分身开展内容创作的需求。基于这样的情况,本文着重探讨即将投身数字人赛道的中小企业,在面对B端和C端时该如何进行抉择,从而达成真人复刻数字人的商业价值最大化 。

避实击虚,于B端方兴未艾,寻C端蓝海商机

于数字人赛道之上,一场革命正悄然而起。自2020年起,人工智能技术迅猛发展,数字人企业如破土春笋般纷纷涌现,引得无数资本予以关注。截止至2022年9月底,中国数字人市场投资金额相较于2021年增长至四倍,达14.96亿元。清华大学所发布的《虚拟数字人研究报告2.0版》表明,数字人已然渗透至各行各业,成为新一代的生产力与创造力。从头部企业的布局情况来瞧,数字人产品服务于B端占据着79%的市场,不过在C端的占比只为36%,很明显,B端是当下头部企业数字人布局的重点领域(图3) 。

图 3 “人-货-场”的B端应用路径

来源:根据相关资料绘制

头部企业进入B端赛道开始切入,主要是依照“人-货-场”的发展路径来进行,并且构建起了完备完整的数字人产业链情况。不管是数字人IP的市场,还是功能型数字人的市场,亦或是AI员工的市场领域,头部企业在基础层以及平台层已经搭建建立起了较高水平的行业壁垒级别,比如说,占据基础层的微软、Unity、英特尔等企业,占据平台层的网易、科大讯飞、腾讯等公司。而围绕C端来讲方面,真人复刻数字人的应用场景主要划分分类为功能服务型和数字分身型这两种类型。人工能力在虚拟空间里得以增强的功能服务型数字人,像数字员工、数字助理那般,能够轻易应对各式各样的工作任务。数字分身型数字人作为真人人格化的身份代理,推动着虚拟空间之中的内容生产与创作。

那种规模相对较小的企业,又究竟该通过怎样的方式,去抢占数字人赛道的先机呢?撰写文章的人士觉得,规模不算大,数量较多,经营品种单一的企业,应当把重点放置在面向消费者的内容层面,借助企业自身所拥有的技术,以及人工智能平台,为依照真人原样复制构建的数字人赋予能力(图4)。

真人复刻数字人_ai数字人怎么训练_真人复刻数字人技术

图 4 数字人产业链的分类图

来源:参考《数字人产业发展趋势报告(2023)》自行绘制

在这个方向上,有部分从事元宇宙的企业抢先进行了面向C端的创新应用场景探索。比如说,优链时代借助3D云阵相机对实体真身展开扫描,进而生成极为逼真的数字分身,再把该分身植入到各种各样不同的场景里,以此让用户体验各不相同的生活形式。像你能够与梅西、C罗一同进行踢球活动,也能够穿越至古代庭院之中,又或者在杭州西湖的湖畔进行漫步。而容积视觉运用的是3D动作捕捉加上场景投射的办法,使得用户能够把自身或者他人转变为任何一种角色,并且将这个角色投射至现实的空间之内。你能够跟你所喜爱的明星、动漫人物、历史人物之类一同合影,还能够制作出各类有意思的视频以及照片。容积视觉研发了一个被称作“72变NPC”的APP,使得用户能够在任何时间任何地点召唤自己扮装而成的NPC角色,跟其展开虚拟互动。另外,刹那元宇宙是一个基于Web3.0的面向大众的元宇宙社交空间,让用户能够创建自身的数字孪生形象,并且拥有属于自己的live house小宇宙,于数字世界里分享生活中的点点滴滴。刹那元宇宙具备这样的功能,它支持用户之间的跨空间互相访问,这使得用户能够在不一样的元宇宙里展开探索,还鼓励用户去交友,如此这般。

作者持有这样的观点,即对于中小企业来讲,当它们踏入真人复刻数字人C端赛道的时候,将会迎来四个方面的机遇 ,。

机遇其一政策导向,2023年两会期间引发一场AI革命,此革命让全国人民见识到AI的无边无际的可能性,科技部部长王志刚在会上表明,“AI是未来的重大方向、重大领域,我们需把控场景驱动与用户需求这两个关键要点”,且明确地提出了支持数字人赛道的政策举措。

机遇之二,是资本一拥而入。在2022年的时候,数字人赛道的资本融资呈现出热度,这种热度表明,“交互”以及“内容制作”稳稳占据着投资热词首位。各种各样的资本纷纷投身进入到数字人赛道的探寻之中,从而为中小企业给予了足够的资金支持。

机遇三,是用户需求,伴随元宇宙时代来临,用户对真身形象的需求越发多样且个性化,中小企业能够针对不同层次的用户需求,给出不同类型的真人复刻数字人本服务。举例来说,针对那些仅需基本形象的用户,能够提供2D数字形象的生成业务;对于那些对形象、动作或者神态有着一定要求的用户,能够提供3D动态的真人复刻数字人的生成业务;对于那些追求极致体验以及沉浸感的用户,能够提供全息投影或者神经连接等高端技术方案,附带高度自由化的数字内容创作服务 。

机遇这个方面的第四点,是技术成本,传统的身份型数字人,其花费有所不同,一般来说,生成成本在几十万元至数百万元的范围,服务型数字人的生成成本分布相似。全部的制成所需要的流程,投入时间处于一至两个月这么来算。由该建模以及渲染所连带一起来产生的相关方面有这两个,一个是软硬件设备成本,另一个是动作捕捉这般来的场景搭建成本。这两个成本加起来,使得数字人视频每秒成本处于那个样子8000元到15000元的区间。随着虚拟引擎和图形渲染技术不断地发展,数字人的生成成本慢慢降低了。在2023年3月1日,Open AI开放的API接口,让中小企业能够较为轻松地生成具备多模态化的真人复刻数字人,且赋予这些数字人智能且灵活的对话能力 。这确实是一个典型事例,于AI为数字营销领域赋能的情景里,他们借助借助开放的API接口生成2D真人复刻数字人“优娜”,再结合语音识别技术,进而创建出一个智能客服或者能记录语音指令的员工 。除此之外,C端多模态数字人还能够承担个人助理、儿童照料、适老陪伴等诸多任务 。

不忘初心,重在C端,乘AIGC东风扶摇直上

中小企业选择真人复刻数字人的C端入局后,会面临选择何种具体模式发展的问题。作者觉得,当下最可行、便捷以及最易变现的渠道, 是从事真人复刻数字人的AIGC内容创作。而最为关键的地方在于,要落实到具体的垂直场景,按照客户需求进行相应设计,这才是入局时的“初心”所在。

AIGC+真人复刻数字人会碰撞出怎样的火花?

经Chat GPT掀起人工智能创作浪潮后,各大科技巨头纷纷投身竞争行列,AIGC迎来了前所未有的机遇与挑战,AIGC即AI,它是一种借助人工智能技术生成内容的应用,在Web3.0时代,内容生产方式经由PGC也就是专业制作以及UGC用户制作,逐渐转变为AIUGC即AI辅助用户创作以及AIGC时代(此为表1) 。生成式算法、自然语言处理(NLP)、人工智能学习融入知识图谱,被AIGC运用,打破了内容创作者创作限制,创作者能够较自如地做起二次精加工,长久看随数据、算法、算力要素持续提升增加增长增高增多等,创作者借AI技术创造出的还有超越现实的异世界。

表 1 PGC、UGC、AIGC的特征对比

来源:根据相关资料绘制

最为让人惊叹不已的是,AIGC能够达成真人复刻数字人的多模态化,也就是外观、声音以及动作这三者实现完美融合 。自媒体量子位觉得,AIGC在生成这一方面涵盖着基于线索的部分生成、完全自主生成以及基于底稿的优化生成 。在内容层面,不但涵盖图像、文本、音频等外显内容,同样还包括策略、剧情、训练数据等内在逻辑内容 。在垂直场景直接导入这种情况之下,抑或是进行模型生成动作的时候,比如说面临NeRF模型这种状况,仅仅只需借助大厂所提供的AI工具,像是Bing等等之类的,一款具备多模态化特征的真人复刻数字人便能够呈现在你的眼前了。

按照本文的观点来看,对于中小企业来讲,达成真人复刻数字人在细分情况里变现的这一行为,需要留意下面这三个方面:

真人复刻数字人_ai数字人怎么训练_真人复刻数字人技术

首先,避开大厂苦心经营多年的数字人场景,去寻觅具备特色以及需求的场景。比如说呀,借助数字人构建带有当地文化特色的旅游景点,还有乡村振兴项目,再者诸如远程医疗服务,以及老年人生活辅助层面,另外还有智慧城市管理等等,以此让用户体会到数字人与真实世界之间的互动以及融合,进而提升用户的沉浸感,包括真实感跟参与感,最终解决现实世界里所存在的问题。

其次,持续创新,迅速迭代,塑造高品质的数字人产物。要令数字人由平面图像转变为立体模型,从单一表达转化为多样化交流,就得持续优化技术与算法。以其为例,该公司聚焦于研发能够模拟真人感官体验的2D数字人赛道,从医疗、法律、直播带货三个场景着手,搭建数字人应用平台,使数字人的服务层级得以提升(图5)。当下,好多数字人方面的中小企业,都挑选了相似的策略也就是,在基础技术阶段做到深入、做到细致、做到扎实,接着朝着渲染、动捕,以及唇形这类技术难度较大3D数字人范畴进军,并且持续丰富场景化应用。

图 5 广州赛灵力2D数字人定制流程图

来源:供图

第三,要打造数字人业务闭环,需思考怎样从人工标注走向模型训练,再到深度学习以及自我迭代,并构建牢固的用户反馈。短期内,像视频生成技术那样能还原真人唇形、语音、语速、语调的,应是发展的重点所在。长期来看,以小冰公司为代表的实时互动技术才可满足元宇宙里的社交需求,从而给用户带来真切体验。在这一进程中,中小企业应凭借用户实时反馈优化数字人产品与服务。

未来,数字永生是“筚路蓝缕”还是“水到渠成”?

在往后的世界里,人类能够借助数字技术达成永生,这是个让无数中小企业竞相追逐的商业机会,还是个饱含挑战与风险的范畴,到底怎样把真人的外貌、行为、思想转变成数字化的存在呢,我们能够把这种存在称作“数字孪生体”或者“数字生命”,它们具备和原型相仿或相像的特征,不过也有着自身的个性与意志 。

当下,存在着两种占据主流地位的数字永生模式,其一为被动上传信息,仅仅留存拥有“数字记忆”的单向意识,其二是主动上传信息,于记忆载体当中进行持续学习,且具备交互的双向意识。前者仿若一个静态的影像,后者恰似一个动态的灵魂。比如说,源自美国的Space选取了后者,于虚拟社交平台里复刻了诸多逝者生前的数字形象以及声音、性格倾向等数据,然而这也引发了一连串的伦理道德争议。

角逐数字永生这场竞赛时,有着不同参与者,他们有着各异策略与目标 。 Space创始人阿图尔·西乔夫,凭借强大对话能力,打造出数字灵魂平台,此平台能与用户沟通、互动 。他觉得,这是达成数字永生的最优途径 。埃隆·马斯克呢,采用更激进办法,他宣称已成功把人类意识上传至云端,达成人机融合 。他认为,这是实现数字永生的终极目标(图6) 。同国外巨头那从根本之处去改变人类命运的宏大雄心相较,中国中小企业的创新显得更为务实,他们是从真人复刻数字人的功能性着手,于应用层面探寻有可能的商业化应用场景,像刹那元宇宙计划是从逝去亲人转换至陪伴幼小儿童成长的维度来提供数字人服务,他们觉得,数字永生并非一定要全然模拟真人,而是能够依据用户的需求以及喜好予以定制与优化 。

图 6 3D真人复刻数字人未来畅想:数字永生

******

是数字化的一条全新路线,能实现真人复刻。在虚拟偶像市场被占据,头部企业垄断,中小企业难以抗衡时,有个办法:凭借自身技术与创新能力,专注C端市场定制适合需求的真人数字化之人。通过精益创业、产品迭代,达成蝶变。对此,复旦智慧城市研究中心主任凌鸿教授称,从市场角度审视,数字人要先历经虚拟与真人赛道,最终朝着数字永生方向前行。之后,具备中国特色的元宇宙,会依照科技向善、合作共赢的准则,使得每一个人都能够享有数字永生的福气。然而,我们必须要清晰地认知到:不存在任何产品是毫无瑕疵的,唯有持续去满足客户的需求,才能够让数字人切实地“永生”。这是我们向来不曾加以改变的初衷。

留意,复旦大学智慧城市研究中心的元Talk栏目,给本文供给了文字素材方面的支持,给本文供给了图片素材方面的支持,杭州优链时代给本文提供了视频素材支持,特此予以特别鸣谢。

欢迎 发表评论:

请填写验证码

评论列表

暂无评论,快抢沙发吧~