首页 每日干货分享 可灵AI数字人正式亮相,重新定义行业标准,一张图实现分钟级数字人生成

可灵AI数字人正式亮相,重新定义行业标准,一张图实现分钟级数字人生成

发布时间: 浏览量:1 0

近日,可灵AI数字人呈正式展露头角之态,借由出类拔萃的口型精准度、情绪动作演绎以及跨风格泛化所能耐而重新界定数字人技术之行业标准。用户只需上传一幅角色图片,输入角色表达之内容或者一段音频,便能够生成时长最长为1分钟、极富表现力的数字人视频,何况还支持多类角色以及中英日韩多语种,最低价格仅仅为0.12元每秒,广泛适用于广告、电商、娱乐、媒体、教育等诸多场景。当下产品公测正陆续予以开放中。

极简输入、高质输出:一张图实现分钟级数字人生成

可灵AI数字人将行业的制作门槛大幅降低,用户仅需提供一张角色图,这角色图支持包含写实人物、动漫、动物等多种角色类型,接着输入一段文字或者音频,随后就能一键生成高质量的数字人视频,该视频分辨率最高可达1080p,帧率为48FPS 。

它的这个功能,能够做到支持生成数字人视频,其最长可达1分钟,通过它可以轻松地满足多种场景的需求,像是产品讲解、新闻播报、在线教育等情景方面的需求;它结合会员开展优惠活动,价格最低仅为0.12元每秒,这里的标准价格是,高品质模式为8灵感值每秒,标准模式是4灵感值每秒;这样一来,能让高品质数字人技术不再只是少数专业机构才拥有的专利,进而真正实现赋能给广大内容创作者以及中小企业 。

另外,为达成“开箱即用”这般便捷的体验效果,可灵AI给出了一站式解决办法。它既准许用户上传自身拥有的素材,又能够运用内置的官方形象库、AI生图功能以及将近百种TTS音色,从而轻松地完成从角色创建直至配音的整个流程。

角色演绎“神形兼备”

数字人视频生成_可灵AI数字人_ai生成成数字人

在数字人的核心能力,也就是“表现力”方面,可灵AI展现出了它深厚的技术功底,它不再满足于同类产品那种简单的音画同步,而是去追求角色能够达到“神形兼备”的那种生动演绎。

在对口型这个基础指标方面,可灵AI数字人呈现出业界领先精准度。有实例测过,一位女歌手在演唱英文歌曲,唇形和快速变化歌词音节完美贴合,复杂口型表现也很出色。按照提示词“眼神专注自信地唱歌”,数字角色展现出自信眼神,持麦姿态自然,还有与观众互动的微笑,生动如实还原了歌手舞台表演状态 。

与此同时,可灵AI数字人凭借可灵视频模型那强劲的能力,呈现出出色的泛化性能,不管是写实模样的人物,还是动漫风格的卡通,亦或是动物形象,都能够生成具备高质量的数字人视频。在卡通猫咪唱英文Rap的那个案例当中,可灵AI精确地捕获音频节奏,生成了一只一边进行说唱,一边随着节奏自然而然地摇摆身体的“猫”,跨越了不同角色风格之界限,赋予角色以生命力。

提示词驱动角色表演 情绪与动作精细可控

与仅仅只是“动嘴皮”的数字人不同,可灵AI数字人带来了对情绪的深刻理解,还带来了对情绪的表达,并且能够通过提示词精细化控制角色情绪,也能够通过提示词精细化控制角色肢体语言,从而实现“有灵魂的表演”。

于这个呈现出“愤怒”情绪的案例里头,依据音频内容以及提示词“内心全然是气愤,极为生气” 。模型精确无误地把这种抽象的情绪转换为具体的面部微表情,也就是紧锁着的眉头,紧抿着的嘴唇,还有充满压迫感的眼神,把角色内心的怒火展现得酣畅淋漓 。

ai生成成数字人_数字人视频生成_可灵AI数字人

借由可灵AI视频模型,凭借多模态理解大模型跟视频生成模型的深度交融,可灵AI数字人冲破传统音画同步的浅显拟合,首度达成从听声音至懂意图的跨越,在口型准确度已处于行业领先的状况下,能够精确剖析输入的语音、图像以及提示词,针对长视频里数字人情绪、动作与运镜施以精确规划,保证生成内容紧密契合叙事意图与情感脉络,切实达成从对口型到情节演绎的升级 。

技术驱动 打造数字人行业标杆

有着卓越表现的可灵AI数字人,受益于其背后深度融合的多模态理解大模型与视频生成模型。它借助音画高度对齐的交叉注意力机制、强化口型的训练策略以及精细化的数据处理,达成了语音与唇形的精准同步,哪怕面对多语种、歌唱或者极快语速的台词,也能够确保唇形与发音严丝合缝。并且它采用关键帧控制的架构,该架构先是让模型构建高层次叙事骨架,接着并行生成多个片段的数字人视频,如此便能够在保持身份一致的情况下,实现无限长度视频生成。

在专业测试期间,可灵AI数字人,同行业中颇有名气的产品,以及即梦数字人(-1方案),展开了效果方面的对照比较。最终呈现的结果表明,可灵AI数字人,于整体效果这一方面,以及其他多个细分维度之中,均展现出了极为出色的表现。同即梦数字人(-1方案)进行对比时,其整体GSB得分达到了2.39 ,和另一对象对比时,整体GSB得分达到了1.37 ,在行业领域内处于领先地位。

可灵AI身为全球处于领先位置的视频生成大模型,自2024年6月发布之后,已经完成了超过30次的迭代,其用户规模突破了4500万,生成的视频数量超过了2亿,为超过2万家的企业供给API服务,覆盖了广告、影视、游戏等多个不同的领域。随着可灵AI数字人的推出,将会进一步降低行业创作的门槛,提升制作的标准,推动它在短视频、电商直播、在线教育、企业服务等领域的规模化应用。

欢迎 发表评论:

请填写验证码

评论列表

暂无评论,快抢沙发吧~