从AI翻唱到原创,AI歌手进化背后的护城河在哪?
The 在上发的乐队合照
有着著名之称的美国制作人,于最近的时间,以高调这样的姿态,推出了首位AI偶像TaTa,并且尝试着对一个全新音乐流派“A-Pop”(AI-Pop)进行定义 。
TaTa
从AI进行翻唱,到AI开展“原创”、进行IP孵化,再到顶级制作人下场去定义AI音乐新流派,AI歌手正演变为能够产出具备高质量的作品,拥有粉丝效应以及商业价值的创作者。
技术壁垒渐渐被抹平之际,那一个成功的AI IP,其真正的护城河究竟会建立于何处呢?于此,我们同Yuri背后的AI Talk团队负责人汗青进行了一番交流。
人工智能新领域榜单:当前该研发团队究竟拥有多少人员呢,对Yuri推出的出道单曲以及音乐视频的制作耗费了多长时间呢?
汗青:我们仍旧是那个AI Talk的原本团队,规模不算大,核心成员大概有5至6人,其中涵盖了负责技术研发的同事,以及负责审美内容的同事。
Yuri的准备工作,是从今年3月开始的,4月也在持续进行。期间存在其他项目的缘故,再加上这几个月视频模型自身有一次规模较大的版本更新,我们对于第一版呈现出的效果并不满意,故而后来几乎相当于推翻了原有内容进行重新制作。
新榜AI :因何会萌生出打造一个采用 AI 技术的数字人歌手这样的想法呢?最开始那富有创造性和启发性的灵感源自于何处呢?
汗青:这可不是那种一下子冒出来的灵感,而是在过去两年运营AI Talk项目期间,经过长时间思索得出的成果。我们最初的想法不是要变成一家搞视频或者音乐的公司,而是期望借助AI技术去打造IP,而IP的关键在于人。所以,从最开始的时候起,对于运用AI技术构建出一个完整的人格这事,我们就满怀好奇 。
我们有过发展历程,经历了好些阶段。一开始做AI Talk之际,我们主要是去尝试进行对话。随着技术慢慢成熟起来,我们觉得时机已然来到,能够开始试着打造内容属性更为丰富的自有IP。去年的Q3我们就着手作尝试了,然而受当时整体技术水平的限制,自己并不满意。一直到今年上半年,各个模态的技术都有了显著的进步,我们才决定继续往前推进。
要是不然的话,仅靠第一印象所带来的新鲜感,用户是根本没办法维系长期价值的。故事的载体能够是影视,或是叙事,还有音乐。在今年,我们经过判断得出,利用AI来进行音乐创作,或许是各个领域里进展最为快速、技术相对成熟的方向,因此也就决定从音乐这个方面切入。
AI新榜:“Yuri”的形象、性格和人设是如何设定的?
汗青:往角色塑造方面来讲,我们运用了那么一种相仿于互联网行业的MVP(也就是最小可行性模型)的逻辑 。实际上呢,这说不定也是AIGC时代里内容创作的一种全新范式 。你能够借助AI迅速地、以低成本生成好多可能性,投向市场去进行测试以及验证,接着把资源汇聚到跑通的那个模型上 。
关于Yuri的形象,它是在一个相对主观的筛选进程当中产生的,在这个进程里,对于AI创作,我们不会去施加过多具体严格的限定诸如最初的时候并没有确定她一定要是蓝色头发,况且也没有规定她必须手持骷髅麦克风。对此,我常见用一个比喻来予以形容这个进程是什么呢?通常就是“面试”AI 。
我们会给予AI一些不够具体的,偏向笼统的提示词,像是期望面部特征朝着亚洲的方向,进一步细化就是更朝中国的方向。当提示词欠缺精准度的时候,AI随即会具备更大的想象范畴,进而生成形形色色的形象。我们所从事的工作便是从这些形象当中给予筛选。当然,伴随技术不断发展,当下的形象设计则会更显现精细的特质,甚至会把手绘以及插画元素引入进来之后再予以渲染处理。
我们会去创造好些个可能性,Yuri呢,是其中一个我们觉得各方面状况都相对成熟的点,刚好商业合作寻了过来,帮助她获取到了更佳的流量。然而这可不是一次性的灵感突发,就算没有Yuri,我们依旧会持续去尝试创造别的角色。
说到性格与人设,我觉得这些要素是必需的,然而我们并不期望全然经由人的构想去达成。我更愿意试着让AI增添更多协作关系,甚而主导人格塑造,而非仅仅当作人的辅助工具,给IP弄一个AI的外在形式。
倘若回归到完全纯粹的“人进行写设定、AI来出图”一种模式,我觉得在长时间竞争当中会丧失优势,原因在于市场之上擅长去编造故事的人远远多于我们这边,从挑选竞争赛道的层面来说,我并不想要去做这样子的事情,让AI去生成算法方面的内容,它反倒会展现得更加自洽,缘由在于这本身就是它的本质呀。
AI 新榜,最初你针对这个项目,抱有着怎样的期待呢,Yuri 走红,是在预料范围之内,还是出乎预料之外呢?
汗青表示,其认为得先界定怎样才算“火”。尽管在行业内部里,以及音乐圈子当中的友人那儿,Yuri已然具备了一定程度的认知度,并且全网播放的数量也已然达到了千万的级别,然而他们依旧是十分清醒的,她距离自己内心所期待的那种所谓的“破圈”,还差得很远 。

真正意义上的“破圈”,是要使得那些对 AI 技术既不了解,甚至都不关心的普通民众,也都能对此生出认知来。从这样的视角来看,我们距离此目标还差得极为遥远。然而,令我格外欣喜且超出预先期待的是,不管是处于圈子内部的用户,还是圈子外部的用户,对于 Yuri 的认可程度都相当之高。我是个秉持极度悲观态度的人,对于事情的最终结果常常怀有负面的预期。在过去的两年时间里,尝试 AI 偶像概念的团队数量颇为不少,然而大众的接受程度似乎普遍处于较低水平,存在着诸多争议,对此我们完全能够理解。所以,此次积极的反响,的确为我们赋予了极大的信心,并且还使得大家视野中呈现出了AI偶像这条道路上存在的希望 。
AI新榜:于从0至1塑造Yuri的进程里,你对于AI工具以及工作流的识解,历经了怎样的转变呢?
汗青,我们打从刚开始搞AI Talk之际,就一直秉持视频影像仅仅是内容的中间层次,而文本层面同样具重要性。我们身为全球率先利用AI直接生成对话脚本的团队当中之一,并且持续坚持到现在。这事并非源于某种原教旨主义,而是我们觉得,AI创作出来的内容存在一种不同于人类创作的、别具一格的趣味性。故而,我们的工作流程向来都是多模态的,涵盖文本、音频、影像之类,并非纯粹的视频制作。
有这样的情况致使我们的工作流程没办法用一句话简单表述清楚。常常存在朋友询问我们运用了哪些具体的工具,就算是我罗列出市场上主流的十几种工具,其中涵盖本地部署的、开源的(像是)以及闭源的(像可灵、Sora 之类),或许对他们都而言帮助也不很有用能。这是由于我们的工作习惯有些特别,会通过调用不同模型的组合去解决问题,并不存在一个标准的、呈线性的工作流程。
我们的工作流程,不是那种呈现为“先A而后B,接着再是C”这种线性式样的模式,举例来讲,先动手来写歌词,紧接着开展音乐制作,然后进行人像方面工作,后续还要做动画环节项目,达成口型对位之后上线。要是A工具没有办法满足相应需求,我们有可能会转换去到B工具那边,甚至会同时使用多种工具。它较为近似于一个偏向动态且当中存在多点能够并行的系统。
有关AI新榜,其中关于AI生成以及干预的情况,还有人工进行调整、修改的环节,以及对应的比例,大概究竟是怎样的呢?
汗青表示,这跟我们进行AI Talk采取的原理相类似,人类所实施的干预主要是在最为顶层的规划方面。我对乔治·R·R·马丁针对其自身写作风格作出的比喻极为认同,他并非去修剪园林,而是如同园丁那般“撒下种子”,使得故事能够自然而然地生长。
进行的工作,和此有着相似奇妙之处 。精力着重于去定义那颗“种子”,为人工智能给予高层次的、具有支点作用的引导 ,并非去规定具体的节点 。至于种子种下后会长出怎样的枝叶及果实 ,尽量不去过多地进行干预 ,更期望让结果自然而然地浮现 。
拿我们制作的Talk类节目来说,人类工作的量大概处于20%至30%这个范围之中,我们期望使AI去承担超过70%的工作。尽管在短期内,由人工进行干预能够有更好的成效,不过这可不是我们所期望的长期方式。我们的定位并非是广告公司,也不是视频工作室,而是想要将关键的精力投放在“怎样让AI自行生成有意思的内容”这件事情里。
这个有着AI辅助的创作流程里,你会怎么去定义自身的角色呢,人类创作者的核心价值究竟是体现于哪里呢 ,这属于AI新榜要关注的 。
汗青称,自己更倾向把自身看作是“产品经理”,因他出身于互联网行业,在那行业里,他们一直把Yuri以及AI Talk当作一个产品来看,而可不是单一的视频,产品的形态在未来饱含各式各样的可能性,他不会把它全然固定下来。
我的角色担当着全面负责整个运作流程的任务,其涵盖了确立大的创意构想以及审美基调这方面。当然咯,鉴于团队规模较小的缘故,在实际开展制作工作期间我也会全过程深度介入到其中,许多部分甚至是亲自去完成的。
AI新榜:你觉得Yuri能够迅速破圈和商业化的关键是什么?
汗青表示,其觉得存在三个因素,其一乃是大环境,也就是技术自身的进步,直至2025年6月,技术最终得以支撑做出契合工业水准的成果,其一直都认为,好多人对于AI的抵触,并不是反对技术本身,而是过往的作品由于技术受限,在情感方面很难以引发共鸣,不管是电影还是游戏,当工业水准越过一条界限之后,观众就能沉浸于其中,产生共情,Yuri的出现,恰好赶上了技术突破的窗口期。
有关第二点,我们在细节方面着实抠得较多,甚至显得有点笨。那些关注我们账号的朋友是会了解的,我们并非是一个高产的团队,甚至会因没想通透而有一个月不更新,这与我们的商业定位存在关联,我们的盈利并非单纯依靠视频制作自身,这为我们营造了良好心态从而能够停下来精心打磨。
第三个点,说实在的,存在运气方面得因素。流量经济,特别是在短视频平台那儿,在很大程度上取决于算法得不确定性。我们曾经有自认为特别出色得内容但流量不好,还有简单尝试得作品却特别受欢迎。这刚好就是我们采用MVP方法论得缘由,用来抵消流量里运气造成得影响。
AI新榜,The North Face与之的商业合作,算得上是AI数字人商业化里一个具有标志性的事件。和品牌合作去创作AI广告内容,这跟传统广告制作存在怎样的不同呢?于满足品牌需求以及保持Yuri人设这两者之间,你们是怎样进行平衡的呢?
汗青提起此次合作,称其对己方意义极为重大,己方很是感谢品牌方所给予的高度包容以及高度尊重。令汗青感到意外的是,这般大的品牌居然愿意采纳己方提出的意见,在一个相对而言较为敏感的AI领域范围之内,给予了己方相当上乘的创作环境体验。
鉴于交付时间还不足一周之短,所以我们并未开展深入的剧本撰写工作,我们思索的关键要点在于,作为首个投身商业代言的AI原生人格,究竟该凭借怎样的一种形式去呈现,方可令大家不会产生反感之情呢?
我们最终选定了最为保险且自身最为擅长的方式,那便是让Yuri亲口说出大众所存在的顾虑,即AI究竟能不能成为一名独立的歌手,我们以直面争议的态度将问题抛出来,这实际上是我们最为擅长的AI.TALK,当然了,为确保完播率,视频时长是进行了控制的,保留住了我们认定为最具价值的部分。
哎,你说这个AI新榜哈,你觉得Yuri它的商业化途径还有啥别的呀?除了广告合作之外呢,在未来的时候会不会去考虑专辑发行这方面呀?还有虚拟演唱会这一模式呢?以及IP授权等别的模式呢?
汗青,您所提及的专辑发行、虚拟演唱会、IP授权等全部商业模式,我们并非予以排斥,然而它们当下并非是我们着重关注的要点。我们此刻最为在意的是要保证这个AI虚拟人格能够营造出长久的影响力,而不是去耗费一瞬间的好奇心 。我们将会持续不断地经营她的作品,坚信在这个进程当中,多种商业模式会顺其自然地呈现出来并且被我们加以尝试 。

不过就我个人的层面来看吧,我是极其不期望Yuri成为那种类似于真人明星一样的存在的。打从一开始我们就没打算去做模仿秀这件事,也就是不去模拟出一个无比接近真人的人。毕竟真人的数量实在是太多了呀,就算模仿到了极致的程度,也是没办法营造出稀缺性的。身为产品经理,我所更多去思虑的乃是差异化。
AI新榜:对于AI商业广告未来发展什么看法?
汗青:从那种质朴的逻辑来讲,AI步入广告领域这样的趋势极难以停下来,原因在于它的制作质量处于持续提高的状态。仅仅短短的几个月时间,AI视频的效果就能拥有硕大的跨越,能够去设想一两年之后会出现什么样的状况。因而在工业标准方面,AI的应用是必然可以成立的。
然而,我们得冷静地去审视它所带来的变革,当某项技术的成本效率获得极大提升之际,对于商业生态所造成的冲击并不全是令人愉悦的,它有可能致使整个行业的利润出现下降,许多团队会面临着重组的情况,原有的商业模式无法得以持续。
我觉得,AI给广告行业带来的更具深度的影响,并非止于是“动用AI去制作广告片”这一环节,而是在其出现以后,整个流量结构以及注意力市场所产生的变化。当内容制作成本极为低廉、供应呈现出爆发式增长之后,你的广告所面临的将不再是怎样“制作”的问题,而是怎样“被人瞧见”的问题。媒体渠道会走向高度碎片化,这才是对行业影响更为深刻的部分。
AI新榜:如何看待Yuri面临的争议?
汗青,争议存在两方面主要内容,其一为有关原创性的争议,也就是对大模型有无使用他人劳动成果提出质疑,相较于前两年,此刻这类声音好像小了些许,我们在这一方面,特别是在版权问题上,做了较为完善的准备。
第二,存在技术层面的争议,这一争议始终存在。尽管我们已然竭尽最大努力,于当下 AI 的工业水平范畴内所能做的均已施行,然而相较于真人,AI 在演唱之际的表情、口型一致性等层面依旧存有显著差距。我们直面这个差距,大家围绕技术瑕疵展开讨论,我觉得这实属正常。
关于AI新榜,AI生成物的版权以及所有权属于一个行业痛点,Yuri在形象、音乐以及MV方面其版权归属怎样去界定,您针对此持有什么样的看法 ?
汗青:当下,我们在中国以及海外同步开展版权方面的工作呢,这个工作进程已然快要到结尾阶段啦。这个进程耗费精力相当多呀,为啥呢?因为存在着好多未知的因素,而且还有不少灰色地带存在呢。然而呢,这可不是仅仅Yuri所面临的问题哟,更是整个AI行业在未来几年都会普遍碰到的挑战呢。
特别是在国内,这方面有关版权的保护并非格外周全。然而我们十分幸运地获取了品牌方的助力,在进行商业合作以前,我们负有先将这个问题予以解决的责任。
对于那些同样借助AI开展创作的同行,AI新榜询问在版权保护层面有怎样的建议,在当下这个版权界定尚不清晰的环境之中,创作者该如何最大程度地保护自身的创意成果、核心资产呢?
汗青称自己有两点要呼吁,其一,就创作者层面而言,得增添原创相关内容,近段时间网络上出现了一些流行的AI视频格式,像是自拍杆穿越历史、ASMR切东西这类,个人爱好者去尝试新鲜事物不存在问题,然而对于那些想要长期培育自有IP的团队来说,我们会相对审慎,不会随意跟风,这是由于当一种格式盛行时,受到保护的是“格式”自身,并非创作者个人,要是创作者自己都不看重原创,极难期望市场能够给出积极的反馈。
首先,我向大家发出呼吁,倘若存在自身原创的资产,或者是专有的形象,亦或是独特的歌曲,在当下这个阶段,就应当尽快借助各种各样的渠道,实施版权争取的相关动作。我们绝不能够等待相应的法律法规完全成熟之后才行动,而应该尽早地采取行动,以此避免在未来出现一系列可能产生的问题。与此同时,我们也正在深入思考,是不是能够基于此次所经历的事情,开展一些资源整合的工作,亦或是进行公益性质的分享活动,从而帮助那些创作者能够在中国更好地保障自身所拥有的权利。
人工智能新榜,对于Yuri跟其他虚拟偶像,像柳夜熙、初音未来,其核心区别该如何看待呢?
汗青表示,我们跟柳夜熙这般极为成熟且异常出色的IP,思路存在差异。他们或许更多运用了3D资产,背后有着强大的运营团队以及成熟的短视频叙事方法论。我们对这些前辈满怀佩服与尊重之情,然而我们没办法去复制它们,我们不想做自己不了解的事。
我们存在着核心区别,这个区别在于创作方式,我们倾向于运用生成式技术,使得算法以及AI去进行更多的创作,并非人为地在细节地方干预过多,举例来说,我们有可能不会去精心设计一个能够抓人眼球的脚本故事,而是更加注重利用生成式AI自身去进行创作,这种创作方式所形成的差异,会变成我们的特色。
请问,Yuri的核心竞争力是什么呢,其差异化优势又是什么呢,这样的优势或者竞争力是能够做到被重复复制出现的吗,出自AI新榜 ?
汗青:在工业水准层面被复制,这是无法避免的。未来必然会有人,能够做得比我们还要出色,只是他们或许尚未着手,或者没有留意到这个契机。我们会竭尽全力,维持在第一梯队,然而你不能期望它成为差异化竞争的关键所在。
工业质量背后的关键之处,乃在于整个那种叙事方式的构建,也就是说,Yuri身为一个“个体”,这个个体所具备的价值究竟能不能被广泛地认可。我可不期望这样的价值仅仅是依靠流量所带来的新鲜感以及好奇心,毕竟因为这样的一种状态是根本没有办法长久持续下去的。
AI新榜:对Yuri这一IP的未来运营有什么规划?
汗青:从长远的这个角度来看,我们最终还是得回归到那个“叙事”自身的这个层面,去探寻能够使得人们产生其价值之感并且推动互动的全新形式。而在这些形式的背后,必然是我们所属团队的深度思考以及独特的叙事基因。这在某种程度上有点类似于平常所讲的心灵鸡汤,其内容是“你要做自己”,然而在我个人的认知里这可是个极具本质性的事物。
当工业生产能力不再作为唯一壁垒之际,剩余的壁垒便所剩无几了。要么你的技术实力超卓至无人可及;要么你拥有驾驭资本、持续炒热市场的杠杆能力,而我们或许都并非全然契合。最后还有一种能力,即是你选定了所要从事的事业,并且在该领域里,你的“调性”是旁人难以与之竞争的。
犹如听相声,同样段子,郭德纲讲出来便好笑,他人模仿细节却极难有相同效果,在AI创作时代,模仿成本会变得万分低,我们已记不起首位模仿吉卜力风格或做历史自拍之人是谁了,因为模式极易被复制,我们更倾向于追逐该有的更高门槛目标,。


欢迎 你 发表评论: