Phenaki是什么文本到视频工具怎么生成视频
Phenaki基本信息介绍
如果你经常刷短视频或者做内容创作,可能会发现现在用文字就能变视频的工具越来越多,但Phenaki和它们不太一样,它是由Google DeepMind团队搞出来的文本到视频生成模型,2022年就露过面,当时在AI圈引起不少讨论,和其他只会“拼接画面”的工具比,Phenaki更像个“会讲故事的导演”,它能根据你给的一长串文字描述,按顺序生成有逻辑、有情节的视频,不是随便凑几个镜头就完事。
我第一次听说Phenaki是在一个AI技术分享会上,当时演示的视频是“清晨的森林里,小鹿从草丛中探出头,阳光透过树叶洒在它身上,然后它蹦跳着跑向小溪”,画面连贯得像真的拍出来的,连小鹿耳朵抖动的细节都有,当时我就想,这要是能用来做短视频脚本,得省多少事啊。
Phenaki核心功能特点
Phenaki最牛的功能是处理长文本生成视频,一般的文本到视频工具,你给个“猫咪玩毛线球”还行,要是写“早上7点,猫咪在窗台晒太阳,看到窗外小鸟飞过,跳下窗台追过去,结果撞翻了花瓶”,很多工具就卡壳了,要么镜头乱跳,要么前后不搭,但Phenaki能把这种有时间线、有情节的文字,拆成一个个连续的镜头,就像动画片导演分镜一样,保证故事能顺下来。

它还有个“因果连贯性”的本事,举个例子,你让它生成“一个人先穿左鞋,再穿右鞋”,它不会搞反顺序,因为它能理解文字里的先后逻辑,之前我用某工具试过类似的描述,结果生成的视频里人先穿了右鞋,又脱下来穿左鞋,看得我直乐,Phenaki在这方面就靠谱多,像是个“懂顺序的AI助理”。
Phenaki对文本描述的宽容度也高,你不用写得特别专业,天空蓝得像刚洗过的布,云朵飘得很慢”,它也能get到你想表达的画面感,不会因为描述太“口语化”就生成奇怪的东西,这点对我们这种不是专业编剧的人来说,简直是福音。
Phenaki使用流程步骤
用Phenaki生成视频其实不难,我自己试过一次,全程下来也就10分钟左右,第一步是打开它的在线平台(目前主要在DeepMind的研究页面开放测试),注册账号后进入生成界面,界面挺清爽的,没有乱七八糟的按钮,中间就是一个大文本框,让你输入视频描述。
第二步是写文本描述,这里得注意,别写太笼统,做个风景视频”肯定不行,得具体点,像“秋日下午,金色的银杏叶从树上飘落,一个穿棕色外套的女孩伸手接住一片,然后笑着转身走向远处的长椅”,我当时写的是“下雨天,小狗撑着迷你雨伞在人行道上走,路过水洼时踩了一脚,溅起小水花”,想着生成个可爱的短视频。
第三步是调整参数,界面上有几个选项,比如视频时长(目前最多能生成20秒左右)、画面风格(写实、卡通、水彩等)、分辨率(720P或1080P),我选了卡通风格和1080P,然后点“生成”按钮,这时候页面会显示“正在渲染”,大概等了3分钟,视频就出来了。
第四步是查看和修改,生成的视频会自动播放,要是觉得哪里不满意,比如小狗的雨伞颜色不对,或者水洼的水花不够大,可以回到文本框修改描述,再重新生成,我第一次生成时,小狗的雨伞是红色的,我想换成蓝色,就在描述里加了“蓝色的迷你雨伞”,第二次生成就准确了。
Phenaki适用场景推荐
短视频创作者用Phenaki简直是开了挂,比如做小红书的姐妹,想发“治愈系日常”视频,不用扛着相机拍半天,写段文字就能生成画面,配个温柔的BGM就能发,我朋友是个美食博主,她用Phenaki生成“草莓蛋糕制作过程”的动画视频,文字描述写“先打鸡蛋,再筛面粉,放入烤箱后冒香气”,生成的视频比她自己拍的还精致,点赞量涨了不少。
老师和家长也能用它做教学内容,比如教小朋友认识动物,写“熊猫在竹林里吃竹子,吃完翻个滚,然后爬上树”,生成的视频比图片生动多了,小朋友看得津津有味,我表妹是小学老师,她用Phenaki做了“太阳系行星运行”的视频,学生们上课都不打瞌睡了。
还有营销人员,做产品宣传视频也方便,比如卖宠物用品的,写“小狗戴着新项圈在公园跑,项圈上的灯一闪一闪,吸引了其他小狗围观”,生成的视频直接能当广告片用,省了请拍摄团队的钱,上次我帮一个开宠物店的朋友试了下,他看完视频眼睛都亮了,说这比他花2000块拍的还好看。
Phenaki产品定价说明
目前Phenaki还处于研究和测试阶段,主要用于学术和技术展示,官方暂无明确的定价,不过从DeepMind之前的产品来看,以后可能会分免费版和付费版,免费版可能限制视频时长(比如最多10秒)、分辨率(720P以下),生成次数也有限制;付费版可能解锁更长时长、更高清画质,还能去除水印。
我猜以后可能会按“生成次数”或者“视频时长”收费,比如生成1分钟视频收几块钱,或者包月不限次数,毕竟这种AI模型训练和服务器成本不低,完全免费肯定不现实,不过现在能免费测试体验,想玩的朋友可以抓紧时间去试试,说不定以后就要收费了。

Phenaki与同类工具对比
和现在火的Runway ML比,Phenaki的优势在“长文本处理”,Runway ML生成视频确实快,但如果你给的文字超过两句话,它就容易“失忆”,比如前面说“穿红衣服的女孩”,后面可能变成绿衣服,Phenaki就不会,它能记住整个故事线,保证人物和场景前后一致。
和Stable Video Diffusion比,Phenaki的“画面连贯性”更强,Stable Video Diffusion生成的单个镜头很清晰,但镜头切换时偶尔会有卡顿,像PPT翻页,Phenaki生成的视频更像“一镜到底”,镜头过渡自然,不会让你觉得“这两段不是一个视频里的”。
还有个工具叫D-ID,主要做数字人视频,和Phenaki定位不同,但如果比“文本生成创意视频”,Phenaki更灵活,D-ID需要先上传人脸照片,生成的是“数字人说话”的视频,而Phenaki可以生成任何场景,天上飞的、水里游的,只要你能写出来,它就能试着画出来。
Phenaki使用注意要点
写文本描述时别太“放飞自我”,虽然Phenaki能理解口语化描述,但如果你写“一个会飞的猪在太空吃冰淇淋”,它可能生成的画面很奇怪,毕竟这种场景现实中不存在,AI也没见过,最好写一些“基于现实但带点创意”的描述,粉色的猪戴着宇航员头盔,在模拟太空舱里舔冰淇淋”,这样生成的视频会更合理。
生成视频时耐心点,AI渲染需要时间,尤其是选了高分辨率,可能要等3-5分钟,别一直点“生成”按钮,容易卡bug,我第一次用的时候以为没点上,连点了三下,结果生成了三个一样的视频,白白浪费了测试次数。
注意版权问题,Phenaki生成的视频,版权归谁现在还没明确说法,所以别用它生成有版权的人物或场景,蜘蛛侠在故宫跳舞”,可能会有侵权风险,自己随便玩玩或者做非商用内容没问题,商用的话最好先查清楚版权政策。
常见问题解答
Phenaki能生成多长的视频啊?
目前测试版最多能生成20秒左右的视频哦,我上次试了下写了个30秒的故事,结果只生成了前20秒,后面的就没了,不过官方说以后会慢慢增加时长,说不定以后能生成几分钟的长视频呢,到时候做小动画就更方便啦。
用Phenaki生成视频要花钱吗?
现在不用花钱,因为还在测试阶段,随便用,但以后肯定会收费的,毕竟AI服务器很贵的,我猜可能会像其他AI工具一样,免费版有次数限制,想看高清或者生成更长的视频就要充钱,趁现在免费,赶紧去试试,不然以后就得掏钱啦。
Phenaki和Runway哪个更好用啊?
看你要干嘛啦!要是想生成短平快的视频,Runway更快;要是你想讲个小故事,小猫追蝴蝶然后爬树”,Phenaki更厉害,它能记住整个故事的顺序,不会乱,我上次用Runway写了个三句话的故事,结果第二句的小猫变成了小狗,尴尬死了,Phenaki就没这问题。
Phenaki怎么用啊?步骤复杂吗?
一点都不复杂!就四步:打开平台、写文字描述、调参数、点生成,文字描述写清楚点就行,夏天的海边,小男孩堆沙堡,海浪冲过来把沙堡冲塌了,他笑着又堆了一个”,我妈都能学会,她上次还生成了个“广场舞大妈跳新舞”的视频,乐得不行。
Phenaki生成视频要等多久啊?
一般3-5分钟吧,看你选的分辨率,选720P快一点,3分钟左右;选1080P可能要5分钟,我上次着急看结果,一直盯着屏幕,感觉时间过得好慢,其实刷刷手机就好了,别催它,AI也要慢慢来才能生成好看的视频呀。


欢迎 你 发表评论: