Gen-2是什么AI工具 如何用文本生成高质量视频
Gen-2信息介绍
Gen-2是Runway公司开发的AI视频生成工具,它就像一位会变魔术的视频导演,能根据文本、图像甚至短视频片段,“变”出连贯的视频内容,我第一次接触Gen-2是在去年做一个短视频项目时,当时团队没预算请拍摄团队,朋友推荐了这个工具,试着用文本描述“阳光下的咖啡杯慢慢旋转,背景是木质桌面”,居然真的生成了一段10秒的清晰视频,虽然杯柄的细节有点模糊,但已经帮我们节省了大量前期拍摄时间,这款工具2022年首次发布,经过几次版本迭代,现在不仅能生成短视频,还能对现有视频进行风格迁移,让普通画面秒变电影质感。
Gen-2的核心技术基于扩散模型和多模态学习,简单说就是它“看过”无数视频、图像和文本,能理解文字描述的场景、人物动作和环境氛围,再把这些元素组合成新的视频,和早期AI视频工具比,它最大的进步是生成的视频连贯性更强,不会出现画面突然跳帧或物体“凭空消失”的尴尬情况,现在Runway官网把它整合进了一站式创作平台,不用单独下载软件,打开浏览器登录账号就能用,对像我这样的非专业创作者特别友好。
Gen-2核心功能有哪些
文本生成视频是Gen-2最亮眼的功能,我试过输入“夜晚城市霓虹灯下,一个女孩戴着耳机走在人行道上,镜头从远景慢慢推近”,生成的视频里,霓虹灯光的色彩过渡像彩虹滑过夜空,女孩的动作也不僵硬,连耳机线随着步伐的摆动都有细节,这比我用过的其他工具要流畅很多,文本描述越详细,效果越好,比如加上“穿蓝色连衣裙”“背景有便利店招牌”,生成的画面会更精准。
图像生成视频也很实用,上次我画了一张手绘的“太空飞船飞过土星环”插画,上传到Gen-2后,输入“飞船匀速前进,土星环呈现金色,远处有闪烁的星星”,几秒钟就生成了一段飞船飞行的视频,插画里的线条和色彩都保留了,就像让静止的画“活”了过来,这个功能对设计师来说太香了,不用再手动做逐帧动画。
视频风格迁移能让普通视频秒变大片,我拍过一段小区花园的日常视频,用Gen-2选择“宫崎骏动画风格”后,树叶变成了圆润的色块,阳光透过树叶的光斑像撒了一把碎金子,连路过的小猫都带上了卡通感,它支持几十种风格,从复古胶片到赛博朋克,甚至能模仿特定导演的镜头语言,比如韦斯·安德森的对称构图。
多镜头连贯生成解决了短视频创作的“断片”问题,以前用AI生成视频,一段只能10秒,多个镜头接起来很生硬,Gen-2的“Storyboard”功能可以让你先上传分镜头脚本(文字或草图),它会自动调整每个镜头的色调、视角,让前一个镜头的人物出现在下一个镜头里,就像有个隐形剪辑师在帮忙,上次做“一天的生活”主题视频,用这个功能生成了“早餐-上班-晚餐”三个镜头,过渡自然得像实拍的。

Gen-2的产品定价
Gen-2目前没有单独定价,它包含在Runway的订阅套餐里,免费版用户每月有50个“信用点”,生成10秒720p视频消耗1个信用点(不同分辨率和时长消耗不同),基本够偶尔试用,我一开始用免费版做过几条朋友圈短视频,虽然画质只能720p,生成速度慢一点(大概3分钟/段),但完全能满足日常玩一玩的需求。
付费套餐分三个档次:Basic版12美元/月,每月300信用点,支持1080p视频,生成速度提升50%,还能使用部分高级风格模板;Standard版28美元/月,每月1000信用点,解锁4K分辨率,支持多镜头连贯生成和API调用,适合小型工作室;Pro版76美元/月,每月3000信用点,有专属客服和定制模型训练服务,大企业用得多,我现在用的是Standard版,做客户项目时生成4K视频交给后期,对方根本看不出是AI做的。
另外Runway经常搞活动,学生认证后能半价订阅,黑五期间甚至有年付6折,我去年就趁活动囤了一年Standard版,算下来比单月买便宜不少,如果只是偶尔用,用完免费信用点再按需购买单次生成次数(10秒1080p视频2美元/次)也很划算,不用长期订阅。
这些场景用Gen-2超合适
短视频创作者绝对离不开Gen-2,我认识一个做美食探店的博主,以前拍一条视频要扛相机跑餐厅、后期剪辑一整天,现在她直接用Gen-2,输入“麻辣火锅沸腾的特写,红油冒泡,撒上香菜和芝麻”,生成素材后配个讲解音,10分钟就能出一条抖音,粉丝涨得比以前快多了,平台算法还特别喜欢AI生成的“新奇画面”,给的流量推荐也多。
广告公司做初稿提案时,Gen-2能帮大忙,上次帮一个护肤品客户做广告创意,客户想要“清晨露珠从花瓣滚落,滴在护肤品瓶上”的镜头,我们没条件拍微距,用Gen-2生成了3个版本(玫瑰、百合、兰花),客户当场就定了玫瑰版,说比手绘分镜直观100倍,以前做这种提案至少要等摄影棚排期,现在当天就能出方案。
教育机构做科普视频也很合适,上个月帮一个中学做“太阳系行星运行”教学视频,直接用Gen-2输入文本“水星、金星、地球、火星围绕太阳公转,轨道呈椭圆形,颜色按实际比例呈现”,生成的视频虽然行星大小比例需要用PS调整一下,但轨道运行的动态效果很直观,学生看了都说比课本上的静态图好懂,生物课还能用它生成“细胞分裂”“光合作用”的动画,比找版权素材方便多了。
社交媒体博主做“创意挑战”内容简直是降维打击,前阵子小红书流行“AI生成你的梦境”,我用Gen-2输入“在云朵上骑自行车,天空是粉紫色的,旁边有会飞的鲸鱼”,生成的视频点赞量破万,好多人问“这是哪个APP做的”,还有人用它生成“穿越到90年代的自己”“和卡通人物合拍”,每次都能上热门,关键是不用花时间学复杂软件,输入文字就行。
Gen-2使用注意事项
文本描述一定要“具体到抠细节”,有次我想生成“人群在广场上跳舞”的视频,结果人物动作像群魔乱舞,后来改成“5个穿红色衣服的年轻人在广场跳街舞,动作是抬手、踢腿、转身,背景有喷泉和路灯”,生成的画面立刻整齐多了,Gen-2对“数量”“动作”“环境”的描述越明确,越不容易出错,模糊的描述比如“很多人”“随便跳”,它就会“瞎猜”。
避开“复杂动态场景”,我试过生成“赛车在盘山公路漂移,车轮冒白烟”,结果赛车差点“漂”出公路,轮胎的烟雾也像一团棉花,问了Runway客服才知道,目前Gen-2对高速运动物体的边缘处理还不太成熟,尤其是金属反光、烟雾、水流这类“无固定形状”的元素,容易糊成一团,换成“赛车缓慢行驶在盘山公路,阳光照在车身上”,效果就稳定多了。
分辨率别盲目选最高,免费版只能用720p,付费版虽然有4K,但生成时间差很多:720p大概1分钟,1080p要2分钟,4K得5分钟以上,如果只是发朋友圈或短视频平台,1080p完全够了,4K文件大,上传还慢,我一般先用720p测试描述是否合适,确定没问题了再用1080p生成最终版本,能省不少时间。
版权问题要注意,Gen-2生成的视频可以商用,但有两个坑:一是别用明星、品牌logo的名字,比如输入“长得像周杰伦的人弹钢琴”,可能会侵权;二是免费版生成的视频右下角会有Runway水印,要商用必须用付费版去掉水印,我之前用免费版做了个产品宣传视频,忘了去水印,被客户扣了尾款,现在每次生成前都会检查套餐权限。
和同类工具比Gen-2有啥不一样
对比Pika Labs,Gen-2在写实风格上更能打,Pika Labs生成的视频偏动画感,线条圆润,颜色鲜艳,适合二次元内容,我用它做过“卡通小猫玩毛线球”,可爱到犯规,但要做写实视频,商务人士在办公室开会”,Gen-2生成的人物表情、西装纹理更接近实拍,Pika做出来会像动画片里的职场场景,有点出戏。
对比Sora,Gen-2胜在“普通人能用”,Sora是OpenAI的大杀器,生成的视频能长达1分钟,画面细节堪比电影,但现在还在“邀请制测试”阶段,我申请了3个月都没拿到资格,Gen-2在Runway官网直接开放使用,免费版就能体验,虽然单次生成最多15秒,但对中小创作者来说,“能用”比“完美但用不上”重要得多。
对比HeyGen,Gen-2的“多模态输入”更灵活,HeyGen擅长“数字人视频”,输入文本能生成虚拟人说话的视频,适合做口播、教程,但它只能生成“人物+背景”的固定模式,Gen-2可以用文本、图像、视频三种方式生成,既能做数字人视频,也能做风景、动画、产品特写,就像一个“全能视频工厂”,而HeyGen更像“数字人专属工具”。
对比D-ID,Gen-2的视频长度和连贯性更强,D-ID也是做数字人视频的,优势是人脸表情自然,但生成的视频最多5秒,超过就容易卡顿,Gen-2生成的15秒视频能保持全程流畅,我用它做过“虚拟主播介绍产品”的10秒视频,数字人说话时嘴巴开合、眼神转动都很自然,比D-ID的“机械感”好多了,后期配上真人声音,粉丝都没发现是AI生成的。
用Gen-2生成高质量视频教程
第一步,打开Runway官网(runwayml.com),注册账号后登录,免费用户直接点右上角“New Project”,付费用户在左侧导航栏找到“Gen-2”图标,点击进入生成界面,界面很简单,上方是输入区,中间是预览窗口,下方是参数设置,跟用美图秀秀差不多,新手一看就会。
第二步,选择生成方式,想从文本生成就点“Text to Video”,在输入框里写描述,冬天的雪地里,一只萨摩耶狗追着雪花跑,镜头跟着狗移动”,记得把细节写清楚:天气(冬天雪地)、主体(萨摩耶狗)、动作(追雪花跑)、镜头运动(跟着移动),写完点“Continue”进入下一步。
第三步,调整参数,右侧可以选分辨率(720p/1080p/4K)、时长(5秒/10秒/15秒)、风格(默认/写实/动画/电影等),免费用户只能选720p和5秒,我一般选1080p和10秒,够用又不占太多信用点,风格选“写实”,生成的画面更自然,如果有参考图像,点“Upload Reference”上传,能让Gen-2模仿图像的色调和构图。
第四步,点击“Generate”开始生成,等待时间根据参数不同,1080p大概2分钟,期间可以在预览窗口看进度,生成完成后会出现3个版本(免费版1个版本),选一个最满意的,点“Download”下载到本地,或者点“Edit”进入Runway的剪辑工具,加字幕、配乐、滤镜,我上次生成的“海边日落”视频,直接在里面加了“海浪声”和“暖色调滤镜”,效果比单纯的原片好太多。
第五步,优化不满意的部分,如果生成的视频有瑕疵,人物脸模糊”,不用重新生成,点“Regenerate”后在输入框补充“人物脸部清晰,有眼睛、鼻子、嘴巴的细节”,Gen-2会针对性优化,我有次生成“猫咪舔爪子”,爪子模糊,补充描述后第二次就清晰了,省了不少信用点,最后记得检查水印,付费用户在下载前点“Remove Watermark”就能去掉Runway的logo。
常见问题解答
Gen-2生成视频需要多久
生成时间看分辨率和时长,720p 5秒视频大概1分钟,1080p 10秒要2分钟,4K 15秒得5分钟左右,我用Standard套餐(付费版)比免费版快30%,如果同时生成多个视频会排队,建议错开高峰期用,凌晨生成速度最快,试过凌晨2点生成,1080p 10秒只用了1分20秒。
Gen-2免费版和付费版有啥区别
免费版每月50信用点(1信用点=10秒720p视频),生成视频带Runway水印,只能用基础功能,Basic版12美元/月,300信用点,1080p分辨率,去水印,多镜头生成,Standard版28美元/月,1000信用点,4K分辨率,API调用,高级风格模板,Pro版76美元/月,3000信用点,专属客服,定制模型训练,我从免费版升级到Standard版后,发现4K视频的细节真的不一样,客户愿意多付钱买高清版本。
Gen-2生成的视频有版权吗
有版权,但要注意规则,免费版生成的视频归Runway和用户共有,商用需要购买付费版;付费版生成的视频版权归用户,但不能包含侵权内容(比如明星脸、品牌logo、受版权保护的角色),我上次生成“蜘蛛侠在城市荡秋千”的视频,被系统提示“包含版权角色”,重新改成“穿红色紧身衣的超级英雄在城市荡秋千”才通过,所以描述时避开具体IP名字就没事。
Gen-2支持中文文本输入吗
支持!虽然界面是英文的,但输入框可以直接写中文,我试过用中文输入“春天的花园里,桃花盛开,蝴蝶在花丛中飞”,生成的视频完全能理解“桃花”“蝴蝶”的意思,画面里真的有粉色桃花和白色蝴蝶,不过复杂的中文成语可能会出错,龙飞凤舞”,它会生成“龙和凤凰在跳舞”,而不是书法风格,建议用简单直白的中文描述,效果更准。
Gen-2能生成带声音的视频吗
目前不能直接生成声音,只能生成无声视频,但Runway平台有“AI配音”和“音乐生成”功能,生成视频后可以在编辑界面直接加,我一般先生成视频,然后用“Text to Speech”功能输入文案,选个“温柔女声”配音,再在“Music”里选“轻松钢琴”配乐,最后合成导出,全程不用离开平台,比用Pr剪辑方便多了,如果想要特定音效(比如风声、雨声),可以去免费音效网站下载,导入后和视频合成。


欢迎 你 发表评论: