试用AI绘图工具Reve:拆图层交互操作能否跳出AI生图抽卡循环
智东西于11月4日进行报道,最近,一款在外面网络上引发刷屏现象的AI图像工具Reve,正在紧紧加快迭代的步伐,吸引了数量众多的一大批用户,它那以“ .(再造现实想象)”为标语口号的关于宣传的影片,也已然是获得抵达了百万的播放量 。
纵然当下于国内的探讨尚不算繁多,然而这款工具凭借着“图层能够进行编辑”这种方式,以及“元素可以实现交互”这种生成模式,斩获了诸多好评。所以我们也着手尝试了这个相对较为冷门但体验颇为新奇的工具——Reve。
它并非如传统AI生图工具那般,必须依靠精准的提示词来喂图,而是将每张图解构为能够选择、可以拖动、能够修改的图层元素,你能够直接针对画面进行点击、删除、拖动以及修改操作,进而重新构建出一个存在于你脑海中的图。
这次呢,我们借助它把最近大红大紫的AI三宫格玩法给复刻出来了。亲身感悟下来最强烈察觉可是:确真的是它正费尽思量寻思,助着用户去躲开那个“抽卡循环”构成难题哟。
揭开Reve的官网,首页呈现出一个对话框,其上写着“Ask Reve”,点击开启便可着手体验了。
再往下滑动,是能够看到一些存在着特别趣味性的示例的,像是使树上全都长满苹果,是把玻璃的反光直接给擦掉,又是处于沙漠的岩壁上去拉出一条拉链,这些均是能够当作创作灵感来使用,是可以作为创作灵感的。
我们随后也实际操作了一下。
有一种创作页面,其右侧给出了两种入口途径,一种是能够借由“Start with text”凭借提示词来生成图片,另一种是能够依靠“Start with an image”透过图片触发进而去修改图片;其左侧另外存在一排风格各不相同的图片用作参考,这可算作是一个小型的灵感板。
最近,网上“三宫格”AI图挺火,我们打算进行复刻,特别想体验一下,Reve的交互逻辑,究竟与别的AI绘图工具,存在着怎样的不同之处。
威尔·史密斯,我们选了“Start with text”,写了段长长的提示词,要生成三张海边傍晚的图,主角形象保持《当幸福来敲门》不变,有背影、中景、特写三张构图,每张图还配上中英文字幕。
为了能促使图像尽量契合,我们于设置栏之中,手动调节了图像比例,其值为4比3,还调动了生成数量,此数量是1,并且挑选了模型质量的选项,选的乃是高质量 。
提交完毕之后,系统自行跳转至一个全新的对话页面,这个页面能够允许中文进行交流,并且会依据指令自动从网络上调取素材,比如说它找出了两张威尔·史密斯在《当幸福来敲门》里的照片用作参考, 之后利用这两张图片进行了融合生成。

然而仅是这次绘制中得到的仅仅是一幅图像,并且还只是我们所给出的提示语里边位置处于首位名叫背景的那一张。它实际上并无法真正地在一鼓作气的情况下绘制出呈现为三宫格式布局中的图像,也并未依据我们指示语句当中所包含的具体内容去生成中文性质的字幕。虽说它能够理解解读中文语句,可是觉得该模型自身针对于中文提示进行的渲染方面的能力仍旧是相对比较弱小的句号。
我们 转向编辑这张图片,瞧瞧是否能够进行一番改动,有着一些在图片之上的函数栏是极为丰富的,能够进行收藏、下载、删除、改名,并且也存在着“编辑”按钮 。
我们按下了编辑按键,随后便进入到一个具备图像分层功能的界面之中。系统凭借自身能力,自动识别出了图片里存在的多个主体,其中包括人物、海滩、天空以及字幕模块 ,甚至就连它从网络上特意搜寻而来,并用以编辑的两张原始图也能一并处理 。
首先,看着呈现乱码状的中文字幕,那模样实在是太过奇怪了,于是乎,我们着手尝试去删掉字幕部分。
点击那个名为“字幕”的图层,就会弹出“编辑”以及“删除”这两个按钮,选取编辑之后,系统直接将它所理解的原始指令张贴了出来,像这样“:‘山的后面是什么?-What’s the? ’以一种整洁、白色的字体在画面的那个位置”。
让我们将中文去除,接着再加以确认修改,在这个时候,图像的左上角会标记一个蓝色的小圆点,以此来提示这个元素已然发生了变动。
随后我再度试着将人物的朝向予以调整,原本呈现的是背影,我期望转变为正脸朝向镜头的视角,所以更改了提示词,“威尔史密斯正脸面对镜头,手持一束花束,侧身站立于海边……”,修改完毕后,系统自行把它翻译为英文并再度进行理解,背景里的“沙滩”元素也随之发生了变化。
点击“Apply Edits”去应用更改之后,图像实实在在地出现了突出的变化,这次已然极为贴近我们所设想的画面了。
搞完调通一张图这个操作之后,我们接着去拆分原本的提示词,采用相同的方式单独生成三张图,将它们组合成为一个“三宫格”。最后一张呈现大特写的人脸其一致性表现得相当精准,基本上不存在什么AI感 。
我们在体验完单一主体图之后,进而尝试了“多主体 + 参考图”的能力,毕竟参考图复现以及多元素编辑乃是Reve相当厉害,特别拿手的本事。
我们上传了一张以肯德基吉祥物“奇奇”为原型的照片,提示词表明:主题设定为一只处于海边进行散步活动的鸡,鸡的形象严格依据参考图做到保持不变。时间设定为白天,地点是海边,此时鸡呈现背对镜头的姿态看向远处的大海,整个画面氛围安静,字幕被安排写在底部,内容为:“-What’s the sea?-”。整体画面色调呈现清冷的感觉 带有富士胶片所特有的那种效果,存在过度曝光的情况,画面质地显粗粝并且色调偏向冷色,暗部的细节得以完整保留,高光区域呈现出自然化、柔和的漫射光,不存在明显的硬边阴影 。

这个图所生成出来的结果,还算是比较契合设定的,尤其是细化的情节。像是画面之中并没有那种生硬的阴影,而且字幕所在的位置基本也达到了相应的标准。
有趣的是,随后我们再度输入了两个图像给予的提示,然而并没有再次上传可供参考的图片,Reve偏偏依旧能够依照我们所上传的“奇奇”这一形象来持续进行生成,这表明它在上下文的维持能力方面表现得还算可以,并非是对于每一条提示都必须重新设定具体角色。
把生成好的图,我们还试着进行了编辑。操作在这个阶段非常直观,Reve会将每张图之中的主体识别出来,像PPT那样用户可以对位置进行拖拽与此同时对布局作出更改。
我们随意调整了几个汉堡与薯条的位置,再次生成之后,它们于我们期望其出没现身的所在出现了 。
最终,我们原本打算将上述两组三宫格图拼接为一段视频,然而,这一环节遭遇了阻碍:Reve的视频生成功能虽已接入Veo 3.1模型,可是其使用需要Pro会员资格,并且仅在美国以及加拿大地区予以开放。
写在最后:Reve使用起来究竟怎么样?
往回思索这次体验,存在一个印象颇为深刻的要点。长久以来,我们始终在为“写不出优秀提示词”而发愁,无论网络上存有多少模板,最终能否生成你所期望的图仍旧是一种玄之又玄的现象。
而Reve的AI图像编辑有着诸多思路,这其中一条是:那并非一味讲求要你写得毫无瑕疵,其能够从提示词之中成功拆分出图像的每一个元素,你只需轻轻点一回、顺手拖一把、略微改动一句话这样子,它便全然清楚了你到底想要的是什么。有关呈现出的这种“拖拽式交互”的整体相关的体验感感受方面看去,对比于用户在黑箱里边不断反复进行尝试错误表现显得要轻松许多。
在那次体验的过程里面,我们还留意到了一些细微的情节,比如说,当我们上传参考图之后,Reve能够在接下来的对话当中维持住角色的形象,这表明它的上下文记忆里面也是涵盖着参考图的,在进行图层编辑的时候我们拖动汉堡、薯条的位置之后重新生成,Reve并没有出现“胡乱摆置”的情况,反而是能够明白这些物品是应该处于桌面上的常识,整个画面是契合现实逻辑的,没有出现飞在空中或者错位的那种荒唐结果。
于一定程度方面而言,它愈发近似一个AI版本。仅仅是你无需再自行去拉图层,也不用去打蒙版,更是不用去调不透明度,而是借助自然语言以及图形交互便能够达成“即改,即生成”的精细修改流程。
更具趣味性的是,这款产品的体验成熟程度颇高,然而其背后实际上仅仅是由一个10人初创团队创建的。该团队创始人Michaël曾于Adobe就职,此产品在今年3月方才推出1.0版本,可是到了10月就已然发展至图像结构能够进行编辑的阶段了。
从功能体验这个方面朝着前面去卷,我感觉说不定这就是AI创作类型的工具在“后基础模型阶段”的一条能够出去的路 。
要是你同样借助Reve进行过“P图”,又或者玩过别样的由AI模型所生成的三宫格,那么不妨于评论区展览出你最为称意的那一张。


欢迎 你 发表评论: