图片反推提示词的必要性及其在AI绘画中的关键作用
目录
先来设计指令,通过由AI反向进行推导从而生成指令,接着要对AI输出的提示词进行选择和修改,还要挑选出生成图片的工具,最后要把验证效果写下来 。
当看到这个标题的时候,一些小伙伴可能会有疑问:
倒推视频才具备必要性吗,现今都有依据图像生成图像以及修改图像的情况了,那么图像还有实行倒推的必要性吗 ?
答案毫无疑问是“有必要”这回事。因为图生图的适用场景存在差异,AI改图的适用场景不一样,AI反推提示词的适用场景也是不同的 。
这是它们的区别:
因而实际上逆向推导图片提示词乃是最为根本的一步,其关键作用在于协助我们将文字梳理成图思维,且建树以及充裕我们的画面美学体系,就像提炼他人画作的美学一般,塑造出风格相像、相类、相异、完完完全全不同的美学模板。
这里头有关成图思维,大伙能够瞧瞧先前那一篇所说的提示词结构,以及结构维度方面的技巧,。
AI生图频翻车?3个秘诀为你打造高可用的文字绘画魔法
当我们对他人的神仙画作产生了商用的想法,然而却不可以将他人的图片下载下来当作参考图用于二次创作,并且也不许转发,在这种情况下,反推图片提示词其所具备的兜底作用便得以展现了。
增加反推图片提示词的次数,这在本质方面,是于增强我们针对画面美学所拥有的控制力,是在提升图片独立设计的能力 。
下文会沿着能被反推的指令,反推所借助的工具,以及用于生出图像的工具这三个方面,去详尽讲述“偷师”时所运用的方法。为了能够以更优的状态去理解其中所蕴含的文意,各位请一边查看提示词文档(该文档位于评论区),一边同步浏览下文哟~。
(ps:以下图片均由AI生成)
第一步:设计让AI反推的指令
按照“高级角色设定+任务简述+任务分步详述+输出格式”这种方式,整个指令是要进行设计的。
当中任务的分步详述里边,需要把要素构成给说明清楚,要去制定与之相对应的输出标准,还要将组成要素写明,特别是在画面美学板块 。
比如以下基础版指令:
中文版:
请你扮演一位专业的艺术设计分析师,同时还是顶尖的AI提示词工程师。你的核心任务是,依据我刚刚上传的图片文件,对其展开要素结构分析,并且经过逆向推导,得出与之对应的、能够生成同样画面的AI生图提示词。具体要求如下:
于分析以及逆推的历经内,你务必谨严依循以下维度当作你的分析架构与输出准则哈,最终附加必需的技术规格哈。
识别镜头里的主体,主体可以是人,也可以是物,同时还要识别主体所处的环境,要详细地去分析画面当中所呈现的内容,并且要对其行为所负载的叙事、或者用来塑造氛围的意图展开分析,主体分析、环境分析以及描述都必须要详尽,描述用词得专业 。
美学画面包括形象审美评价,对图片风格、色彩、光影的剖析判断并描述,有精准形容词修饰其特点,构图、组织方式方面需要分析形状、位置关系,视角选择的种类细致解析其中奥秘含义,材质是物体被描绘勾画时的质地、纹理呈现状况,氛围营造的感觉、意境需要解读感受效果,景别大小、远近的特征要详细说明,画质清晰、模糊等状况要有分析判断,基于这些要素进行画面整体美学分析,其描述不能用句子而要用短词语,且要详尽、描述词专业严谨,不可有丝毫疏漏、随意 。
请针对1的确切剖析予以归纳总结(400字以内),并依照如下样式呈现你的分析结论:
【图片内容】: XXX。

【画面美学】:【风格】呈现出这般独特模样;【色彩】拥有着那样特别组合;【光影】展现出如此别样效果......
【技术规格】:XXX
英文版:
这道题的英文表述似乎不完整且逻辑较混乱,不太明确你的具体需求,无法准确进行按要求改写其符合对应逻辑和中文表达习惯的文本哦。如果你能补充完整清晰的任务要求或英文内容等,我可以更好地为你完成对应的改写。
要改写这段内容实在很缺乏明确合适、合乎意思的逻辑,只能勉强尝试不太顺遂准确的表述:图像方面,主要的那个,或者连同场景以及画面之中的,是其中一幅图像,并且,由那些所引发的或者相关的情况。图像里的以及相关的那些必然得是某种状态,而且相关的术语也必须得处于特定情况 。
你提供的内容似乎存在较多不清晰和错误的表述,不太能准确理解其完整意思,所以难以按照要求进行合乎逻辑的改写。请你检查并补充完整准确的信息,以便让我为你更好地改写 。 不过大致尝试理解后,勉强改写如下:图像,诸如图像的风格啦,颜色呀,光线喔,还有呢,拍摄类型哟以及图像呢。这儿,“”用于那个被用来或者和那个的东西。这个图像部分得有比xxx更一些的短xxx才可以。这个的xxx的xxx和xxx必须得是这样的,并且这些术语必须得是那样的。 (但这样改写实在很勉强,理解起来有很大局限性)。
你提供的内容似乎不太完整且表述混乱,不太明确具体需求,无法准确按照要求改写。请补充清晰准确的内容以便进行改写 。
- 【Image 】: XXX.
– 【图像】:【风格】XXX;【颜色】XXX;【光线以及】XXX…… 。
- 【 】:XXX.
鉴于反推图片提示词的AI存在属于国外产品的可能性,故而英文版是理所应当得以纳入考虑范畴的 。
因为到了最后的阶段,我们要借助生图工具做效果验证这项事儿,而生图工具的技术规格设置并非相同,存在着差异,有的是带有明确格式的情况,有的则是按钮选择的情形,所以把技术规格也放到反推的指令当中,这样做是比较好的 。
你能够针对不一样类型的图,去进行几套不一样的反推指令设计 。像是针对人像设计、产品特写图这类情况,就要详细地去描述主体所包含的要求。而对于环境要求,要进行简写 。甚至为了在之后能够便利地去判断是不是需要自己附带参考图来进行创作,另外,你能够并且让AI去判断主角IP 。
第二步:生成和修改AI输出的提示词
要是选一个能进行反推的AI工具,重点就在于去看这个工具是不是有可以上传图片的功能,还有是不是具备较强的图片理解分析能力。
这儿国内工具推举豆包,鉴于在咱们平常使用的国内工具里,没法辨认没有文字的图片,kimi以及元宝的对画面美学进行推理方面比不上豆包(详情可查看云文档)。
不过豆包的输出结果质量,相比国外搜索大模型还是差了些。
国外的工具推荐和。
这两者能够去输入中文,它的优势在于,反馈的那个画面美学提示词是十分细腻的,比豆包还要做得进一步详细且精准一些,同时在画面美学解析方面的专业程度处于和豆包的层次范围中间。
比如这个让、、豆包解析插画的案例:
(图片来源于小红书博主“眸笙”)
“油画质感”未被豆包解析出来,另外两者都解析出来了,并且针对颜色进行了细致划分(朱红,暖金),还解析出了“油画、水彩”这两种笔触纹理以及“厚涂”风格 。
AI输出结果后,我们绝不能直接予以使用,一定要在经过自身检查完善之后方可使用。

有可能AI对于人物形象以及动作的描述存在不够精细致入微的状况,对于装饰元素的提取方面会出差错出现有误情形,对于环境空间布局只是简略简单扼要蜻蜓点水波恩带过。纵然就是刚刚才夸奖过后的,同样也会出现“逐一去识别图片当中运用的质材,然而等到识别完结组合拼凑在一起却并不契合大众所认同的审美”这样的状况。
比如人物卡牌图:
从左边看是原来的图片,它源自小红书博主“真亦轩JCT”,右边看去那么是生成的提示词语 。
(图片由wan2.5生成)
当对反推的提示词展开检查之际,我们的注意力能够着重置于人物形象的勾勒、动作的刻画以及装饰元素方面。而在对豆包以及反推的提示词予以检查之时,便还得留意画面美学。
第三步:选择生图工具,验证效果
提示词修改完成后,就到了生图验证的环节了。
从生图整体所呈现出来的效果来讲,在国内的工具当中,也就是梦(豆包)确实绝对是属于首选的。它的语义理解具备很高的能力,并且创意所具有的特性也很强。就算是在画面美学处于良好状态的基础之上,对于图片内容的描述是比较简单的,很大概率也会收获到令人感到满意的结果 。
然而存在一项限制,此限制为提示词不可以超出800字的篇幅限度,并且输入英文提示词也并非便利、轻而易举之事,(1个英文字母算作1个字,极易超出规定的字数范围)。
工具在国外提供了相当多可选择的,像、、等价的生成效果是良好出色的,然而全都具备自身既有的固定特性特点,各位挑选适配于自身的吧。
下面呈现的是,通过运用反推提示词实现的,也就是梦以及生成的效果对比图:(提示词能在云文档那里见到)。
(左为原图,右为生成图)
(即梦4.0生成图)
用反推提示词、生成的效果对比图:
(左为原图,右为生成图)
写在最后
由于人物形象以及环境背景存在特质不易用文字将那些细微之处予以还原,并且各个工具的文字处理能力状况有所不同,同时文字输入的字数也有可能存在限制,因而图片反推提示词的重点在于掌控画面美学,进而实施风格迁移。
这同样显示出,我们没办法经由反推图片提示词去复刻他人的图片。若要实现完全复刻或者99%近似图生,仍得借助图生图(这也存在一致性等问题)或者json语言。
然而,利用AI反向推导图片提示词从而探究出富有个人创意的图片难道不是更为理想吗?首先在研究时期反向推导予以修正,随后在出图时刻借助图生图生成一系列完成品,接着运用AI改图进行精细的美化局部调整,如此一来你也就摇身成为了一位专业的视觉设计大师。
行了,今儿的分享就到此为止了,要是你针对反推提示词存有体验以及所感所悟,欢迎于评论区域展开分享以及探讨,除此之外,也欢迎诸位加入群聊进行互动交流哟~。
欢迎 你 发表评论: