首页 每日干货分享 Zhi乎用户AI生图需求分类及相关模型举例分析

Zhi乎用户AI生图需求分类及相关模型举例分析

发布时间: 浏览量:32 0

这个问题,是Zhi乎之上一个提问者所提出来的,尽管推测或许源自官方运营,然而却蛮有意思的。

这儿帖一下作者以往的回应,随后添加近期上线的一些品质优良的模型作答案补充。

核心还是看场景需求。

我们把AI生图需求简单分为两类:

一、进行生成,其中涵盖灵感创意的生成,以及精准控制的生成,而精准控制生成又包含文字输入、参考图输入等情况 。

二、编辑,全局或局部编辑;

这两类生图的需求实际上也影射出两类模型的能力, 分别是图片生成的大模型, 以及图片编辑的大模型。 在此就当前市面上热度较高、使用量较大、具备特定优势的模型进行举例分析。

01 

如果是概念创意发散或视觉艺术效果类图像生成,有且只有选择。

笃定多数从业者以及艺术家会给予该想法极高的认同,虽说近三年图像模型不断涌现,然而在美学呈现方面,MJ依旧占据遥遥领先的地位,仍旧是诸多艺术家的首要选择。

当然啦,它存在的问题呢,乃是创意的另外一面噢,是那种会不受控制的状况呀。用户是挺垂的呢,可范围也相对来说变得越来越窄咯,如今还有人提及咒语这个概念不?

02 

如果是摄影感物品效果图、氛围图,可以选择。

它是,由核心团队出走后所创业推出的产品,它最初,主打文字渲染方面的能力,在2024年年初的时候,它依旧具备着很强的竞争力。后来,随着生图文字渲染技术被攻克,它在这方面,就不再拥有强势的表现了。

可算是寻觅到了自身的差异化竞争之处,着重突出商品图的渲染质感,对于电商场景而言,究竟是广泛应用呢,还是在电商场景应该应用 。

03 

AI图像生成模型_AI图片编辑模型_ai图片生成 软件

如果是矢量图生成或VI设计应用,重点考虑。

也许能够出圈的是hello Kitty的工作图,然而真正具备强大实力的是它的矢量生成能力,与它的画布编辑相配合,能够进行自由缩放、编辑,这对于专业设计场景而言是极为重要的。

对于他的功能而言,能够智能化地把图案粘贴至产品的表面,会自动去适配不同形态的表面,其中包含褶皱、弧面、凹凸等,无疑是VI应用方面的厉害工具。

04 Flux &

若是存在通用图片生成的情况,或者有着对于SFT的需求,又或者存有Lora精调的需求,那么优先推荐的是Flux系列模型。

能够给出准确的提示词回应,具备着不错的画风审美感觉,有着精准的文字进行渲染(英文),并且还是开源的 。

自Flux推出首日起,这一数据就开始替换SD系列模型,当中涵盖SD1.5 ,XL ,以及后续的SD3,如今大体上已成为开源模型的核心首选对象。

还有更为突出的是,它所推出的Flux,给予了能够支持精准文字处理的编辑能力,这一能力可参照之前那篇有关编辑能力的介绍 。

05 GPT4o-image

要是不太擅长进行写作,想要以较为直白、通俗的话语来生成图像,重点突出趣味性,那么可以选择GPT4o 。

吉卜力风格有多火就不说了,还有各种明星、名人AI生图。

然而,恰恰是这些浮于表面的事物,当进一步深入探究时却发觉并非可行,连续一致性的生成存在着极为严重的不足之处。

GPT4O仅仅能讲好玩,然而却算不上好用,跟现今的Sora2是同样的模式。UGC具备的可玩性相当高,属于偏低门槛的创意工具,。

06 即梦 &

若为国风的绘画风格,还有中文的文字,以及海报的生成,首推国产的骄傲「即梦」 !

ai图片生成 软件_AI图片编辑模型_AI图像生成模型

倘若讲最好的AI图像模型难以进行评价,那么最好的中文AI图像模型必定是即梦。近来被大肆吹捧的混元3.0,我将其与即梦作了几组对比,二者差距可不是一般的显著。

它如同一个在品德与学业方面都表现优良的孩子,每一门都展现出优秀的特质,然而每一门却又都称不上是最为顶尖的存在。毕竟,其他人家的孩子数量众多,而且他们各自所擅长的事物也是极为多样的。

07 Nano ( Flash 2.5)

若是存在通用编辑方面的需求,像手办生成、还有风格海报之类诸多情况,重点就需考虑nano ( flash 2.5)这个模型。

这是经由实实在在的真实用户去进行打榜从而测试出来的,极其厉害的图像编辑模型,它直接促使手办话题的热度得到提升,鉴于此,我特地撰写了两篇文章来予以分析。

文字精准编辑图片,这是它的主要优势,也就是俗称的用嘴P图,当然它也存在一定的门槛。

08 C站 or Lib等Lora

如果上述模型皆未满足,倘若需要更强的IP一致性以及泛化性,又或者是格外垂直小众的风格使得大模型力不能及的情况,那么可以自行炼丹。或者前往C站或者lib寻觅合适的lora模型。

我特别反对什么大模型杀死Lora、工作流之类的话术。

存在即合理!

每一个不同的场景,针对不同模型所产生的需求,向来都是不一样的,恰似上面列举出的那些示例 。

就算退到退无可退的地步来讲,当人工智能大模型的能力,譬如始终保持一致、不断进行泛化性拓展等方面,能够涵盖所有小模型的时候,在本地进行部署的那些具有安全性、敏感性的内容,也将会是最后的屏障。

09 简单总结一下

不存在任何一个AI模型能够实现对所有情形的完全掌控,那种被称作好的状况仅仅是局限于具备优势的特定场景范围之内,而其最为关键的要点在于:

适合场景需求的模型,才是更好的!

内容聚焦于,AIGC多维视觉模型的生成 ,编辑分析 ,以及产品交互演化的是我 。欢迎点选公众号主页私信 ,回复好友 ,添加笔者微信作交流 。

欢迎 发表评论:

请填写验证码

评论列表

暂无评论,快抢沙发吧~