AI作画模型选择有原版DD、像素版DD等，还能进行AI图片描述解析演示

作者：每日干货分享

发布时间：2025-11-04 11:37:19 浏览量：50 0

4、关于AI作画模型的选择，在参数设置当中，存在着两种绘图模型引擎可供选择，一种是原版DD，另一种是像素版DD，除此之外还有其他自定义的PT格式模型，其设置方式如下所示：

[]

点按如下按钮，从中挑选图片，稍作等待，片刻之后便会呈现出描述，虽说此描述存在一定差异，然而将其作为描述用以绘图，所作之图确实颇具可观之处。

下面演示几张图，解析出来的描述：

由保罗创作的一个漫画书面板中，一群钢铁侠在海洋里彼此相邻，借助光与魔法，在IMAX上呈现。，，被放映经过这些，，在之上，，，，，，，，，，，，，，，，，，，，，，。

A, of a, with, and trees, a, matte, by,, pixiv, shin hanga, ukiyo - e, matte,,. （这段内容本身比较混乱，这样改写后更难读懂一些，不过原英文表述也较难理解其确切含义）。

功能二：SD( )作画

SD作画具备的功能跟DD功能大体上是一样的，也同样对队列模式、参考图诸如此类的功能予以支持，相比之下SD作画在速度方面更快，并且所塑造的形象显得更加具体形象趋向于真实，接下来重点阐述的是SD的参数设置。

同样，SD具备文字描述功能，具备参考图功能，且还有一些别的参数，大伙可以将鼠标悬停到参数旁边的问号上，此时就会有说明。

1、描述词方面的设定是，描述词的句式大体上跟DD是一样的，然而在SD作画的时候多出来了一个负描述这一情况，负描述在默认的状况下是能够不进行书写的呢，要是负描述被写出来了，那就意味着是不想让绘画的整体结果呈现出的那些元素呀。

首先，提供一个起始内容，接着按照这种方式接着做，即如下这般去点击AI生成描述从而展开后续的续写描述，当前已经存在两种自动化撰写描述的引擎了：

对于绘图参数，图片尺寸要与DD相同，且得是64的倍数，要是随意填尺寸也没问题，软件会自行转换；绘图步数跟DD相似，只是SD步数20就足够了；绘制图片轮数指的是每次画几张图；描述相关度采用默认数值就行，当然也能试试10以上的数值；随机种子默认是0，意味着每次种子随机，若设置大于零的固定值，在其他参数一样的情况下，SD出图会完全相同，这和DD是不一样的哈。

3、显存占用模式的选择方面：软件给出了相异的显存占用模式，分别是超级低模式，非常低模式，高模式，极高模式，还有带着加速模块的模式，加速模块的效果十分突出，速度极为迅速，并且显存占用量也降低了许多。

4、第16代黑图方面的问题：就GTX 16这个系列而言，像1660这类的显卡，在进行SD作画的时候会出现黑图的状况，要将如下选项勾选上，才能够正常地输出画面。

5、参考图方面：如同DD那般，SD也是支持参考图的，然而其参数相对较为简单，大致而言就是进行导入原图的操作，实施修改描述的行为，设置图片差异度参数就行，要留意差异度参数范围处于0至1之间，其中1表示跟参考图差异达到最大的情况。另外，自适应尺寸颇具人性化，举例来说，参考图尺寸的宽高是，绘图参数尺寸设置成512×512，默认状态为无，这意味着不自适应，最终所出的图尺寸为512×512，固定的宽是代表是以绘图参数尺寸设置的宽512作为标准，参考图宽高比为2比1，高会自动修改成256，这便是最终输出的图。

象下面这样，去尝试一下SD参考图，达成真人二次元的效果，或者是实现其他的某些效果那样的情况：

6、动画，选择SD动画中的2D，便可开启动画模式，动画能够设置参考图，支持动画在角度方面发生变化，支持其在缩放大小上进行调整，还支持在xyz轴移位等操作。

你提供的内容似乎不太完整，请你明确一下具体的句子或要求，以便我按照格式进行改写。

10:::a

20:::b

40:::c

如下SD动画演示视频：

7、关于SD模型选择，关于LORA模型选择，关于VAE模型选择：能够支持去选择第三方ckpt格式的SD模型，还能够支持去选择第三方ckpt格式的VAE模型，以及能够支持去选择第三方ckpt格式的LORA模型（并且还支持类的LORA模型），情况如下所示：

8、进行局部修改时，如下这般是要点击局部修改按钮的，如此才能够达成在涂鸦的部分区域去实现局部修改的功能，不过呢，此功能所呈现出来的效果也是相对比较有限的，像换脸之类的操作倒是还可以，下面如同这样来进行演示：

9、模型融合：点击名为SD模型融合的按钮，如下这般支持不同的ckpt或者格式的该SD模型按照一定比例进行融合，融合之后的模型同时具备两个模型各自的特点。

10、二次元TAG解析：如下，点击按钮，支持对二次元图片进行TAG解析，像等模型比较有需求：

功能三：CN作画

如今声名远扬的CN，当下软件已同步至CN 1.1版本，整体使用方法于SD并无太大差异。

CN的精髓在于下图，不同的这些模型：

这些模型具备这样的作用，即针对不同的参考图来展开创作，比如说，有的模型是针对线稿参考图，进而达成线稿上色或者二次创作的目标，就像下面的演示那样，选择这个二次元线稿的CN模型，搭配上二次元SD模型以及描述，。

选这个人体姿势的CN模型如下，左图是原图，中间那张是对原图进行识别的骨骼图，右图是生成的图。

如下SEG语义分割的CN模型效果：

如下MLSD这种识别建筑线稿的CN模型效果：

如下为超分辨率的Tile的CN模型，真的是模糊图重绘神器：

功能四：T2I作画

T2I进行作画所达成的结果大致相像，其采用的方式也是相同的，像下面这种情况同样是给出众多的模型：

在这里就不做重复演示了，如下官方的介绍图：

功能五：图片/视频AI高清放大

将放大模型设置成各异的，把图片放大的倍数也设定为不同的，高清放大后的图片输出目录要是软件目录双反斜杠，若是输入的图片尺寸特别大，就容易出现超显存的情况，在这时，我们去修改拼图大小这个参数就行，比如说设置拼图大小是512的时候，6G显存选择模型针对1920乘以1080的图片做4倍放大测试不会超显存。支持2至10倍的放大。

进行AI高清放大是一项具备独立性的功能，在软件主界面里，于图片处理菜单那儿，要去选择图片/视频高清放大选项，接着选取图片或者视频（这里支持批量选取），这样就能达成或者the vedio高清放大的操作操作结果即为图片被高清放大要么视频被加以高清放大。

如下，小图经过高清放大的对比效果，二次元和三次元都能胜任。

功能六：老照片修复

软件主界面当中，对于图片处理菜单，要选择老照片修复选项，而后选择图片（此支持批量），这样就能实现高清修复，不过仅仅是针对人像，来开展高清修复操作。

如下，经过高清人脸修复对比效果动图演示：

功能七：图片/视频上色

位于软件主界面的图片处理菜单之中，可选择图片或者视频进行上色操作，当选择黑白视频或者图片后，便能达成上色效果，并且支持批量处理哦。

以下这些参数设置当中，能够挑选不一样的上色模型，二次元模型专门致力于给二次元线稿进行上色，。

如下动图演示，上色前后的效果：

功能八：图片说话

具备图片说话功能，能够达成将导入的图片转化为有着说话人的视频这种形式，对音频以及视频驱动予以支持，以默认音频驱动来实现说话。

于软件的主界面那儿，轻点图片处理菜单，从中挑选图片说话选项，再去选择图片（此支持批量操作），而后把图片转化为此种如下的视频形式。

功能九：AI图片转3D

AI图片转3D输出视频的目录为：软件目录下的\video；AI图片转3D还是一项独自免费的功能，像下面这样的参数设置能够对生成视频的时长以及摄像头位置予以设置（位置通常不做更改）：

软件的主界面当中，有用于图片处理的菜单，在该菜单里选择图片转3D功能，接着选择图片，此操作支持批量选择，随后将图片转换成为视频形式，然而这个转换的速度比较慢，每一张图片转换需要5到30分钟。

实际上大致就是原作项目介绍所呈现的那般效果，是将一幅精美的图片转化为 3D 的那种效果，然而与原作相比较而言，我进行了改进，能够支持与原图尺寸大小相同的视频。

功能十：抠图

点击软件，选中主界面，找到图片处理菜单中的选项是抠图，先选择图片，此选择支持批量操作，而后就能开展背景和人物的分割工作，像下面这样进行演示：

功能十一：二次元生成

在软件的主界面之中，先找到图片处理的菜单选项，接着从中选择二次元生成这一方式，随后便能绘制出数量多达上百张的二次元图片，标点符号！

可在参数设置之处，设置各类参数，借此来生成不一样类型的二次元小姐姐。

功能十二：三次元生成

于软件主界面之中，针对图片处理菜单进行选择，选择三次元生成这一选项，如此一来即可绘制出上百张三次元图片。

可以在参数设置当中，进行各种参数设置，这是以生成不同类型的三次元图片为目的的，具体就是这样的一种情况被呈现出来了。

功能十三：AI写小说

在软件主界面之中，于小说聊天菜单那里，去选择AI写小说|聊天界面，如下这般，点击AI写小说按钮，对开头进行设置，进而就能够续写不同轮数的文字。

如下，点击训练小说，可选择自己的小说语料txt，以此来训练自己的模型了标点。

同时还对清华大学予以支持，可留意到这起码得具备6G显存才行，并且加载模型的速度较为迟缓，所以请保持耐心等一等，能够达成与之相类似的形式：

还支持清华大学，上传图片，用图描述形式，如下演示：

功能十四：伴奏人声分离

在软件的主界面当中，针对音视频处理这一操作，去选择伴奏人声分离这一选项，然后进行歌曲的选择，此选择支持批量操作，如此一来，便能够自动将人声，以及伴奏，还有鼓点和低音进行分离，其呈现出的效果十分厉害。

若显存4G及以下，可以如下参数设置勾选低显存占用模式即可：

功能十五：音视频转文字

在软件主界面之中，存在音视频处理这项操作，在此操作中有音视频转文字的选项，如果选择了音频这个内容呢，或者选择了视频这个内容，那么就能够开展语音识别的工作，最终输出带有字幕的内容以及文字版的txt文件。

带有音视频转文字功能，它能够支持超过100个国家的多种语言，要是选择汉语的话，无论是什么语言的音视频呀，最终都会自动被翻译成中文的字幕以及txt文件哦，如此一来方便又快捷呢，不过呢翻译的效果存在一定限度，所以呀最好还是选取原视频的语言来进行识别啦。

5.2版本的大模型，处于int8模式时，其所需要的显存仅仅是4至5G，速度比之前快了4倍，并且效果也是很不错的。

如下，被选取的日文视频演讲所呈现的识别字幕效果，其中红框部分乃是软件进行识别后自动翻译生成的字幕，。

功能十六：视频补帧

软件具备支持视频二至十六倍补帧的功能，此效果同样是颇为良好的，依据如下参数设置来开展设置参数操作便可：

于音视频处理菜单之中，点击视频补帧选项，从中挑选出欲实施补帧操作的视频便可，补帧所呈现的效果即为如下这类效果，其原理乃是借助AI对相邻的两帧展开计算，进而在其间脑补出数量众多的中间帧。

功能十七：AI文字生成音乐

人工智能作画是借助文字来生成图画，那音乐同样能够如此，像下面这样的参数设定是支持通过文字生成音频的设置的，它支持进行批量输入，也就是换行输入，还支持参考音频，之后在保存好设置后，於主界面音视频处理菜单之下的文字生成音乐功能区，即可借助这些要素从而生成音乐。

显卡要求

至少需要2GB显存，并且得是英伟达显卡才行，AMD、intel等是不支持的。

各种显存测试参数可参考：。

小结

这个项目着实蛮有意思，仅有的问题在于对显卡要求颇高，起码得要英伟达2G及往上的显存，AMD等别的显卡并不支持，带有兴趣的能够去体验一番5.2版本啦，更为详尽的作图参数、教程去多刷刷B站相关视频便可。

本期内容获取

方式一：百度网盘提取码：95kh

方式二：天翼网盘

(访问码:7dn8)

方式三：123网盘（速度挺快）

提取码:JSsP

AI写作工具

AI办公助手

AI图像处理工具

AI视频生成工具

AI音乐音频工具

AIGC内容检测工具

AI法律助手

社媒账号

跨境电商获客工具

全球电商平台

币圈工具

海外app集合

AI作画模型选择有原版DD、像素版DD等，还能进行AI图片描述解析演示

相关文章推荐

取消回复欢迎你发表评论:

评论列表

热门文章

文章目录

最新收录

标签列表

AI作画模型选择有原版DD、像素版DD等，还能进行AI图片描述解析演示

相关文章推荐

取消回复 欢迎 你 发表评论:

评论列表

热门文章

文章目录

最新收录

标签列表

取消回复欢迎你发表评论: