首页 AI问题解答 可以生成图像的ai是什么,怎么用

可以生成图像的ai是什么,怎么用

作者:AI问题解答
发布时间: 浏览量:15 0
  • 基础认知:这类AI到底是个啥

    咱们平时在社交平台刷到的那些超现实风景、二次元角色cos图,甚至“穿越回古代的自拍照”,很多都是“可以生成图像的AI”的杰作,简单说,它就像一个能读懂文字的画手,你用语言描述脑海中的画面——一只戴着墨镜的柯基在沙滩上打排球”,它就能在几分钟内把这个天马行空的想法变成一张看得见的图片。

    这类AI的“学习过程”和人类学画画有点像,人类画家要临摹无数作品才能掌握技巧,AI则是靠工程师喂给它几百万甚至几千万张图片数据,让它在这些图片里学习线条怎么画、颜色怎么搭、不同物体长啥样,等它“学”明白了,再看到你给的文字描述,就会调动这些“记忆”,一点点拼凑出你想要的画面,你不用会握画笔,也不用懂透视原理,只要能把想法说清楚,它就能当你的“专属画手”。

    可以生成图像的ai是什么,怎么用

  • 工具大盘点:哪些家伙能帮你画图

    现在市面上的“可以生成图像的AI”工具多到让人眼花缭乱,每个都有自己的“特长”,挑对工具才能少走弯路,先说说MidJourney,这可是目前的“顶流选手”,生成的图片细节丰富到能看清花瓣上的露珠,艺术感尤其强——不管你想要油画风、水彩风还是赛博朋克风,它都能给你整得明明白白,不过它有点“傲娇”,得在Discord聊天软件里用,新手刚上手可能会觉得“这界面咋跟画画没关系”,多摸索几分钟就好了。

    再聊聊Stable Diffusion,这是个“开源老大哥”,最大的优点是免费还能“DIY”,你可以从网上下载各种“模型包”给它“装插件”,比如专门画二次元萌妹的模型、专攻写实人像的模型,甚至能让它模仿梵高、毕加索的画风,不过它对电脑配置有点“挑剔”,如果你的电脑显卡不够强,生成一张图可能要等上十分钟,像个慢吞吞的老工匠。

    还有DALL-E 3,它是ChatGPT的“亲兄弟”,主打一个“好沟通”,你用日常说话的方式描述需求,它都能秒懂,比如你说“给我画一只会飞的猪,背上背着小书包,背景是彩虹”,它不会把书包画成铁锅,最方便的是它能直接在ChatGPT里用,不用额外下载软件,对电脑配置也没要求,纯新手想试试水,选它准没错。

    如果你喜欢国风,那文心一格(百度家的)和讯飞星火(科大讯飞家的)也值得试试,它们对中文提示词的理解更到位,生成的水墨画、工笔画特别有那股“中国味儿”,比如你说“画一个穿汉服的小姐姐在桃花树下弹古筝”,它画出来的发型、服饰细节会更贴合咱们的审美。

  • 上手实操:三步教你生成专属图像

    不管用哪个工具,核心步骤都大同小异,今天以最适合新手的DALL-E 3为例,教你三步生成满意的图像,第一步,写好提示词(Prompt),这可是“灵魂所在”,提示词不用写小作文,但关键信息得说清楚:主体(谁/什么东西)、动作/状态(在干嘛/啥样的)、环境(在哪儿)、风格(想画成啥样),主体:一只灰白色的布偶猫;动作:蜷缩在暖气片上打盹;环境:冬天的卧室,阳光从窗户照进来;风格:温馨的治愈系插画”,这样AI才能精准get你的点。

    可以生成图像的ai是什么,怎么用

    第二步,调整参数,不同工具的参数设置不一样,DALL-E 3比较“傻瓜式”,主要调“生成数量”和“尺寸”,想多挑几张就选“生成4张”,想要发朋友圈的高清图就选“1024x1024”尺寸,要是用Stable Diffusion,就得注意“采样步数”(建议20-30步,步数太少画面模糊,太多又费时间)和“CFG Scale”(控制AI听不听话的程度,数值越高越严格按提示词来,一般7-10就行,太高容易“画蛇添足”)。

    第三步,优化和“返工”,第一次生成的图大概率不会完美,猫的尾巴画得像拖把”或者“暖气片歪歪扭扭”,这时候别慌,咱们可以“教AI改图”,在提示词里补充“修正:布偶猫的尾巴要蓬松,尾尖是白色的”“修正:暖气片要画得横平竖直,有金属光泽”,多试几次,就像和AI“磨合”,磨合次数多了,它就越来越懂你的“审美偏好”。

    举个真实例子,我朋友第一次用MidJourney,提示词只写了“画个龙”,结果AI生成了一条“四不像”——头是龙头,身子是蛇身,腿像鸡爪,翅膀还是蝴蝶翅膀,主打一个“抽象派艺术”,后来他把提示词改成“中国传统应龙,有翅膀,鳞片是金色的,背景是云雾缭绕的山峰,水墨风格”,生成的图直接能当手机壁纸,所以说提示词写得好不好,差别真的很大。

  • 避坑指南:这些雷区千万别踩

    虽然“可以生成图像的AI”玩起来很上瘾,但新手很容易踩坑,今天就来给大家排排雷,第一个坑是提示词太“佛系”,有人觉得“我随便写写AI也能懂”,结果生成的图一言难尽,比如你写“画个好看的女孩”,AI可能给你画成古代仕女、现代辣妹、甚至外星少女,因为“好看”这个词太主观了,不如具体点:“20岁左右的女生,齐刘海,黑长直,穿蓝色卫衣,站在图书馆书架前,手里拿着一本书,微笑”,这样AI才能“画到你心坎里”。

    第二个坑是忽略“版权问题”,很多人觉得“AI生成的图就是我的”,其实这里面门道多着呢,比如MidJourney的免费版,生成的图版权归MidJourney所有,你发朋友圈没问题,但要是拿去印在T恤上卖钱,就可能侵权;Stable Diffusion如果用了别人训练的“模型”,可能还得遵守模型作者的规定,比如不能生成违法或低俗内容,建议大家用之前先看看工具的“版权说明”,别辛辛苦苦做了张商用图,最后吃了官司,那就亏大了。

    可以生成图像的ai是什么,怎么用

    第三个坑是人物五官“歪瓜裂枣”,这是新手最常遇到的问题——生成的风景、静物都好好的,一到人物就“翻车”,不是眼睛画歪了,就是嘴巴像咧到耳朵根,甚至多出几根手指,其实解决办法很简单:在提示词里加上“人物五官清晰,比例正常,细节精致”,或者直接用专门画人物的模型(比如Stable Diffusion的“RealVis”模型),亲测有效。

    第四个坑是盲目追求“高清”,有些新手觉得“分辨率越高越好”,上来就选“4K”“8K”,结果等了半天生成的图还是模糊的,其实AI生成图像有个“上限”,比如MidJourney免费版最高只能生成1024x1024的图,强行拉大尺寸只会让画面变糊,如果需要高清图,可以先生成小图,再用“放大工具”(比如Stable Diffusion的“高清修复”功能)处理,效果比直接生成大图好得多。

    第五个坑是把AI当“全能神”,有些人觉得“只要我想不到,没有AI画不到”,结果发现生成“一只猫骑在狗身上,狗还在骑自行车”这种复杂动作时,AI经常“卡壳”——不是猫掉下来了,就是自行车轮子少个辐条,这是因为AI对“动态姿势”的理解还不够完美,遇到这种情况,可以先让AI生成静态的“猫坐在狗背上”,再单独生成“狗骑自行车”,最后用PS合成,虽然麻烦点,但效果能好不少。

  • 进阶技巧:让你的图像更有“灵魂”

    如果你用腻了“基础款”,想让生成的图像更有“个人特色”,可以试试这些进阶技巧,第一个技巧是给AI“喂参考图”,很多工具(比如Stable Diffusion、文心一格)都支持上传参考图,你可以把喜欢的画风、颜色、构图照片传给AI,让它“照着葫芦画瓢”,比如你喜欢宫崎骏动画的配色,就上传一张《龙猫》的截图,再加上提示词“参考此图的色彩风格,画一只猫坐在公交车上”,生成的图就能自带“宫崎骏滤镜”。

    第二个技巧是用“负面提示词”排除干扰,除了告诉AI“要画什么”,你还可以告诉它“不要画什么”,这就是“负面提示词”,比如你想画“写实风格的猫”,可以在负面提示词里写“卡通,二次元,模糊,低质量,变形”,这样AI就不会给你生成Q版猫了,负面提示词一般放在专门的输入框(比如Stable Diffusion的“Negative Prompt”框),效果立竿见影。

    第三个技巧是“混搭风格”玩出新鲜感,别局限于一种风格,试试把两种风格“杂交”一下,可能会有惊喜,赛博朋克风格的山水画”“梵高星空风格的城市夜景”“水墨风格的科幻飞船”,这些“跨界组合”往往能生成让人眼前一亮的作品,我之前试过“浮世绘风格的宇航员”,生成的图既有日本传统版画的线条感,又有科幻元素的未来感,发朋友圈点赞量超高。

    第四个技巧是“分步骤生成”复杂场景,遇到“有很多元素的复杂画面”,一个充满各种奇幻生物的森林,有会飞的鱼、发光的树、坐在蘑菇上的小精灵”,直接让AI一次性生成,很容易“乱成一锅粥”,这时候可以分步骤来:先让AI生成“发光的树和森林背景”,保存下来;再生成“会飞的鱼”,保存下来;最后生成“小精灵坐在蘑菇上”,然后用PS把这些元素合成到背景里,这样每个元素都能精细控制,画面也更和谐。

欢迎 发表评论:

请填写验证码

评论列表

暂无评论,快抢沙发吧~