怎么生成ai图片,新手入门教程与实用技巧
-
新手必看:AI图片生成工具怎么选
作为刚接触AI图片生成的小白,第一步肯定会犯嘀咕:这么多工具,到底哪个适合我?别慌,我来给你捋捋目前市面上比较火的几款,各有各的脾气,总有一款能戳中你的心巴。
先说说国外的“顶流”——MidJourney,这家伙就像个脾气超好的美术生,你随便说点啥,它都能给你画出个八九不离十,操作也简单,注册个Discord账号,加入它的服务器,输入“/imagine”再加上你的描述,坐等几分钟就行,不过它是付费的,免费额度用完就得掏钱,适合想追求高质量图片又不差钱的小伙伴。
再看咱们国内的“选手”——文心一格,百度家的孩子,对中文提示词的理解那叫一个丝滑,不用翻墙,直接网页或者APP就能用,免费额度还不少,生成速度也快,就像点外卖一样,下单没多久就能“收货”,如果你习惯用中文描述,又不想折腾,选它准没错。
还有个“全能选手”叫Stable Diffusion,开源免费,就像一个可以自己组装的乐高玩具,你想改哪里改哪里,插件多到眼花缭乱,但缺点是需要在电脑上配置,对电脑配置有点要求,显卡不行的话生成图片能让你等到花儿都谢了,适合喜欢折腾、想深入研究的技术党,新手小白慎入,不然可能对着一堆英文设置界面直接“劝退”。
哦对了,还有OpenAI的DALL-E,和ChatGPT是“同门师兄弟”,生成的图片风格偏卡通可爱,脑洞特别大,让它画个“会飞的披萨猫”都能给你整出来,不过国内访问需要点小技巧,而且免费额度也有限,适合偶尔想“开脑洞”玩玩的朋友。

-
提示词怎么写?手把手教你“喂饱”AI
选好工具只是第一步,想让AI画出你心里的画面,还得学会“说话”——也就是写提示词,很多人生成的图片“跑偏”,不是AI不行,是你没把“需求”说清楚,就像你去理发店,跟Tony老师说“剪短点”,结果可能短到扎不起来,所以提示词得像写“详细订单”一样,主体+风格+细节+参数,一样都不能少。
先看主体,这是图片的“主角”,得明确是谁或者是什么,比如你想画一只猫,不能只说“猫”,得说“一只橘色的胖猫”,再具体点“一只戴着蓝色蝴蝶结的橘色胖猫”,AI才知道要画啥,我试过只输入“猫”,结果出来一只长着翅膀的外星猫,差点以为自己打开了科幻片剧本。
然后是风格,这决定了图片的“画风”,是想写实一点,还是卡通、油画、水彩?卡通风格”“梵高油画风格”“赛博朋克风”,不同的风格会让同一只猫呈现完全不同的感觉,上次我给“橘色胖猫”加上“吉卜力动画风格”,出来的图片简直像从《龙猫》里走出来的,萌到犯规。
接着是细节,这是让图片“活起来”的关键,包括场景、动作、表情、光影、背景等等,在草地上晒太阳的橘色胖猫,眼睛眯成一条缝,爪子抱着一个毛线球,背景有粉色的樱花飘落,阳光从树叶间洒下来”,你看,这样描述下来,画面是不是一下子就清晰了?细节越丰富,AI“脑补”的空间就越小,生成的图片也就越贴近你的想法。
参数,有些工具支持在提示词里加参数,高清”“8K分辨率”“全身像”“特写镜头”,想要图片更清晰就加“高清,8K”,想要突出脸部就加“特写镜头,脸部细节丰富”,不过参数不用加太多,不然AI可能会“ confusion”,适可而止就好。
-
参数调整小技巧,让图片“美到犯规”
选好工具、写好提示词,接下来就是“微调”环节——调整参数,别以为参数是技术大佬的专利,其实就像做饭时放盐,放多了太咸,放少了没味,掌握几个关键参数,你也能让图片“色香味俱全”。
第一个重要参数是Steps(生成步数),简单说就是AI画这幅画要“描多少笔”,步数太低,比如10步,图片会模糊不清,像没画完的草稿;步数太高,比如100步,虽然细节更多,但生成速度会变慢,而且超过一定步数后,效果提升不大,有点“费力不讨好”,新手建议设20-30步,既能保证清晰度,生成速度也不会太慢,亲测这个区间“性价比”最高。
第二个参数是CFG Scale(提示词遵循度),这个参数控制AI“听不听话”,数值越低(比如1-3),AI发挥空间越大,可能会给你惊喜,但也可能跑偏;数值越高(比如15-20),AI会严格按照提示词来,但画面可能会僵硬,缺乏灵气,一般建议设7-10,就像和朋友聊天,既尊重对方的想法,又保留自己的创意,平衡感刚刚好,我之前试过把CFG Scale调到20,结果生成的“微笑的女孩”笑得比哭还僵硬,活生生变成了“假笑男孩”翻版,尴尬得脚趾抠出三室一厅。

还有一个参数叫“Seed(种子值)”,相当于图片的“身份证号”,同一个提示词和参数,用相同的Seed值,能生成一模一样的图片;如果想在原图基础上微调,可以用同一个Seed值,只改部分提示词或参数,这样画面不会“大变样”,比如你生成了一张满意的猫图片,但想换个背景,就可以记下Seed值,只改背景提示词,AI就会在原来的猫的基础上换背景,不用重新“画”一只猫,省事儿多了。
不同工具的参数名称可能不一样,比如MidJourney里叫“--s”(Steps)和“--c”(CFG Scale),Stable Diffusion直接显示中文“生成步数”和“提示词相关性”,但作用都差不多,刚开始不用记太多,先把这三个参数玩明白,就能应付大部分场景了。
-
手机也能玩?随时随地生成AI图片
谁说生成AI图片一定要用电脑?现在手机性能越来越强,揣着手机就能当“AI画家”,等地铁、排队买奶茶的时候都能随手“创作”,简直是碎片时间的“快乐源泉”(摸鱼党狂喜,但别告诉老板)。
先推荐文心一格APP,百度家的产品,对手机配置要求不高,千元机也能流畅运行,打开APP后,注册登录(用百度账号就行,很方便),首页就能看到“AI作画”入口,点击进去输入提示词,一只穿着汉服的柯基在故宫里散步”,然后选择风格,有“二次元”“写实”“油画”等十几种,选好后点击“生成”,大概30秒到1分钟就能出图,生成完直接保存到手机相册,操作简单到我奶奶看一遍都能学会。
另一款是讯飞星火APP,科大讯飞出品,除了生成图片,还能语音输入提示词,对懒人太友好了——直接对着手机说“画一张蓝色的天空下有白色城堡和独角兽”,它就能自动识别文字,省去打字的功夫,而且它的“风格迁移”功能很有意思,你拍一张自己的照片,选择“梵高风格”,它能把你的照片变成梵高油画风,发朋友圈绝对能收获一堆“哇塞”评论,我上次把我家狗的照片用“赛博朋克风格”处理了一下,结果它变成了“机械狗战士”,眼神犀利得像要去拯救世界,把我妈吓了一跳,以为我给狗P图过度了。
如果你想用MidJourney,手机上可以直接用它的网页版,在浏览器里打开MidJourney官网,登录账号后和电脑端操作一样,输入“/imagine”加提示词就行,就是生成速度比电脑慢一点,毕竟手机浏览器性能有限,不过胜在方便,出门在外突然有灵感了,掏手机就能记录,比拿个笔记本画速写还快。
手机生成图片要注意两点:一是尽量在WiFi环境下,生成图片会消耗一定流量,特别是高清图片,一张可能要几MB;二是生成时别后台开太多APP,不然手机可能会卡顿,影响生成速度,手机端工具主打一个“方便快捷”,虽然功能没有电脑端全,但日常娱乐、发朋友圈足够用了。
-
版权问题别忽视,这些坑要避开
生成了好看的AI图片,别光顾着高兴,版权问题可得拎清楚,不然辛辛苦苦做的图,最后因为侵权被下架甚至索赔,那就亏大了,毕竟现在AI生成内容的版权还在“摸着石头过河”,不同平台、不同国家的规定都不一样,咱们得提前“避雷”。

先看国外平台,比如MidJourney,免费用户生成的图片,个人使用没问题,但不能商用(比如印在T恤上卖钱、用作广告图);订阅用户(付费)生成的图片,个人和商用都可以,但不能用来训练其他AI模型,也不能生成违法违规的内容,之前有网友用MidJourney生成图片印在手机壳上卖,结果被平台警告,还赔了一笔钱,血的教训啊。
国内平台相对“接地气”一点,比如文心一格和讯飞星火,用户协议里一般规定:用户对生成的图片拥有非独占使用权,可以用于个人学习、分享、非商业用途;如果要商用,需要单独联系平台购买版权,或者平台会根据商用场景收取一定费用,简单说就是,发朋友圈、做个人头像随便用,但要是想用在公司宣传册、产品包装上,就得先跟平台打招呼,别“先斩后奏”。
还有一个坑是“提示词侵权”,如果你在提示词里用了受版权保护的内容,画一个和《冰雪奇缘》里艾莎一模一样的公主”,生成的图片可能会侵犯迪士尼的版权,就算平台不管,迪士尼的律师函也可能“找上门”,所以提示词里尽量用原创的描述,别直接抄别人的角色、logo、作品,不然“AI生成”也救不了你。
最后提醒一句,现在很多平台会在生成的图片角落加“AI生成”水印,虽然可以去掉,但建议保留,一方面是尊重平台规则,另一方面也能告诉别人这是AI生成的,避免误会,毕竟“原创不易,侵权达咩”,咱们玩AI也要守规矩,才能一直快乐“创作”下去。
-
进阶玩法:让AI图片更有“灵魂”
当你熟练掌握了基础操作,就可以试试进阶玩法,让AI图片不止“好看”,还能“有故事”“有情绪”,成为真正的“作品”而不是“随手拍”。
第一个进阶技巧是“多图融合”,就是把两张不同的图片“杂交”一下,生成新图片,比如你有一张自己拍的风景照,还有一张喜欢的动漫人物图,用Stable Diffusion的“图生图”功能,把风景照当“底图”,动漫人物图当“参考图”,输入提示词“让动漫人物站在风景照的湖边,保持人物风格和风景色调一致”,AI就能把人物“P”进风景里,而且融合得特别自然,比PS抠图还方便,我试过把我家猫的照片和梵高的《星月夜》融合,生成了一张“猫在星月夜中奔跑”的图片,发朋友圈后被问了N次“这是怎么拍的”,成就感拉满。
第二个是“风格迁移+自定义模型”,除了平台自带的风格,你还可以训练自己的“风格模型”,比如你特别喜欢宫崎骏的动画风格,可以找10-20张宫崎骏动画的截图,用Stable Diffusion的“LoRA训练”功能,训练一个宫崎骏风格的模型,以后生成图片时加载这个模型,输入任何提示词都会带上宫崎骏的画风,相当于拥有了“私人定制”的画风滤镜,不过训练模型需要一定的电脑配置和时间,新手可以先从网上下载别人训练好的模型,迪士尼风格LoRA”“中国风LoRA”,直接用现成的,省事儿又好玩。
还有“动态图生成”,有些工具比如Pika Labs,可以生成AI动态图片,让静止的画面“动起来”,比如输入提示词“一只狐狸在雪地里奔跑,雪花飘落,背景有月亮”,生成的动态图里,狐狸会真的跑起来,雪花也会飘,就像一段小动画,虽然现在动态图的清晰度和时长还有限,但已经足够发短视频、做表情包了,趣味性直接翻倍。
进阶玩法还有很多,3D模型生成”“AI+实拍结合”等等,慢慢探索就像开盲盒,总能发现新的乐趣,不过记住,技术是为创意服务的,别沉迷于参数和技巧,忘了最初想表达的内容,毕竟“好看的皮囊千篇一律,有趣的灵魂万里挑一”,AI图片也一样。




欢迎 你 发表评论: