首页 每日新资讯 DGM深度生成模型是什么,如何简单上手应用

DGM深度生成模型是什么,如何简单上手应用

作者:每日新资讯
发布时间: 浏览量:1 0

DGM深度生成模型基础信息

我第一次听到DGM这个词,是在刷技术博主视频时,弹幕里有人刷“现在做AI都绕不开DGM”,查了资料才知道,DGM全称是深度生成模型,简单说就是让计算机像人一样“创造”新东西的技术,它靠深度学习算法从大量数据里学规律,然后生成没见过的新数据,比如让AI画一幅没存在过的画,写一段没发表过的故事,甚至合成一段逼真的语音。

这技术不算特别新,十年前就有雏形了,早期的DGM像个刚学说话的小孩,生成的东西糊成一团,比如让它画猫,出来的可能是长着翅膀的四不像,近几年算力变强,数据变多,DGM突然像开了窍,现在生成的图像能骗过不少人眼,写的文案也像模像样,难怪越来越多人想了解它。

DGM的核心技术类型

DGM家族里有几个“明星成员”,各有各的脾气,先说说VAE,全称变分自编码器,性格像个“老好人”,生成的数据很稳定但不够惊艳,适合做数据压缩或者简单的图像生成,我试过用VAE生成手写数字,它总能规规矩矩画出像模像样的0到9,就是少点“灵气”。

GAN就不一样了,生成对抗网络,名字里带“对抗”,性格也火爆,它有两个“小人”在打架:一个负责生成假数据(生成器),一个负责挑错(判别器),刚开始生成器像个捣蛋鬼,画的人脸歪鼻子斜眼,判别器就毫不留情打叉;打多了生成器慢慢学乖,最后能画出连判别器都分不清真假的图像,但GAN脾气倔,训练时经常“罢工”,参数调不好就生成一堆乱码,我之前调一个GAN模型,三天没睡好才让它稳定下来。

现在最火的是扩散模型,性格像个“耐心的画家”,它生成数据时不慌不忙:先给一张纯白图片加点“噪音”变模糊,再一点点把噪音去掉,慢慢把模糊的图变清晰,就像我们画画从草稿到上色,一步一步来,所以生成的图像细节超棒, Stable Diffusion、Midjourney这些AI绘画工具,背后基本都是扩散模型在撑场面。

DGM的实际应用场景

DGM早就悄悄走进我们生活了,最常见的是AI绘画,我闺蜜开小红书账号,发穿搭笔记需要配图,她不会画画,就用DGM工具输入“法式碎花裙,背景是巴黎街道,阳光滤镜”,生成十几张图,挑一张P掉瑕疵就能用,比请摄影师省了好几百块。

DGM深度生成模型是什么,如何简单上手应用

文本生成也是DGM的强项,我弟写作文总凑不够字数,我教他用基于DGM的AI工具,输入“我的暑假生活,600字,幽默风格”,工具秒出一篇,里面写“暑假帮妈妈浇花,把多肉浇烂了,妈妈说我这是‘爱心泛滥式谋杀’”,把我笑喷,稍微改改就是篇不错的作文(当然前提是他自己先构思,不能全抄)。

还有语音合成,游戏里的NPC voice、导航APP的声音,很多都是DGM做的,我老家方言快没人说了,去年参加了一个方言保护项目,用DGM把收集到的老人方言录音“学”下来,生成了带方言味的语音包,现在手机导航能用奶奶的声音指路,听着特别亲切。

甚至工业设计也在用DGM,我表哥在车企上班,他们用DGM生成汽车零部件草图,以前设计师画十个方案要一周,现在DGM半小时出五十个,设计师再挑着改,效率翻倍,他说现在加班都少了。

使用DGM的注意要点

用DGM有个“铁律”:数据质量决定一切,就像做饭要新鲜食材,DGM学的数据垃圾,生成的东西也垃圾,我之前想让DGM生成“古风美女”,随便从网上找了几百张模糊的图片当训练数据,结果生成的美女不是三只眼睛就是脖子歪成S形,后来换成高清的古装剧剧照,效果立马好起来,这才明白“巧妇难为无米之炊”。

别迷信“傻瓜操作”,调参是门技术活,很多人觉得用现成的DGM工具点点鼠标就行,其实不然,上次用某AI绘画工具,默认参数生成的“赛博朋克猫”像只发光的刺猬,我查教程调了“采样步数”和“CFG值”,把步数从20调到50,CFG值从7降到5,猫的毛发瞬间清晰,眼神也灵动多了,原来参数就像调料,放多放少味道差远了。

最容易踩坑的是伦理风险,前阵子刷到新闻,有人用DGM生成假的明星代言图发网上,结果被品牌方告了,我现在用DGM有个习惯:生成真人相关内容时,要么注明“AI生成”,要么干脆不生成真人,画点风景、动物啥的,上次帮同学做PPT,用DGM生成“未来城市”插画,标注了“AI辅助创作”,老师还夸有创意,安全第一嘛。

DGM和传统生成方法的区别

传统生成方法像“填模板”,DGM像“自由创作”,以前做文本生成,用的是“规则法”,比如写天气预报,就固定“今天XX地区,晴,气温XX度”的模板,换几个词就行,DGM却像学过写作的学生,给个主题“秋天的公园”,它能写“枫叶把小路铺成红毯,长椅上坐着打盹的爷爷,风把他的报纸吹得哗啦响”,细节多到不像机器写的。

传统方法“死板”,DGM“灵活”,传统图像生成靠“统计法”,比如生成人脸,就是把数据库里眼睛、鼻子的平均形状拼一起,出来的人脸都长一个样,像流水线产品,DGM会“理解”特征,比如它知道“单眼皮”“高鼻梁”是啥样,能把不同特征组合,生成千奇百怪的人脸,有次我让它生成“外星人版猫脸”,它居然给猫加了触角和发光眼睛,脑洞比我还大。

传统方法“挑食”,DGM“不忌口”,传统模型只能处理单一类型数据,比如文本模型只能玩文字,图像模型只能搞图片,DGM却能“跨界”,现在有种叫多模态DGM的,给它一段文字“夕阳下的海边,浪花拍打着礁石”,它能直接生成对应的图像,甚至还能配上一段海浪声,简直是“全能选手”,传统方法看了都得喊“大佬”。

新手入门DGM的简单步骤

别一上来就啃大部头,先玩现成工具找感觉,我入门时没直接学代码,而是先玩在线DGM工具,比如用Stable Diffusion生成表情包,用ChatGPT(底层也用到DGM技术)写小故事,玩了两周,我慢慢明白“哦,原来DGM就是干这个的”,兴趣上来了再学技术,比硬啃公式轻松多了。

基础概念不用钻牛角尖,抓住核心就行,刚开始看到“ latent space ”“ probability distribution ”这些词头大,后来听一个博主说:“你就把DGM想成学画画的过程,数据是老师的画,模型是学生,生成新画就是学生临摹后自己创作。”一下就懂了!现在我也不管啥“变分下界”,先知道“模型要学数据规律”这个核心,其他慢慢补。

动手跑代码比看书有用,从最小模型开始,我跟着B站教程,用PyTorch跑了个“生成MNIST手写数字”的小模型,代码就几十行,数据集也小,看着屏幕上从模糊的点慢慢变成清晰的“5”和“8”,比打游戏还兴奋,跑通小模型后,再试着改参数,比如把“隐藏层神经元数”从64调到128,看生成效果有啥变化,实践出真知嘛。

找个小目标驱动学习,别漫无目的地学,我表妹学DGM时,定了个目标“用DGM生成我们家猫咪的表情包”,为了实现这个目标,她主动去查“如何收集猫咪图片数据”“如何用VAE模型训练”,遇到问题就搜教程,三个月后真的做出了一套猫咪表情包,发朋友圈获赞无数,现在她还在琢磨怎么让猫咪表情包动起来呢。

常见问题解答

DGM很难学吗?需要数学基础吗?

其实没那么吓人!刚开始我也觉得数学公式像天书,什么“KL散度”“梯度下降”,看一眼就头疼,后来跟着B站上的“零基础DGM入门”课,老师说“先别管公式,就当玩游戏”,我跟着用现成的代码跑了个生成小花的模型,看着电脑屏幕上慢慢长出五颜六色的小花,居然有点感动,现在我也就懂点高中数学,遇到不懂的术语就查“XX是什么意思 通俗解释”,慢慢也能调调简单的参数了,你要是感兴趣,从玩工具开始,绝对能入门!

个人电脑能跑DGM模型吗?会不会很卡?

普通笔记本跑大模型肯定卡,就像让自行车拉卡车,但你可以先玩小模型呀!比如生成简单的文字、小尺寸图像,数据量小,模型也小,我用五年前买的旧笔记本(i5处理器,8G内存),跑个生成“100张28x28像素手写数字”的模型,也就等40分钟,中间还能刷刷手机,要是想玩大的,就用Google Colab,免费提供GPU,相当于借谷歌的电脑用,生成高清图像也不卡,我上周用Colab生成了一张“赛博朋克风的猫”,才花了5分钟,香得很!

DGM生成的内容会侵权吗?比如用它画明星的图。

这个真得注意!之前有网友用DGM生成某明星的“代言照”发网上,结果被明星工作室警告了,说侵犯肖像权,我现在有个原则:不生成真人,尤其是明星、公众人物;如果生成的图参考了别人的作品,一定要注明“AI生成,参考XX风格”,上次我用DGM生成了一幅“梵高风格的星空猫”,特意在图上写了“AI生成,致敬梵高《星月夜》”,发在社交平台上,还被几个画画博主夸“有版权意识”呢!别用DGM搞擦边球,安全第一。

DGM和现在流行的AI绘画工具啥关系?

简单说,AI绘画工具就是DGM的“成品玩具”,DGM是“做玩具的技术”!比如你用Midjourney画画,背后其实是DGM家族的“扩散模型”在工作:先给一张全是噪音的图,然后一点点去掉噪音,变成你想要的画,就像你玩遥控车,不用知道发动机怎么造,但遥控车能跑,靠的就是发动机技术,现在学DGM,就像学怎么造遥控车发动机,以后说不定能做出自己专属的AI绘画工具,只生成二次元猫耳娘”的工具,想想就很酷!

学DGM以后能干嘛?就业前景怎么样?

前景老广了!现在互联网公司、游戏公司、广告公司都在招DGM相关岗位,我表哥学DGM后去了一家游戏公司,专门用DGM生成游戏场景,以前美术团队画一个场景要一周,他用DGM半小时生成十个方案,现在月薪比我高不少,还有人用DGM做AI换脸(合法合规的那种)、生成虚拟主播、辅助药物研发,甚至帮博物馆修复老照片,我邻居阿姨退休了学DGM,现在在网上教老人用AI绘画工具,还赚了不少零花钱,只要你把DGM玩明白,不愁没地方用!

欢迎 发表评论:

请填写验证码

评论列表

暂无评论,快抢沙发吧~