AI扩图功能走红网络:从剪映到美图秀秀的图片生成应用新趋势
潮新闻客户端 执笔 祝依凡
AI扩图又出圈了。
近日,剪映推出了“智能扩图”功能,之后,让“废片”秒变“大片”的短视频登上了抖音挑战榜高位。正当网友准备借着这个来“拯救”相册里的照片时,却发现画风渐渐走偏,甚至把人扩成了树干,这让人直呼“惊掉下巴”。
网络视频截图
说起来,AI扩图并非啥新奇的话题了,7月时分,美图秀秀推出了“AI扩图”功能,这次推出使得AI扩图首次迈向大众视野,引发关注,在此种情况出现以前,妙鸭相机APP因借助AI这个手段而达成生成肖像写真的效果,进而一时间在人群中广泛流行起来 。
自那之后,人们对于AI相关应用的关注,大多是由图片生成类应用所引发出来的。引用剪映“智能扩图”的广告语,即“能够运用AI使得一张单调的照片变得极其宽广,没有边界”,那么AI图片生成类应用的未来是不是同样地无边无际、极为宽广呢?
图片社交
乐乐从事新媒体工作,对每日互联网热点相当熟悉。当她瞧见抖音突然给她推送了好些“AI扩图”相关视频时,便立刻去尝试了一番,感觉好玩又好笑,还表示:“它会带给我惊喜,不管是图片的正常延展,还是生成的一些滑稽搞笑的图片,都让我有种开盲盒的趣味。”。
国内早期时候的AI,对于不少用户来讲,是一种看不见的新技术,也是摸不着的新技术。虽然AI机器人、AI模型这类产品一直在不断推出,可是大多把它们应用于工业和企业端,大众很难切实亲身感觉到它们所带来的好处。一直到近些年,当AI跟写作、绘画等产品结合之后,用户能够亲自参与在其中,极大地增强了体验感。
图源:视觉中国
而相较于文字而言,图片毫无疑问是更为直观的呈现形式。判断一段文字的优劣状况,得耗费几分钟予以阅读,然而判断一张图片是否契合你的须要,或者是否能够带来情绪方面的价值,仅仅只需几秒钟而已。
程振波,浙江工业大学计算机科学与技术学院、软件学院的副教授,称:“图片类应用生成的结果相对直观,给人的冲击力颇为强烈。我们的大脑会借助视觉、听觉、嗅觉等去感知外部信息,当中超过70%的外部信息源自视觉,故而以图片形式展现的应用较为热门。”。

有记者,尝试在一款国产AI生图工具中,输入这样一句话,“玫瑰花园里有一个短发小女孩,穿着蓝色连衣裙在浇花”而该款国产AI生图工具名为“无界AI”,输入后,选择风格和尺寸,之后等待30秒,一张图片生成了,从画面整体美感,以及布局来看,基本可以满足日常图片需求。
AI行业资深从业者,无界AI联合创始人马千里称,就商业化而言,AI文生图通常比AI文生文成熟得更快。国内在AI文生文商业化方面十分审慎,这是由于文生文更易出现诸如生成反动内容等“不对齐”情况,所以监管层面也更为慎重。马千里所在的无界AI位于杭州 。
社交,属于人类生存的原始需求,然而AI图片生成类应用拥有的社交属性同样不可小看。就拿AI扩图来说,乐乐向记者展示了一些自身与朋友的照片,“我把好多朋友的照片也导入进去了,要是生成的图片十分搞笑,我就会发给他,或者发朋友圈,他们也会跟着一块儿玩。”。
在社交平台那儿,存在不少像乐乐这般的年轻人,这恰好表明当下“图片社交”特别火。互联网发展把机构对互联网图像的垄断给打破了,图像生产权持续“下沉”,如此一来人与人借助图像互动变为可行。人们在意网络世界中自己晒出的生活,特别是对年轻人而言,拍照发朋友圈收获点赞所感受到的快乐,甚至会比现实生活的感受还大。
需求的考验
红杉资本开展了一项研究,该研究把诸如被指代项、被指代项等AIGC应用,与诸如被指代项、被指代项等传统应用予以对比,结果发现,传统应用首月用户平均留存率是63%,然而AIGC应用仅仅只有42%。在用户参与度方面,传统软件平均DAU/MAU为51%,可是AIGC应用仅仅才达到14%。
留存率低,这表明AIGC应用的用户粘性呈现出较低的状况,而参与度低,那意味着用户的使用频率处于较低的水平。如此一来,为何在具有高热度的风刮过AI图片生成类应用之后,此应用未能为自身带来持续不断的热度呢?
对近日出圈的AI生图应用“AI扩图”而言,不少用户称,刚开始时觉得相当新奇,部分扩图出来的模样也是颇为好笑的。然而时间一长便觉得并非格外实用,不存在能够具体加以运用的状况,于是就感觉没那么有趣好玩了。 ,。
“最近流行的,对于普通用户而言的AI扩图,其使用场景有限,‘娱乐’用途很有噱头。”杭州的无界AI联合创始人马千里这样表示,。
就此能够看出,“娱乐”属性过度突出是当下大部分AI图片生成软件的一个显著痛点,虽说用户的破圈式传播能够给它带去短期内较为可观的流量红利,然而却无法为用户在应用层面给予长期价值 。
此外,部分AI图片生成软件在用户端难以形成稳定需求的原因,是专业性能不强。小怡从事视觉设计工作,她告诉记者,工作时她会用国外的软件来进行生图。她说,我一般会用这个软件生成图片来找灵感,要是尺寸不合适的话,就用扩图功能。对于国内的类似应用,小怡表示:没有使用过,专业性相对比较高呀,公司的同事都用这个软件。
图源:视觉中国
“国内相关应用精确度缺还需提升,如此才可规避生图之际冒词不达意状况。”身为中国“市民卡之父”、浙江大学智能教育研究中心特聘研究员的张旭光,向记者表明:所涉产品好用与否,终究得看其自身大模型底座、图片训练参数,鉴于国内当下‘智算’算力匮乏,故而生成图片质量不会那般高。

首先,AIGC带来的法律问题,对不少用户和企业造成了制约。在知识产权领域,今年1月,盖蒂图片社基于 “ ”作为“ AI”旗下训练模型非法复制以及处理数百万受版权保护图像的缘由,于伦敦高等法院对“ AI”提起诉讼。这一案件作为全球首例AIGC侵权案件,引起了广泛的关注。另外,AI侵犯肖像权、隐私权的问题,同样急需得到解决。
那么,关于C端产品怎么对消费者构成长线需求,张旭光觉得,其一,这类应用得持续提升自身专业性能,将生成图片的细节打造得更到位、更逼真;其二,要依据用户实际需求出发,让产品具备实际应用价值,像可为企业达成降本增效,节约设计方面的人工成本标点符号。
走入寻常百姓家
近段时间,AI图片生成行业出圈的产品还不止一个。
11月29日,推出了Pika1.0,它具备生成以及编辑3D动画、动漫、卡通还有电影等各类风格视频的能力。当下,Pika社区已然发展到50万名用户,每周会生成数百万个视频。
使用Pika生成的视频 图源:网络
在AI视频这个行业领域,于最近的这段时间之内,整体层面迎来了一段呈现出爆发态势的时期。依据不完全的统计情况来看,自11月开始一直到现在,涵盖了Meta、字节以及AI等在内的5家相关企业所推出的AI视频生成产品,要么发布了新的版本,要么迎来了大幅度的更新。
程振波表示,在图片范畴,AI应用存在这样一个趋向,即生成和真实世界全然相同的内容,这并非仅指图像的外在模样,就连图像里各个对象之间的物理作用法则,也和真实世界毫无二致。并且,在未来,生成视频的长度会变得越来越长,像电影说不定都能够全部由AI来制作,依照技术发展趋势,未来也许每个人都有机会成为导演。
从依据文字生成图像,到由图像衍生图像,再来到如今借助文字生成视频,技术持续进行创新,这也在为用户创造出新的需求。“当下是一个短视频广泛流行的时代,Pika的出现能够使相关企业减少生产成本,并且它所达成的连续性十分良好,还极为逼真。”张旭光说道:“未来,伴随技术的向前发展,AI能够经由大模型的训练来生成图片、视频甚至3D,把它们应用于AR、VR等多种媒介当中。”。
这也就意味着,AI生图,或许还能生成3D。
今年,有着元宇宙文化实验室的清华大学发布了《AIGC发展研究报告1.0版》,该报告里提及,AIGC的未来是AIGM(AI - ),这指的是空间由人工智能技术自动生成的元宇宙,报告还认为,一旦人类完完全全转入元宇宙,AIGC便会上升为AIGM。
清华大学继续教育学院有一位担任数字化学习主管的人,同时是清华大学积极心理学指导师,还是清华大学元宇宙案例实务青蓝计划的发起人,这个人名为李璇,在一次采访当中,李璇曾作出表述声称,AIGC能够依据文字、音频、视频等之类的素材,塑造出虚拟的场景,及虚拟的人物形象,如此一来,元宇宙便会渐渐超越真实的场景,进而抵达‘虚实共存’‘灵肉双生’的高级阶段。
为此能够看出,AI图片生成类产品的运用远远不只是“扩图”,从2D朝着3D进行发展,甚至它的最终形态说不定是极致元宇宙,未来好像无限宽阔。并且期望在持续拓展未来可能性的期间,让AIGC应用切实走进平常百姓家。
欢迎 你 发表评论: