人月聊IT谈Genspark测试结论及AI工具生成PPT:推荐DeepSeek+Napkin模式
Hello,大家好,我是人月聊IT。
前面,我讲通用AI智能体时专门谈到过,那时,对其进行了简单测试与验证,基本结论是略弱于Manus和的,不过,比智谱清言沉思,Kimi的深度探索明显强许多,毕竟,这是前百度高管出来创业新推出的产品。
至于AI工具去生成PPT,我之前也特意讲过这事儿,当下实际情况是,AI一键生成PPT基本上没办法用,更为推荐诸如结合分页这种方式来生成PPT。
当时我专门写了一篇文章详细说明。
+ AI来做PPT,要转变一键生成PPT的思路
与此同时,我还尝试使用了诸如 +Kimi 的等同类型产品,还有 AIPPT,以及源自百度、讯飞的形形色色相类似的 AI 生成 PPT 的产品或者工具,然而最终的效果普遍难以达至令人满意的良好程度 。
在你明确了PPT材料的听众需求以及目标之后,支撑PPT的核心依然是内在的结构化逻辑,结构化逻辑最终借助你的PPT材料来进行呈现与表达,然而在逻辑和呈现之间还存在着一个关键的步骤。
这个步骤就是结构化。
你唯有将内容的结构化做好,你才明晰该采取怎样的构图方式去进行呈现,而这个在我谈及思维类文章之时常常被提到的结构化,其核心的结构化涵盖了静态结构以及动态结构,它们对应着不同的呈现方式。
静态结构的核心是组成要素,其常见呈现方式有表格化,矩阵,思维导图等。动态结构的核心是时间线索,其常见表达方式有阶段,活动,流程,成长和演进路线等。
这便是我所着重指出的,PPT制作当中最关键的两个要点,逻辑与结构。倘若掌握了这个,所有类似的PPT制作工具,模板都无关紧要。哪怕你不运用任何图表,采用全文字以及条目化的形式来撰写这个PPT,它仍旧是一个质量上乘的PPT。
那么现在AI-PPT工具真正的问题在哪里呢?
就是我们之前所谈到的,多数AI工具实际上相当难以切实领会生成的文档纲要的核心语义,将对应的结构逻辑拆分出来,并挑选最为恰当的构图方式去进行呈现。这才是当下AI-PPT最为关键要命之处,也就是图无法准确传达意思,利用错误的构图去描绘AI生成的内容纲要。我忽然发觉,这跟我们创建PPT之际,瞅见漂亮的PPT模板便爱不释手,强行把内容套进PPT模板是一样的。
然而,当前阶段,大部分的AI-PPT工具正处于此状况。但需知晓,当我回顾往昔之前所写的那篇文章之际,即便予以采用,也并未将逻辑以及结构化的问题全然解决。
落后思路-文字套模板
也就是说,传统PPT生成,不管采用何种工具,其核心思路是,先对文字实施分类、拆分、条目化等结构化提炼工作。接着,把结构化提炼后的文字内容,套入预设的各类PPT图形化模板。要是由静态结构构成,就套用组成结构模板;要是属于动态阶段流程,就套用流程类模板。

传统PPT生成,在动态阶段流程处理方面,常常力不从心,并且仅仅只是解决了动态流程图模板的套用问题。
文字结构化再讨论模板不应该是PPT生成的关键思路。
新思路-文字转逻辑或结构化图表
这里面的关键问题在于,AI需要真正去理解文字的内在结构逻辑,而后把这种理解变成一种呈现方式,这种呈现方式类似咨询公司常用的结构图,似软件架构设计中常用的逻辑图,如常用的交互图这般进行呈现。
这才是一种真正具备内在生命力的PPT。
事实上我自己一直都在思索这个问题,这里面涵盖了我之前做过的大量诸如写文章,利用SVG绘制逻辑图之类的实践。因而当时我所设想的一种能够行得通的思路应当是:利用AI去理解目标需求或者已有的文章内容,在理解之后对文字内容予以拆分,在拆分之际着重展现其内在的逻辑结构以及关系,随后借助SVG代码来达成框架图以及逻辑图的绘制,最终再把文字内容以及构图进行输出且最终形成完整的PPT。
这样的PPT才是我们需要的PPT。
那么,当前新推出的AI幻灯片功能,是按照这个思路达成的,只是其未采用SVG绘图,而是运用Html + JS图表绘图去制作单页PPT,整体思路依旧是对已有文档予以理解与拆分,梳理文档目录结构,随后逐页生成PPT内容,核心变化在于每页PPT内容不是简单的文字归类,而是呈现文字内在逻辑的结构图,逻辑图。
此后的历史文档之类的,如同Word跟PDF文档那样一键生成PPT的核心思路便是如此 。
也正是基于这样的缘由,经我个人试用之后发觉,至少就当下而言,在针对已有历史文档一键生成PPT承接这一方面,当下它堪称最强王者 。
下面我们来看下整体使用的效果如何。
背景情况是,我打算把我已有的一份有关项目管理计划最佳实践的Word文档变为PPT汇报材料,整个文档部分截图如下:
那么我们,就上传这类相关材料,给让AI,基于该文档,帮我们去生成PPT,这个时候,AI初步分析完成后,给出的PPT纲要,结构图规划如下:
能看到,是按照我文档里的内容做了章节拆分,进行了结构图以及逻辑图的规划,有了这个内容后,自然而然地就是去详细生成每页PPT的内容,对于最终生成的PPT内容,当下能够导出为PDF格式,或者是PPT可编辑的格式。

我们看下最终生成的效果内容:
以下便是帮我完整生成的 PPT。由这个完整实例能够看出,伴随 AI 智能体深度思考能力的加速进化,基于历史文档一键生成 PPT 全然可行可行。这般的 PPT 并非单纯的框图套用呈现,切实把文字逻辑转化成了结构图或者逻辑图亦或是图表,切实展现出每页内容文字加图加表的综合展示了。
至少你看了上面内容,会感觉跟咨询公司输出PPT的思路相当接近,且与咨询公司输出PPT的风格也相当接近。预计再过半年,基于文档生成汇报类PPT将完全不再需要人为过多干预,就可以完成。预计再过1年,基于文档生成汇报类PPT将完全不再需要人为过多干预,就可以完成。类似我前面研究的另外一个主题,即AI后续将具备生成完整的图文并茂的方案的能力。就像我前面研究的另外一个主题,即AI后续将具备生成完整的图文并茂的文章的能力。
自然产品自身需付费,我仅能做一回简易的测试以及验证,然而起码表明一键生成PPT此路径已构成全新的方法与渠道,全然可行,后续这块的演进与发展着实值得期待。
再次说明,要对AI的进化持敬畏之心。
今天分享到这儿了,期望能给大伙带来启发。当然喽,要是你对Agent开发且定制熟悉,那你绝对能够参照我先前给出的思路,自行去设计,联合等辅助工具来达成一个文档一键转PPT的小应用。


欢迎 你 发表评论: