昨晚直播观点整理：AI Coding工具产品形态及相关技术分享

作者：每日干货分享

发布时间：2025-11-04 14:40:32 浏览量：39 0

把昨天夜里直播的某些观点整理成文字稿，由于直播时间受限且主要是以一种QA的方式进行，因而好多观点没能补充充分的上下文，或许会致使听众听着有些跳脱。

留意我！身为一位产品工程师，还是一名野生技术顾问，出版了《编程：从入门到实践》《从零构建企业级RAG系统》这两本AI实战书籍，助你把握那可落地、能复制的AI应用途径。

当前 AI 工具的不同产品形态

确切来讲，产品形态的数量是 5 种没错，然而呢能够将其合并起来变为 3 种，具体如下分别是：

独立 IDE（及 IDE 插件）

IDE 能力主要涵盖三大板块，其一为自动补全，此乃最为基础且高频的能力，它以实时、行内代码建议的形式呈现；其二是聊天，这属于交互式的对话层面，开发者能够借助自然语言进行提问、对代码加以解释以及生成代码片段；最后是智能体，它属于自主执行层面。AI 不再只是被动地做出响应，而是能够主动地进行规划，去执行那些跨越了多个文件以及多个步骤的复杂任务，比如完成一项功能开发或者修复一个 bug 。

Cloud（及 bot 模式）

在那CI/CD流程里头，借助指定Agent达成自动bug修复、处理冲突或者Code功能，于流程方面和Cloud那种模式是一样的，并且还启动了一个云端隔离环境（做得粗糙一点儿的仅仅读取当下issue的上下文，这种我觉着不靠谱 ‍↔️），去下载仓库，读取项目来开展操作，下面呈现的是当前的一组数据情形（PR总提交数与成功合并数）。

Agent 模式PR提交情况

我当下就是，呈Code固定组合状态，其余的呢，皆是在进行尝试新鲜体验之后，往后便会抛弃掉的那种了。

更看好哪种发展路径？理想的 AI 工具形态是怎样的？

纯 Cloud 模式无疑是理想状态，在当下 IDE 的情形中，人和 AI 于同一界面里进行同步协作，这实在不怎么优雅，而将 Cloud 模式多个同时启动，分配好任务后各干各的，那必定是未来，上限会更高。率先采用 Cloud 模式的必定是 Devin，虽说如今大家不再讨论此事，可人家 B 端营收增长极为迅猛（两周前刚以 102 亿美元估值完成 4 亿美元 C 轮融资），妥妥的数字员工，走的是 10 倍生产力路线。

然而程序员当中的大多数是颇为挑剔的，他们必然要求具备掌控感，在短期内必定会呈现出三种形态同时存在的状况，并且将三种形态下的产品状态实现贯通乃是最为理想的，当下唯有codex达成了这点，它能够在同步也就是人机协作以及异步也就是云端自运行这两种模式之间进行毫无缝隙的转换。

然而，IDE，也就是对标，以及对标 Code 的形态产品，其体验相当糟糕，算是盲目羡慕竞品的 KPI 所催生的产物。

AI 在编码过程中的主要发力点

不同细分任务，需要的能力有差异。

在哪些场景下体验流畅？在哪些场景下会遇到瓶颈或感到挫折？

瓶颈与挫折:

AI 的能力与局限

仅需将提示必备细节予以撰明，形成需求文档，诸如PRD之类，经由一条指向引导就能够经由模型产生一个代码行数达数万，且完备无缺，属于前端领域的项目，就像我借助nano模型的API获取的一个用于创作漫画的工具，它具备支持脚本文稿创作、分镜画面设计以及角色形态风格把控还有整体连贯性的特性。

然而，语料以及数据会对模型能力起到决定作用，各个家所擅长于编码的旗舰模型，在某些语言以及另外语言上效果颇为出众，可在 C++以及 Swift 等这类语言上呈现出来的表现却非常糟糕，并且倘若让这些模型去撰写 Linux 内核代码，哪怕你的提示词着重强调了模仿 Linus 代码哲学，可模型所写出来的内容依旧是模仿不成反类其拙，我觉得这是在架构理解层面上的注意力分配方面的问题，资深的基础设施工程师能够一眼就瞧出问题究竟出在哪里，同时也能够意识到系统的脆弱之处，模型却做不到这点，即便你把数量众多的文档给予它，它给出的解决方案也毫无特色。

流程 > 工具 > 模型

协作流程设计 > Agent 工具设计 > 模型选择

这乃是一个我跟其他老师看法全然相左的观点，在旗舰模型层面，4.1、2.5 Pro、GPT - 5 - Codex等相互间写代码的差距并非很大，并且各有其长处，我认为更为关键的是Agent工具以及协作流程设计。

前端方面的审美情况呈现为，4大于3.1，然后3.1大于或等于3.7，之后3.7又大于GLM - 4.5，接着GLM - 4.5。

2.5 Pro具备这样的特点，其debug能力十分强大，长上下文处理表现良好，设计算法堪称无敌，然而写代码时容易出现过度设计的情况，且废话较多。

4：适用于新项目刚开始启动，进行结构构建且功能实现程度较高的情况，它的精准度相对较高，在修复漏洞方面能力处于一般水平，容易致使情况朝着复杂方向发展，对于精确且以英语表述的指令应答得更出色。

3.1：后端开发不行，训练数据旧，对国外常用框架支持不足。

就我自身平常的习惯而言，当 Code 额度用光之后，依靠 Code Route 项目，前端页面运用 3.1 来编写，后端 API 借助 2.5 Flash 来编写，算法以及 debug 和重构则采用 2.5 Pro。

在Agent工具设计方面，Code依旧是最为优雅且有效的，并且其生态极其繁荣（我处于其中），Kiro自身所带的spec流程也是有值得称赞之处的，不过呢，它也是能够通过DIY的方式集成到Code当中的。

最后讲讲流程，在 Agent 设计当中着重强调上下文工程，同样在 AI 协作之中还是需要一番科学规整的上下文工程。我维护了大约 30 多个提示词，这些提示词构成了依从工具、项目、模块、角色、编程语言、任务、执行这七个层次，而后按照需求提取组合成用于一个操作的完整提示词，多数情况下是能够获取到稳定的预期结果的，。

于多 Agent 协调范畴内，我特意构思了针对 Agent 的任务管理系统，起初由人掌控（借助 spec kit 之类工具），把需求拆解成一条条任务录入全局任务状态表，每条任务的备注字段乃是依赖的上下文（涵盖 issue 的链接、文档等，主要是为人回溯提供便利），并且将任务划分成并行的（无依赖，能有效实现规模扩展）与串行的，串行的任务彼此倚仗状态更新，激发相应事件，而后开启下一个 Agent 执行周期，每个 Agent 执行进程的关键变更均需向我予以确认，如下图示。

上述全局状态表，实则为一个多维表格，最终能够借助仪表盘形式，统计某个 Agent 完成的任务数量，单个任务执行的次数，时间周期，以及向我发送的状态确认通知次数等，它是一个极简版的 AI 协作效能平台。

理想的整个流程状态是需要进一步下放权力，将研发流程与办公场景活动予以打通，达成Agent长期委托模式。通过进行统一配置，把某类工作（并非一次性任务）长期托付给Agent，在授予Agent相关权限之后，后续此类工作整体由Agent承担责任，从“AI协作人”朝着“人协作AI”迭代。毕竟一旦这一套真正运行顺畅，整个系统的瓶颈在于人的审核效率。

关乎开发者自身不变与变，关乎长期运用AI编程工具给开发者带来的影响，程序员核心竞争力究竟正怎样发生演变，AI时代关键字有哪些。

其他三位老师分别给出了：浪潮、协同、变化。

我的答案是不确定性、

微观上看，在个人日常生活中，不确定性主要表现为：

于宏观层面而言，AI时代所带来的社会方面以及结构性的变迁，致使许多传统认知变得模糊不清，或者不再具备适用性，：

对于本文之中的部分观点，实际上在先前的这三篇文章里面，已经进行过系统的阐述了，要是有感兴趣的人，是可以去阅读的哟：

参考资料

两周之前，方才以一百零二亿美元估值，达成了四亿美元的C轮融资。

PRD，位于@.endo/ ，是关于为氛围时代全新打造的prd ，并且具体是prd-a-new 。的。。（这里原句不太完整清晰，按照要求。

制作漫画的工具:

3.0（）: