AI编程工具Devin引领代码生成赛道估值飙升，2024年融资热潮显现行业变革

作者：每日干货分享

发布时间：2025-11-07 11:07:44 浏览量：58 0

在 2024 年起始之时，具备编程全栈技能那个叫 Devin 的，震撼了整个世界，使得外界得以瞧见 AI 去改变一个行业，也就是替代程序员这种可能性。

数周后Devin发布，其背后公司随即获得1.75亿美元融资，估值从3.5亿美元一下跃升至20亿美元，紧接着，4月时，一家AI编码辅助创业公司宣布完成2.52亿美元融资，投后估值接近独角兽，代码生成赛道的多米诺骨牌效应开始出现……

截至上半年，硅谷那些从事代码生成类业务的公司，其所具有的估值起步标准已然高达2亿美金，而处于头部位置的公司估值竟然更高至20亿美金。并且，依据一位身在该行业的人士所做的分析来看，代码生成这一概念之所以会受到众人纷纷追捧，其中存在着一个非常重要的缘由是“人类所拥有的数据已经不够使用了”。

在AGI时代，有一个重要组成部分，那就是人类得依靠机器生成的数据，而代码生成的数据，其中一部分从业者觉得它是“人类朝着AGI迈进过程里最具逻辑性还有严谨性的数据”。

同一时间，网络里针对大模型代码生成提升效率而欢呼的声响越发多了起来。比如说呀，有一位来自中国的开发者就给出了这样的说法，3.5 仅靠 500 多行的 html 便能达成一个挺好的功能；另外呢，还有开发者表白，他借助 GPT - 4o 来辅助代码写作，以往开发小程序得耗费一个月时间，如今呀只需要七天就可以了……

依靠开发者所给出的反馈，大模型具有的代码生成能力，正在实实在在地促使每位开发者的工作效率获得提高。

实际上，程序员围绕“AI代码生成”展开的想象有着较长时间了嗯。在那一波生成式AI潮流还没到来之前，市场之中就已经出现了好些AI编程工具呢，像、Kite等等呀，但受到它们技术路线的限制，以往那些产品针对上下文逻辑的领会以及代码生成的品质都是不太让人意的呢。

清流资本，其合伙人是刘博，刘博告知AI科技评论，关于AI编码工具，有一个效果评估的指标，此指标是代码文件里，由模型生成代码的占比情况，上一代工具达成的占比范围是10 - 20%，然而新一代的AI编程工具，能够达到的最高点在40 - 50%，这体现出了质的飞跃，并且同时，新一代工具对于编程上下文的理解，明显更好。

微软CEO宣称，一款两年前上线的AI编程工具，在接入GPT - 4模型从而更名为“X”之后，已然开始有了盈利的情况，且拥有180万付费订阅的用户。

迄今为止，大模型迅猛发展已历经一年半时间，在全部基于大模型产生的诸多全新AI工具当中，场景的PMF以及付费意愿最早得到验证，仅仅耗费14个月就达成了1亿美元的ARR，成为历史上增速最为迅猛的SaaS产品，这跟其他场景里如昙花一现般的AI产品产生极为鲜明的对照。

几乎绝大部分的通用大模型企业都已推出了代码大模型以及AI编程助手，诸如codex，Meta Code Llama，智普，百度所拥有的，腾讯云的AI代码助手则是Coder ，等等。

在国内，创业公司的数目开始呈现出增多的态势，其中由兼具一站式研发管理平台身份的创始人张海龙所创立的AI Agent公司Babel，该公司作为企业智能化软件开发解决方案的提供方，由此受到了资本的关注，基于此，得以在2023年快速地完成了A+轮融资。

多方势力展开角逐，创业公司于混乱状况里努力争取生机，然而创业公司、通用大模型公司、科技大厂每一方仍面临AI领域发展中的通用问题，那便是，面向消费者还是面向企业用户，技术路径究竟选择通用大模型还是垂直模型，是否要自己研发模型，以及怎样在相应情势的笼罩之下实现突围。

需留意的是，因底层技术大模型能力受限，当下各类AI编程产品皆集中于该阶段，于代码补全与代码生成这两个场景展开比拼，故而从本质来讲，现今的AI编程产品依旧是AI 。

虽如此这般，“24 小时 AI 程序员”所具备的生产力仍令所有人为之迷惑，以至于心生偏好，难以释怀。

为什么对情有独钟？

目前，多数AI产品，重点致力于，代码补全这一高频场景，以及，代码生成这一高频场景。

在软件开发的智能化起始阶段，其起步点乃是代码生成以及代码补全。这是由于技术层面实现难度降低，不会致使程序员的开发模型遭受颠覆，代码补全属于整个行业中具备较高成熟度的功能，无论是大厂还是初创公司，所推出的产品均可投入使用，且具备较高的正确率。

于一个已然存在的项目之中，依据上下文去增添新功能，这样的行为称为代码补全，开发者以自然语言表述一项需求，借由代码进行生成。代码生成此刻正处于这样一层突破，即从文件级代码跃升至项目级代码。

代码生成所处阶段为初级，具备生成较好简单函数的能力，不过并非全然依赖大模型，得外挂一些知识库予以配合，无法达至百分百准确，若要扩展至文件级代码生成，难度会提升，往仓级别难度更高，Devin所展示的便是往仓级别来达成。

一位专注于代码智能研究的专家向AI科技评论透露，代码补全当下处于各方激烈争夺的关键领域，它已然切实落地，并且是程序员运用最为频繁的场景。相对而言，代码生成功能的使用频次稍低，目前要切实融入日常开发进而成为高频选择仍存在一定差距，究其原因在于，代码生成需要对程序员的开发模式以及开发习惯予以改变。

现当下，代码生成的方式依旧是，与一个对话机器人彼此交流，借助自然语言去表述需求，进而促使大模型生成一段代码，于这个进程里，持续地展开交互，呈现需求，需求表述得越是明晰，所生成的代码便越是精准。

这过程里是有关于需求拆解涉及的，把一个大需求拆解成为一个个小任务这样子，之后而去生成另外一番情况的，需求拆解就当前之下来講对这样子的模型难度还是存在的。

与此同时，鉴于编程思维与自然语言表达系不同之事，那么对于开发者而言，某人代码编写出色之情形下，并不表明其运用自然语言去表述业务逻辑亦佳，其需具备以下两方面能力。其一，得熟悉业务，其二，还需有扎实的计算机理论知识呀，其中涵盖算法、操作系统、软件工程以及计算机安全等等方面，这实际上对开发者的个人素养提出的要求特别高呢。

除了代码补全，还有代码生成这两个高频场景，其他产品要寻求差异化的出口，在于提供代码注释的能力，提供代码解读的能力，提供代码bug修复的能力，提供代码优化的能力，提供漏洞检测这般的能力。

比如说，国内的智谱做出了特别功能，就像去年年末弄出来那个工具箱，它是依据模型有着一种叫作Code代码解释器的能力开发的，可以把很多类型的文件成批处理，能成批将数据弄作可视化呈示，还能绘制数学函数的图形等等。

负责人郑勤锴持有这样的看法，即在某些事情方面为开发者节约了时间，那么开发者就能够把工作更多地放置于顶层设计之上，也就是怎样将代码的架构设计得更为优良，功能考量得更为完备，进而提升软件的质量。

智谱于2022年的时候，完成了代码大模型的训练，并且在同一时间推出了插件产品。

正如那种情况一样，其定位乃是智能辅助编程，然而辅助存在着不同的层级划分，当前已然从针对单个文件的辅助，延伸拓展到了项目级别的辅助编程，这是因为在实际的开发场景当中，根本不可能仅仅只有单个文件，大多数情况反而是存在众多之多文件。

称作负责人的郑勤锴表示，朝着项目级进行拓展时所面临的挑战存在于项目生成的成功率方面，由于代码项目通常并非仅仅由一小段代码或者一个单独文件的代码构成，而是在同一时间需要达成项目里跨文件的代码理解以及生成补全的任务，所以让模型能够尽数理解更冗长的信息，并且从中提取出关键部分，这对于模型而言要求是非常高远的。

对着参数量在10B以下的代码大模型而言，从海量的代码里精准提取信息是一项关键性的挑战。它支持128K上下文，能够处理并利用更长代码文件，包含项目代码中的信息，这是模型更深入理解复杂且细节丰富的代码的关键点。

如何跟竞争？

一位投资人认为，做 AI 编程助手没人能拼得过。

主要针对个人开发者展开 To 的面向 C 业务，其定价为每月 10 美元，换算人民币后约为 66.9 元，或者每年 100 美元，换算为人民币大约是 669 元。

对于To B企业用户而言，月费是39美元，且企业用户能够把代码部署至云端，无需在本地不断进行克隆，企业用户还能够构建内建知识库，进而形成个性化的Chat，此Chat是在原有基础上，开发者能够直接借助自然语言与之对话来处理所遇问题，甚至企业用户可以对底层模型予以微调。

去掉占据时间上的先发优势不算，还拥有两大先天的、很强优势其一是背靠那么一个代码托管平台，该平台有着上亿开发者其二是底层接入的是最强的模型。

从当下的视角去看，微软在开发者市场之上的战略始终是清晰明了的，在2015年之际推出了跨平台的代码编辑器，于用户层面进行IDE的统一，在2018 年实施了收购之举，具备了数量众多的代码数据，其中涵盖了商用的尚未公开的数据，在2019年的时候，微软朝着投入了10亿美金，并且获取了技术的商业化授权。

于是，在2020年，GPT-3被推出，之后拿着数量最为众多的代码数据去训练模型，到了隔年，一款具有AI编程功能的工具被推出，它成为了在全球范围内最早出现的一款基于大模型的AI编程工具，从而抢占了那先发的优势。

今年4月，微软CEO声称，其具备了180万付费订阅用户。

但也有多位从业者认为并非能一统天下。

"就国内市场来讲，商业化契机处于B端。"清流资本合伙人刘博向AI科技评论说道。

首先，面向 AI 编程产品的中大型企业 B 端市场大约在具有几十亿人民币这般的规模，于此部分用户付费意愿呈现得极其明确，而像这样的市场规模和客单价在软件服务市场当中已然相较客观。

就国内B端用户来讲，他们存在着两个无法获得满足的需求，其一为，模型本地部署这一需求，要是通过云端调用，就会存在代码有被泄露的风险性，并且在本地部署之后，能够依据客户的私有代码作进一步训练，从而能够显著提高代码产生的具体效果；其二是，大客户有着要挑选国内的产品来作为供应商的需求，以此去防止数据出现外流的情况。

依据上述标准去寻觅标的，清流资本于去年9月，参与了国内针对企业的智能化软件开发解决方案的提供商，展开了A+轮投资。

与其他有所差异，着重对准To B方面，针对企业给予依靠代码大模型的智能化情形中软件开发处置办法，涵盖私有化布置、企业领域内知识同大模型相融合、定制化进行开发等各类服务，。

行业所涉客户被公司充分渗透后，公司于B端市场的打法，会使公司成长为AI工具实质的行业准则，成为行业内其他企业采购AI工具时，必须邀其参与竞拍的供应方，清流资本合伙人刘博向AI科技评论这般表述。

因此从国内的商业化角度出发，先发优势和聚焦很重要。

从北京大学软件工程研究所孵化出来，于2013年起对深度学习与代码相结合展开研究，在2022年6月就发布了中国首个百亿级参数的代码大模型 -13B，它能支持方法级也就是函数级的代码补全。

李力行即为 COO，他觉得，代码大模型落实之际，怎样同企业的领域知识或者私域知识相融合极为关键，以此确保生成的代码更精准，因代码生成需要运用诸多上下文信息，以及一些外部的领域知识，领域知识涵盖企业的业务逻辑、业务知识等。

一位资深从业者认为，高质量的数据才是模型能力的区隔。

那些公开的数据，说不定哪天就会碰到瓶颈，然而世界上有着海量的私有数据，可能永远都不会公之子众，它们存于各个B端企业内部，和企业业务逻辑紧密相连，在给客户做本地部署时，会依据这些私有化数据再次训练，为每个企业塑造专属的代码大模型。

通用大模型还是垂直模型？

处于 C 端优势地位，国内玩家都共同选择了面对 C 端的免费对策，不管是智谱，还是百度，亦或是腾讯云 AI 代码助手，都推出了针对个人开发者的免费工具，而这几位厂商，就如同其他同类厂商一样，都把商业化焦点放在 B 端。

各自基座大模型上进行预训练或者微调所用到的代码数据，是它们共同的思路，相同的代码数据出自和其他可公开访问的源代码，百度、阿里、腾讯这些大厂还有源于一部分内部代码的积累。

采集数据所施展的方式、筛选数据要选用的类型、开展训练所运用的方法……整个训练进程具备的多个环节，这些环节存在的差异致使各个代码模型体现出的效果各不相同，有着差异。

以智谱为例，其推出了一体机模式，得以直接开箱就能够使用，还提供了完备的软硬件以及使用方式，其特点在于能够与企业内部的代码仓库、知识库相结合以此来强化代码能力，而优势则是代码具备私有化安全的特性。

企业更为关注的是，如何与企业内部所拥有的代码、数据文档进行结合，在模型训练的阶段，对于这些代码是并不了解的，其中涵盖了企业内部自行定义的所谓API接口等等。

为了能让模型对于所对应的企业代码有着更为深刻的理解，给出了几个不同的方向，其中有定制化的微调方案、在企业内部借助自身的代码针对此模型进行相关的强化，另外还涵盖了RAG检索增强方面的方案，也就是把企业代码以及文档当作知识库来辅助预测。

存在一些投资人，他们对创业公司开展代码大模型并不看好，他们觉得在AI这个领域，未来依旧是通用大模型公司的事儿，通用大模型公司在做这件事情上更具优势，创业公司难以形成差异化，此外竞争对手海量呀。

并且呢，有着如此情况，软件To B始终面临着这样的问题，那便是国内B端客户没有能力承担使用的费用，而这恰恰是国内SaaS一直未能真正发展兴盛起来的理由当中的一个。

实际上呀，依照开发者所给出的反馈来看呢，像GPT - 4o、3.5这类的通用大模型如今同样可以维持着较为不错的代码呈现效果啦。

有一位从业者觉着，对于未来而言呀，有可能会出现一个在所有模态方面都表现得很强的六边形战士模型呢，然而呢，要是切实从B端商业化能够成功落地的这个角度而言呀，并没有太多的公司具备有能力去进行本地部署这样一个拥有十分巨大参数量的六边形战士模型，所以呀，整个市场从目前的情况来看呢，依旧是急需一个代码垂直模型的。

那么创业公司如何跟大厂竞争？

大厂在理论上可以做所有的事情，但：

第一，大厂要于所有能够开展的事项内进行挑选，继而确定相应的资源投入安排，对大厂来讲，存在超多方向可收获比单个B端场景更多的资源，像通用大模型、AGI等，而创业公司则是百分百专注于一件事情上；。

其次，处于、适用于垂直场景当中，大厂本身所具备的认知，不见得就一定会比创业公司更为深刻。所涉及的B端AI，是一个极具垂直特性、具备深度专业性的场景呀。在大模型已有基础之上，且仍然是需要着大量进阶的代码的，以及对于客户需求有着深度洞察的。

李力行身为COO觉得，在最开始的时候，得借助全流程的数据治理以及个性化训练，以此让大模型能深切领会并把控企业范畴的知识，进而实现企业专有的代码大模型落地；紧接着，运用多agent等办法去联合传统的软件开发工具与方法，高效率地处理企业繁杂的软件开发任务。

Agent 是趋势

软件开发属于一个繁杂的系统工程，它仅仅占据其中极为稀少的一部分呢，而且还牵涉到包括需求理解，以及优化，还有部署等诸多不同的环节哟。然而以某某为首的AI编程辅助产品当下仅仅能够编写一些所谓的“函数砖头”罢了，垒砌墙体这样的事情仍旧需要程序员亲自去完成才行呢。

但是，Devin 的现身这一情况，达成了外界针对 AI 软件开发所抱有的想象力，并非仅仅局限于某一阶段，。

3月初，有个初创公司进行demo演示，其中，Devin化身成一名具备“全栈技能”的AI程序员，这是一个能独自完成任务的自助系统，它于快速原型设计方面表现出色，于修复bug方面表现出色，于复杂数据的可视化方面也表现出色。

从交互角度而言，Devin给带来一种全新的AI软件开发样式，涵盖命令行、浏览器等各类组件，它属于首个脱离IDE的软件开发形式。从实际任务方面来讲，Devin的愿景是达成整个软件开发的需求任务，这种能够完成更为复杂开发任务的Agent已然成为业内既定的产品趋向。

而 Devin 则被称为 Agent 的“ 时刻”。

关于一位被称作AI Agent创业者的赵聪有着这样的看法，针对issue level的那些情况，全部都要用Agent达成目的，其所处理的是更为繁杂的问题，能够自动去解issue，这里的issue等同于文件级别的代码，然而当下的代码生成、补全操作都是在单个文件上进行的，解issue通常是面向整个项目，该项目包含多个文件。

谁能想到，COO李力行，居然异常看好Agent在软件开发领域的应用，他明确表示，多Agent协作竟然让全流程代码生成等愈发复杂的开发任务，奇迹般似地成为了可能。令人瞩目的是，在2024年，一款基于Agent技术的智能化软件开发系统2.0横空乍现，其借助大模型与软件开发工具调用，成功解决企业项目级代码生成问题，切实有力地确保了复杂开发场景下代码生成的高效性、准确性以及可靠性。

德温打算着手处理一个问题，换而言之指的是去修正一段仓密度方面的代码，所有人都朝着德温的方向展开探查，然而当前大模型的能力差不多依旧无法达成。当下智能体尚处在探寻、试验的时期。

距 Devin 发布已过去足足五个月，然而依旧未曾有任何哪怕一丁点儿更进一步的消息传来。其 CEO Scott 还透露说，他们并没有明确的公开预览（）时间表，当下依旧处在内部测试阶段，也就是说并没有确定的产品形态。

负责人郑勤锴持有这样的看法，即 Agent 仅仅是达成某个功能的途径，当下众多的 Agent 只不过是进行简单的工具调用而已。关键的要点在于关注最终所实现的功能，以及该功能能够有的多高的可用性。

赵聪觉得未来创业机会存在于AI Agent，只因微软已涉足AI编程赛道，很难再与之展开竞争，故而唯有选择向前迈进，也就是直接去替代人。平日里开发者的诸多工作类似拿着螺丝刀拧螺丝，只不过把螺丝刀换成了电钻，而AI程序员是给开发者配备一个小弟，所以它依旧是个不错的工具，但AI程序员代表着生产力，这是全然不同的两件事情。

做AI程序员并非科学方面的问题，而是属于工程范畴的问题。这包含了路径选择的事儿，在成为AI程序员期间，存在公司选择自行构建模型的情况，赵聪认定此为错误的路径，他对所谓的小模型、垂直模型不予以相信，认为模型仅仅是大模型而已，原因在于唯有大模型能够带来智力。

未来所面临的挑战在于，所有人都得以朝着level的方向前行，要依靠底层模型的进化才行，然而模型的价格太过昂贵。赵聪认定，GPT - 4起码得再降低10倍的价格，才会存有真正的可能性。

软件工程里，AI不易解决的两大难题是，其一为复杂项目的业务上下文理解，其二是每家公司特有的工程架构、逻辑以及实践，在处理这两个问题以前，AI Agent尚不能完全取代人类程序员。

但是，有多位从业者都一致这么认为，随着AI持续不断地进化，未来高级程序员不会被替代掉，拧螺丝的初级程序员被替代这种情况已经能够看得见了，未来程序员的培养路径也跟现在是不一样的，就如同高科技种地那样，不需要真的从种地开始去学习，而是先从学习如何使用工具开始。

在未来，C 端应当更优质地服务普通民众，并非仅仅局限于开发者，要是普通大众也能够借助 AI 达成编程，那么 C 端便存在实现一次爆发的可能性，而达成这一情况需要具备更强的模型能力，端到端依旧需要 Agent 进行实现。

但可以肯定的是，未来程序员逐渐都会离不开 AI 编程工具。

（文中赵聪为化名）

租售GPU算力

租：4090/A800/H800/H100

售：现货H100/H800

特别适合企业级应用