
GPT-5-Codex背后AI Agentic编程技术最新全面综述!
近期OpenAI发布了GPT-5-Codex,这是 GPT-5 的一个版本,针对 Codex 中的agentic coding进行了进一步优化。该版本可在 Codex CLI、IDE 扩展、Web 和移动端使用,并可用于 Github 上的代码审查。
Codex背后AI Agentic Programming正在重塑软件开发的整条流水线。不再只是“帮你补全代码”,而是“把需求丢给 AI,它自己规划、写代码、跑测试、开 PR”。
AI Agentic编程定义
维度 | 传统代码补全 | Agentic Programming |
交互方式 | 单轮 prompt→代码 | 多轮自主迭代 |
工具使用 | ❌ | ✅ 编译器、调试器、git、CI… |
任务粒度 | 函数/行 | 模块、项目、端到端流程 |
反馈处理 | 无 | 根据编译报错、测试失败自我修正 |
一句话:LLM 被包装成“有手有脑”的 Agent,能在真实开发环境里自主完成复杂软件任务。
发展时间线:从代码补全到代理式编程
从 2010s 程序合成 → 2021 代码补全 → 2023+ 代理式编程
代码生成方法演化
AI Agentic典型 Workflow
Fig.2 迭代式开发循环
- 人:自然语言描述需求
- Agent:① 规划子任务 → ② 生成代码 → ③ 调用 pytest → ④ 失败 → ⑤ 定位 Bug → ⑥ 修复 → ⑦ 生成文档 →⑧推 PR
- 人:Review & Merge
全程 0 行人工代码,平均 3-5 轮迭代通过全部测试。
AI Agentic的4大技术底座
模块 | 代表技术 | 作用 |
1. 大模型 | GPT-5、Claude 4 Opus、Gemini 2.5 Pro 全部支持 Tool-Use | 推理+代码生成 |
2. Prompt 工程 | ReAct、Chain-of-Thought、Scratchpad 让模型“边想边干” | 多步规划、反思 |
3. 工具链 | 编译器、调试器、测试框架、LSP、git 一个都不能少 | 闭环验证 |
4. 记忆&上下文 | 向量库、滑动窗口、RAG、KV-Cache 压缩 | 跨轮次上下文 |
大模型
工具集合
上下文管理技术
主流 Agent 对比分类
表 4:主流AI Agentic 编程系统按“主动性、多轮、工具、自适应”四维打分
代码生成任务LLM价格
AI Agentic 编程系统分类体系
未来 5 大机会(Research Roadmap)
- 编译器为 Agent 而生开放 LLVM IR / MLIR API,让 Agent 直接读中间表示,做语义级调试。
- 分层记忆架构短-中-长三级记忆 + 代码结构感知的检索,解决“长上下文失忆”。
- 人机协同协议混合主导权(mixed-initiative)+ 可解释 UI,让开发者随时介入、回滚。
- 领域专用 Foundation Model金融/医疗/汽车嵌入式专项预训练 + 安全对齐。
- 结构化意图语言用“类 DSL”替代模糊自然语言,让需求可验证、可约束、可回滚。
https://arxiv.org/pdf/2508.11126
AI Agentic Programming: A Survey of Techniques, Challenges, and O
本文转载自PaperAgent,作者:PaperAgent
