深夜王炸！GPT-5.4 重磅发布

这几天 openai 因为国防部订单问题，深陷美帝人民讨伐中。2B 的业务被 Anthropic 抢了 70% 不说，2C 的 AppStore 排名也被反超。这下奥特曼是彻底坐不住了，先是开胃菜：GPT-5.3-Instance（更会说人话的模型），同时还在 X 上暗示说 “5.4 会比你们想象中快地到来”。

结果，没过两天，半夜就偷偷发布了 GPT-5.4 了。

在各大自媒体还没来得及发文前，我们赶紧先偷偷体验一波看看。

模型介绍

一句话概括：
GPT‑5.4 的核心提升，不只是“更聪明了一点”，而是更像一个能真正完成专业工作的模型：更会思考、更会写代码、更会用工具、更能操作软件和网页，而且整体更省 token、来回沟通更少。

按能力角度看

产品定位：5.4 把最近几代分散的优势合并到了一个主力模型里，尤其把 GPT‑5.3‑Codex 的前沿编码能力吸收到主线模型中，目标很明确：面向文档、表格、演示、软件系统这类真实专业工作。
知识工作：对长文档、多来源材料、互相矛盾的信息整合更强，尤其适合研究、报告、分析类任务。官方给出的例子里，它在复杂浏览/检索类基准上明显领先 5.2，比如 BrowseComp 从 65.8% 提升到 82.7%。
交互体验：ChatGPT 里的 GPT‑5.4 Thinking 会先给出一个“前置计划 / preamble”，你可以在它生成过程中直接纠偏，而不是等它答完再重来。这本质上降低了多轮返工成本。
长程推理：更能在长时间思考过程中保持前文一致性，适合那种 30–60 分钟级别、需要持续推演和校验的复杂任务。
编码能力：这次是很实打实的升级。官方数据里，SWE-bench Verified 从 67.2% 提升到 74.9%，SWE-Lancer Diamond 从 24.0% 提升到 42.0%，Codeforces 从 1260 到 1840。说明它不只是“会写片段代码”，而是更擅长跨文件修改、重构、理解仓库上下文。
工具使用 / Agent 能力：这是 5.4 很大的看点。它支持更强的工具调用、tool search、并行子任务（#task），还支持最长 1M token 上下文，更像一个能规划、执行、再验证的工作代理。
电脑操作与视觉：5.4 是 OpenAI 首个“通用型 + 原生 computer-use”主力模型，能看截图、操作网页和软件、发鼠标键盘指令。OSWorld-Verified 从 47.3% 提升到 75.0%，官方还提到已超过该基准的人类成绩 72.4%。这意味着它在“看着界面做事”上有质变。
效率：虽然 API 单价比 5.2 高，但官方强调它是目前 token 效率最高的 reasoning model，在同一提示集上平均输出 token 比 5.2 少 10% 以上。换句话说，单 token 更贵，但很多任务总成本和延迟未必更差。
安全与可控性：5.4 按 High cyber capability 级别部署了相应防护。对开发者来说，除了更强，也更可控：可以通过 developer message 和自定义确认策略，约束 agent 的行为边界。

按用户角色看

普通重度用户：最直接的收益是“少来回”。它更会先规划、更能保持上下文、更适合长任务。
开发者：最值钱的是三件事叠加：更强编码、更强工具调用、更强 computer use。也就是从“代码助手”更接近“开发 agent”。
企业/团队：更适合跨应用流程，比如读文档、查网页、改表格、写报告、验证结果这种串联任务，落地方向比单纯聊天模型更清晰。
产品经理/分析师：复杂研究、竞品分析、长报告、资料归纳这类任务收益会比较明显，因为它更擅长长链路推理和多源整合。
自动化场景：如果你关心的是 agent/工作流，5.4 的意义比“答题更强”大得多，因为它第一次把长上下文、工具生态、软件操作能力真正组合起来了。

如果只挑 3 个最关键提升

从“会回答”升级到“会完成工作流”
从“会写代码”升级到“会在真实软件环境里行动”
从“更强能力”升级到“更适合长期、复杂、专业任务”

我会怎么定义这次 5.4
如果用一句更偏业务的话讲：5.4 的升级重点不是单项 benchmark 再涨一点，而是把模型从“强助手”往“可靠的专业工作代理”推进了一大步。

如何使用

在 config.toml 里手动开启

1
2
3

model = "gpt-5.4"
model_context_window = 1000000
model_reasoning_effort = "xhigh"

接下来，你就可以在 cli / codex app / vscode 里使用了

按照长久以来的发布节奏，正式版集成估计要等下下下周了

One More Thing

Codex App (Windows) 目前也已经全量开放了，直接 Windows 应用商店下载，配上新的 gpt-5.4，那真是风味更佳！

另外 Codex Cli 最新的 0.111.0 版本还上线了 Fast 模式，这是要把现在的几个痛点：【不说人话，慢，工具链落后】都完善起来，配上现在广大免费的普号和低到几块钱的 Team… 难道 GPT 要崛起？

1 2	`[features] fast_mode = true`

#AI #codex #gpt

深夜王炸！GPT-5.4 重磅发布

https://lusipad.com/2026/03/06/gpt-5-4-release/

作者

lusipad

发布于

2026年3月6日

许可协议

从 DeepSeek 到 OpenClaw：2025 AI 进化的第一性原理观察下一篇