深夜王炸!GPT-5.4 重磅发布

深夜王炸!GPT-5.4 重磅发布

这几天 openai 因为国防部订单问题,深陷美帝人民讨伐中。2B 的业务被 Anthropic 抢了 70% 不说,2C 的 AppStore 排名也被反超。这下奥特曼是彻底坐不住了,先是开胃菜:GPT-5.3-Instance(更会说人话的模型),同时还在 X 上暗示说 “5.4 会比你们想象中快地到来”。

结果,没过两天,半夜就偷偷发布了 GPT-5.4 了。

在各大自媒体还没来得及发文前,我们赶紧先偷偷体验一波看看。

模型介绍

一句话概括:
GPT‑5.4 的核心提升,不只是“更聪明了一点”,而是更像一个能真正完成专业工作的模型:更会思考、更会写代码、更会用工具、更能操作软件和网页,而且整体更省 token、来回沟通更少。

按能力角度看

  • 产品定位:5.4 把最近几代分散的优势合并到了一个主力模型里,尤其把 GPT‑5.3‑Codex 的前沿编码能力吸收到主线模型中,目标很明确:面向文档、表格、演示、软件系统这类真实专业工作。
  • 知识工作:对长文档、多来源材料、互相矛盾的信息整合更强,尤其适合研究、报告、分析类任务。官方给出的例子里,它在复杂浏览/检索类基准上明显领先 5.2,比如 BrowseComp 从 65.8% 提升到 82.7%。
  • 交互体验:ChatGPT 里的 GPT‑5.4 Thinking 会先给出一个“前置计划 / preamble”,你可以在它生成过程中直接纠偏,而不是等它答完再重来。这本质上降低了多轮返工成本。
  • 长程推理:更能在长时间思考过程中保持前文一致性,适合那种 30–60 分钟级别、需要持续推演和校验的复杂任务。
  • 编码能力:这次是很实打实的升级。官方数据里,SWE-bench Verified 从 67.2% 提升到 74.9%,SWE-Lancer Diamond 从 24.0% 提升到 42.0%,Codeforces 从 1260 到 1840。说明它不只是“会写片段代码”,而是更擅长跨文件修改、重构、理解仓库上下文。
  • 工具使用 / Agent 能力:这是 5.4 很大的看点。它支持更强的工具调用、tool search、并行子任务(#task),还支持最长 1M token 上下文,更像一个能规划、执行、再验证的工作代理。
  • 电脑操作与视觉:5.4 是 OpenAI 首个“通用型 + 原生 computer-use”主力模型,能看截图、操作网页和软件、发鼠标键盘指令。OSWorld-Verified 从 47.3% 提升到 75.0%,官方还提到已超过该基准的人类成绩 72.4%。这意味着它在“看着界面做事”上有质变。
  • 效率:虽然 API 单价比 5.2 高,但官方强调它是目前 token 效率最高的 reasoning model,在同一提示集上平均输出 token 比 5.2 少 10% 以上。换句话说,单 token 更贵,但很多任务总成本和延迟未必更差。
  • 安全与可控性:5.4 按 High cyber capability 级别部署了相应防护。对开发者来说,除了更强,也更可控:可以通过 developer message 和自定义确认策略,约束 agent 的行为边界。

按用户角色看

  • 普通重度用户:最直接的收益是“少来回”。它更会先规划、更能保持上下文、更适合长任务。
  • 开发者:最值钱的是三件事叠加:更强编码、更强工具调用、更强 computer use。也就是从“代码助手”更接近“开发 agent”。
  • 企业/团队:更适合跨应用流程,比如读文档、查网页、改表格、写报告、验证结果这种串联任务,落地方向比单纯聊天模型更清晰。
  • 产品经理/分析师:复杂研究、竞品分析、长报告、资料归纳这类任务收益会比较明显,因为它更擅长长链路推理和多源整合。
  • 自动化场景:如果你关心的是 agent/工作流,5.4 的意义比“答题更强”大得多,因为它第一次把长上下文、工具生态、软件操作能力真正组合起来了。

如果只挑 3 个最关键提升

  • 从“会回答”升级到“会完成工作流”
  • 从“会写代码”升级到“会在真实软件环境里行动”
  • 从“更强能力”升级到“更适合长期、复杂、专业任务”

我会怎么定义这次 5.4
如果用一句更偏业务的话讲:5.4 的升级重点不是单项 benchmark 再涨一点,而是把模型从“强助手”往“可靠的专业工作代理”推进了一大步。

如何使用

config.toml 里手动开启

1
2
3
model = "gpt-5.4"
model_context_window = 1000000
model_reasoning_effort = "xhigh"

接下来,你就可以在 cli / codex app / vscode 里使用了

按照长久以来的发布节奏,正式版集成估计要等下下下周了

One More Thing

Codex App (Windows) 目前也已经全量开放了,直接 Windows 应用商店下载,配上新的 gpt-5.4,那真是风味更佳!

另外 Codex Cli 最新的 0.111.0 版本还上线了 Fast 模式,这是要把现在的几个痛点:【不说人话,慢,工具链落后】都完善起来,配上现在广大免费的普号和 低到几块钱的 Team… 难道 GPT 要崛起?

1
2
[features]
fast_mode = true

深夜王炸!GPT-5.4 重磅发布
https://lusipad.com/2026/03/06/gpt-5-4-release/
作者
lusipad
发布于
2026年3月6日
许可协议