GPT-5.4:三个版本,一个问题
OpenAI 发布 GPT-5.4。
官方对它的定位:“for professional work”——面向专业工作的最前沿模型。
三个版本同时上线
这是第一次 OpenAI 同一个模型推出三个版本:
GPT-5.4 标准版:基础版本,整合了 GPT-5.3-Codex 的编程能力。官方强调的是"across tools, software environments, and professional tasks involving spreadsheets, presentations, and documents"。
GPT-5.4 Thinking:强调推理过程可见,可以随时打断调整方向。
GPT-5.4 Pro:面向复杂任务,定价是标准版的 12 倍。
三个版本共用同一个模型基座,区别在于推理深度和使用场景。
编程能力是核心升级
GPT-5.4 整合了 GPT-5.3-Codex——这是 OpenAI 之前的旗舰编程模型。Codex 的编程能力直接继承过来,加上对工具调用和软件环境操作的改进,代码生成和执行能力是这次最实在的提升。
Computer Use 值得单独说
这是 OpenAI 第一次在通用模型里加入原生 Computer Use。
不是"告诉你要点什么",是模型直接在浏览器和桌面环境里操作——点击、输入、导航。
这个能力在 OpenAI 之前只有 Anthropic 的 Claude 有。现在 OpenAI 也做了,意味着 Computer Use 不再是差异化优势,而是旗舰模型的标配。
百万 token 上下文
Codex 版本支持百万 token 上下文。意味着可以一次处理整个代码库,不需要分段。
这对大型代码审查、跨文件重构、多文档分析场景有实际价值。
定价
| 版本 | 输入 | 输出 |
|---|---|---|
| 标准 | $2.50/M | $15/M |
| Pro | $30/M | $180/M |
Pro 版是标准版的 12 倍。官方没有详细解释标准版和 Pro 版在实际任务上的差距。值不值,只有自己测了才知道。
Computer Use 安全机制、版本边界、差异化定价逻辑
1. Computer Use 的安全机制是什么
模型可以操作电脑,这个能力如果被滥用,危害很大。OpenAI 做了哪些防护,官方没有公开细节。
2. Thinking 和 Pro 的实际差距
12 倍价格差。在真实任务上 Pro 比标准版好多少?官方没有给参考数据。
3. 为什么同时推三个版本
本质是差异化定价。不同支付意愿的用户买不同档位。但这三个版本的边界在哪里,官方没有说清楚。