Contents

Previewing GPT-5.6 Sol: a next-generation model


作者OpenAI
机构OpenAI
发布日期2026-06-26
链接https://openai.com/index/previewing-gpt-5-6-sol/

GPT-5.6 用 Sol/Terra/Luna 三层能力体系替代单一模型命名,引入 max 和 ultra 两种推理模式,在 coding、biology、cybersecurity 任务上实现 state-of-the-art,同时将 context window 扩展至 1.5M token。

研究动机

核心方法

1. 三层命名体系:代际与层级解耦

新命名规则:GPT-5.6 中的 5.6 代表模型代际,Sol/Terra/Luna 代表永久能力层级。层级之间能力差异固定,但每个层级内的模型可以独立更新,不影响命名语义。

2. 扩展 Context Window:1.5M token

Sol 的 context window 从 GPT-5.5 的 1.05M 扩展至 1.5M token(提升 43%)。这使得超长代码库分析、多轮 agent 历史保留、长文档推理成为可能,无需人工分块。

3. 两种推理模式:max 与 ultra

GPT-5.6 Sol 引入两个新的推理控制参数:

直观理解:max 是"让一个人想更久",ultra 是"分给多个人同时做"。

4. Prompt Caching 升级:显式断点 + 保证存活

新 caching 机制引入两项改进:显式 cache breakpoint(开发者可在 prompt 中标注缓存边界,精确控制哪部分进入缓存)和 30 分钟最低存活期(cache 写入后保证存活至少 30 分钟,减少多轮对话中的 cache miss)。计费:cache 写入 1.25x 普通 input 价格,cache 读取享 90% 折扣。

5. 定价参考(2026-06-26)

模型Input / 1M tokenOutput / 1M token
Sol$5.00$30.00
Terra$2.50$15.00
Luna$1.00$6.00

主要实验结果

局限与展望