GPT-5.6 用 Sol/Terra/Luna 三层能力体系替代单一模型命名,引入 max 和 ultra 两种推理模式,在 coding、biology、cybersecurity 任务上实现 state-of-the-art,同时将 context window 扩展至 1.5M token。
新命名规则:GPT-5.6 中的 5.6 代表模型代际,Sol/Terra/Luna 代表永久能力层级。层级之间能力差异固定,但每个层级内的模型可以独立更新,不影响命名语义。
Sol 的 context window 从 GPT-5.5 的 1.05M 扩展至 1.5M token(提升 43%)。这使得超长代码库分析、多轮 agent 历史保留、长文档推理成为可能,无需人工分块。
GPT-5.6 Sol 引入两个新的推理控制参数:
直观理解:max 是"让一个人想更久",ultra 是"分给多个人同时做"。
新 caching 机制引入两项改进:显式 cache breakpoint(开发者可在 prompt 中标注缓存边界,精确控制哪部分进入缓存)和 30 分钟最低存活期(cache 写入后保证存活至少 30 分钟,减少多轮对话中的 cache miss)。计费:cache 写入 1.25x 普通 input 价格,cache 读取享 90% 折扣。
| 模型 | Input / 1M token | Output / 1M token |
|---|---|---|
| Sol | $5.00 | $30.00 |
| Terra | $2.50 | $15.00 |
| Luna | $1.00 | $6.00 |