看懂界面与模型 · ChatGPT 橙皮书

一、界面整体布局：一张图认完

打开 ChatGPT 网页版后，整个界面分 4 个大区域：

┌──────────┬─────────────────────────────────────────────┐
│          │  [模型切换器 ▾]    [分享]   [画布]   [头像]    │
│  侧栏     ├─────────────────────────────────────────────┤
│          │                                             │
│ + 新对话  │             对话区（中间）                    │
│          │                                             │
│ 历史      │                                             │
│ Library   │                                             │
│ GPTs     │                                             │
│ Sora     │                                             │
│          ├─────────────────────────────────────────────┤
│ ⚙ 设置   │   [输入框 + 工具按钮（图片 / 文件 / 语音）]      │
└──────────┴─────────────────────────────────────────────┘

主要按钮：

左上角 + 新对话：开一个新会话。养成"一个任务一个会话"的好习惯。
侧栏 - 历史对话：默认只保留 30 天，超过会自动清掉，建议重要的对话手动 Pin（钉住）或 Rename。
侧栏 - Library：系统帮你保存的图片 / Sora 视频。
侧栏 - GPTs：自定义助手商店（第十一章讲）。
侧栏 - Sora：视频生成入口（第十章讲）。
侧栏 - 设置：账号、模型、隐私、订阅。
顶部 - 模型切换器：本章重点。
顶部 - 分享按钮：把当前对话生成一个公开链接给别人看。
顶部 - 画布按钮（Canvas）：把对话切到"协作画布"模式，适合写长文档 / 改代码（第六章讲）。
底部输入框 - 工具按钮：上传图片 / PDF / Excel、语音输入、相机、画图开关、联网开关。

把侧栏所有项目点一遍，花不了 3 分钟，但你会对界面"心里有数"。

二、模型菜单详解：8 个名字到底是什么

点顶部"模型切换器 ▾"，你会看到（以 Plus 用户为例）：

GPT-5.4              ← 默认日常模型
GPT-5.4 Thinking     ← 难题、推理、复杂任务
GPT-5.4 Pro          ← 极难任务（仅 Pro 套餐）
GPT-5                ← 上一代主力，速度快
o4-mini              ← 轻量推理（兼容旧应用）
GPT-5.3-Codex        ← 编程专用（Codex 入口）
─────────────
更多 (More)          ← 见下方

展开"更多"还会看到：

Sora 2               ← 视频生成
Voice                ← 实时语音通话
Deep Research        ← 深度研究（自动联网爬资料）
Operator / Agent     ← 让 AI 操作浏览器（5.4 后已合并）
Image (DALL·E / GPT-image)  ← 画图（已嵌入对话，不必单选）

听起来眼花缭乱？别慌。下面我们用3 张表 + 1 棵决策树讲清楚每一个。

表 1：5 个"对话类"模型谁更适合谁

模型	它最擅长	速度	成本 / 限额	推荐场景
GPT-5.4（默认）	日常对话、写作、问答	快	用得最多	90% 的日常任务
GPT-5.4 Thinking	推理、复杂逻辑、多步骤任务	慢（10-60s）	Plus 限量 40+/天	数学题、复杂分析、写长方案、查代码 Bug
GPT-5.4 Pro	顶级推理、研究级任务	很慢（1-5min）	仅 Pro 套餐	深度研究、博士级作业、技术评估
GPT-5	速度优先的日常	非常快	不限	快速搜资料、改语句、聊天
o4-mini	轻量推理	中	几乎不限	旧 App 兼容、快速思考型问答

表 2：3 个"专项"模型

模型	它能做什么	是否需要单独切换	推荐场景
GPT-5.3-Codex	编程：写代码、改代码、跑代码、解释代码	是（侧栏点 Codex）	程序员、想入门写小工具的非程序员
Sora 2	文字生成视频，最长 60 秒 1080p	是（侧栏点 Sora）	短视频、广告、宣传片
Voice (Advanced Voice)	实时语音通话，能听你说话也能回复	是（移动端点麦克风耳机图标）	语言练习、开车时聊天、给爸妈用

表 3：3 个"工具型"功能（嵌在对话里）

功能	怎么打开	它是干什么的	推荐场景
联网搜索	输入框点"地球图标" 或默认自动判断	让模型实时上网查	查最新新闻、股价、政策、近期赛事
Deep Research	模型菜单选 Deep Research	让模型花 5-30 分钟深度爬几十个网站，写一份研究报告	行业调研、技术评估、写综述
画图（DALL·E / GPT-image）	直接在对话里说"画一张……"	文字生成图片	海报、表情包、配图、Logo 草图
Canvas	对话中点顶部"画布"按钮	把回答切成"可逐段编辑"的协作模式	写长文、改代码、长文档协作

表 4：3 个"高阶"模式（Plus 起可用）

模式	入口	它能做什么	推荐场景
GPTs	侧栏 GPTs / Explore GPTs	别人或你自己造的"专业助手"	简历优化、雅思口语、PDF 阅读
Projects	新对话旁的"+ Project"	把多个对话归到一个长期项目下，共享文件和指令	写一本书、做一份长期工作
Agent / Operator	模型菜单 Agent	给它一个任务，它打开浏览器自己做	订机票、整理表格、爬数据

三、决策树：我要做这件事，应该用哪个？

你想做什么？
│
├─ 日常写邮件 / 整理思路 / 聊天 / 翻译
│   └─ 用 GPT-5.4（默认） ✅
│
├─ 解题 / 写论文 / 做复杂方案 / 排查 Bug
│   └─ 用 GPT-5.4 Thinking ✅
│
├─ 写一份"学术 / 研究 / 行业级"的深度报告
│   └─ 用 Deep Research（5-30 分钟出一份带引用的报告）
│
├─ 写代码 / 改代码 / 跑代码
│   └─ 用 Codex（GPT-5.3-Codex 模型）
│
├─ 画图 / 海报 / 表情包 / 配图
│   └─ 在对话里直接说"画一张……"
│
├─ 视频
│   └─ 用 Sora 2（侧栏切到 Sora 入口）
│
├─ 想"语音聊天 / 练口语 / 边走边问"
│   └─ 用 Voice（手机端麦克风图标）
│
├─ 让 AI 自己打开浏览器做事
│   └─ 用 Agent（菜单切换；目前实验阶段，要看好它）
│
├─ 我有一个"长期项目"，每次对话都不想从头讲背景
│   └─ 用 Projects
│
├─ 我经常做某一类任务（比如"每周做小红书选题"）
│   └─ 用 GPTs（自己做或用别人做的）
│
└─ 想看最新新闻 / 股价 / 比赛结果
    └─ 默认就行（5.4 会自动联网），或主动点联网图标

把这棵树存到收藏夹，每次卡住时翻一翻。

四、Thinking 到底是个啥？什么时候开？

ChatGPT 从 GPT-5 开始引入了"思考型"机制：

不带 Thinking = 像你脱口而出回答一个问题，快但容易出错；
带 Thinking = 模型会先在"草稿纸"上想很多步，然后才给你答案，慢但正确率高很多。

举一个生动的对比，问"鸡兔同笼，头共 35，脚共 94，问鸡兔各几只？"：

GPT-5.4（不思考）：直接给出"鸡 23 只，兔 12 只"——基本会对，但偶尔会算错。

GPT-5.4 Thinking：会先列方程、设变量、推导，再给出"鸡 23 只，兔 12 只 + 详细推理过程"——几乎不会错，并且能教你怎么算。

什么时候应该开 Thinking？

✅ 数学 / 逻辑题
✅ 代码排错
✅ 多步骤任务（比如"分析这家公司财报"）
✅ 复杂写作（一篇 3000 字的方案）
✅ 涉及"如果……那么……"的判断
❌ 只是"翻译一下"、"写个标题"——浪费时间
❌ 紧急的、要快回答的对话

怎么开？ 在模型菜单选 GPT-5.4 Thinking，或在对话中输入 /think（部分客户端支持）。

五、Pro 模型：要不要花 100 美元？

GPT-5.4 Pro 是 ChatGPT 目前最强的对话模型，每月 100 美元起。它的能力可以参考：

在"思考时间"上比 Thinking 又长 2-5 倍，平均一次回答耗时 1-5 分钟；
上下文窗口最高 400K tokens（约 100 万字），能"读完一本书"；
在 GDPval（专业知识工作评测）上达到 83%，接近行业专家平均水平；
适合"代替一个咨询顾问 / 资深律师 / 资深分析师做一份完整方案"。

要不要订？ 你符合下面任何一条，就值：

你每天用 ChatGPT 超过 4 小时；
你做研究 / 咨询 / 法务 / 投资 / 写论文，需要"硬核思考";
你做大量 Sora 视频生成；
你需要 Deep Research 和 Agent 的高频次使用。

否则，Plus 完全够，省下钱去吃顿好的。

六、Codex：写代码的"专属 ChatGPT"

如果你是程序员（或想入门写小工具的人），不要在 GPT-5.4 里写代码——切到 Codex。

Codex 是一个"为代码而生"的 ChatGPT 子产品：

模型用的是 GPT-5.3-Codex（专为代码训练）；
自带"代码沙箱"，能真正运行你的代码并把结果展示出来；
自带"读懂整个仓库"的能力，能扫描你的项目结构；
桌面 App 能直接调用 VS Code、Xcode、终端；
支持把"任务"丢给它，它自己写完一个 PR 给你。

典型用法：

帮我写一个 Python 脚本：监控我的 Gmail 收件箱，每天早上 8 点把昨天的"未读邮件标题 + 发件人 + 第一行内容"汇总成一个表格发到我自己邮箱。

它会写代码、跑测试、修 Bug、最后给你一份完整可运行的脚本。

更详细的 Codex 用法见第十一章。

七、模型选择常见误区

误区 1：模型越贵越好

错。对的模型才是好模型。让 GPT-5.4 Pro 帮你写一句"早安微信"，纯属浪费。

误区 2：永远开 Thinking 最稳

错。Thinking 慢、占用配额，简单任务开 Thinking 等于让一个博士给你递茶。

误区 3：模型选错了得删对话重来

错。对话中可以随时切换模型，下一条消息会用新模型回答，上文记忆保留。

误区 4：联网开关一直开着才好

错。联网会让模型变慢、有时把网上的废话搬给你。只有需要"近期信息"时再开。

误区 5：GPTs 和模型是一个东西

不是。GPTs 是"包装好的助手"，模型是"底层引擎"。一个 GPTs 内部用的就是 GPT-5.4 / 5.4 Thinking 之一。

八、几个看似无关、其实很有用的功能

1. 临时聊天（Temporary Chat）

输入框旁边的"≡"可能藏着一个"临时聊天"开关：开了之后，这次对话不会保存到历史、不会用于训练。适合处理敏感话题。

2. 记忆（Memory）

ChatGPT 可以"记住"你告诉它的关键信息（你的名字、职业、爱好），下次对话自动带上。打开 Settings → Personalization → Memory。

好处：不用每次都自我介绍。
坏处：可能"记错"或"记多了"。建议定期清理。

3. 自定义指令（Custom Instructions）

Settings → Personalization → Customize ChatGPT。两个框：

"What would you like ChatGPT to know about you?"（告诉它你的背景）
"How would you like ChatGPT to respond?"（告诉它你希望的回答风格）

填好之后，所有对话都会自动加上这两段背景，省得每次重复。

推荐填法（举例）：

框 1：我是一名互联网公司行政主管，38 岁女性，每天处理大量邮件、PPT、Excel。家里有个三年级孩子。我居住在北京。框 2：请用简体中文回答。语气友好但不啰嗦。所有结构化内容请用 markdown 表格或列表。重要信息请加粗。

4. 项目（Projects）

新对话旁边可能有一个"+ Project"按钮。项目可以：

关联多个对话；
上传多个文件，让所有对话都能看到这些文件；
设置"项目级自定义指令"。

适合："我要写一本书"、"我要做毕业论文"这种长期任务。

5. 共享对话

点右上角"分享"按钮，生成一个公开链接，发给同事看。注意：链接是公开的，谁有链接谁能看，所以含敏感信息的对话别分享。

6. 导出数据

Settings → Data Controls → Export Data，会发一个 .zip 到你邮箱，包含所有对话记录。重要项目建议每月导出一次备份。

九、本章一图回顾

                     ChatGPT 的 8 个名字
                            │
        ┌─────────────────┬─┴─────────────────┐
        ▼                 ▼                   ▼
     对话类             专项类               工具类
   ─────────         ─────────             ─────────
   GPT-5             Codex（编程）         联网搜索
   GPT-5.4 ⭐         Sora 2（视频）        Deep Research
   GPT-5.4 Thinking  Voice（语音）         画图
   GPT-5.4 Pro                             Canvas
   o4-mini

                  高阶模式
            ─────────────────
            GPTs / Projects / Agent
                            │
                            ▼
                  90% 的人 90% 的时间
                  用 GPT-5.4（默认）就够了
                  难题切 Thinking
                  视频去 Sora
                  代码去 Codex

十、本章小练习

找按钮：把侧栏的所有图标都点一遍，确认你能说出每个按钮是干嘛的。
切模型：随便起一个对话，依次用"GPT-5.4"、"GPT-5.4 Thinking"问同一个问题——"如果一个圆周率精确到小数点后 1000 位，第 999 位是什么数字？"对比两个模型回答的差别。
试 Canvas：让 ChatGPT 写一段 200 字的产品介绍，然后点"画布"按钮，体会"逐段编辑"的快感。
填自定义指令：照本章第八节填好两个框，然后开个新对话试试，看回答是不是更"懂你"了。

完成？翻到第四章学会和 ChatGPT 说话（提示词入门）。