ORANGE BOOK · CHATGPT

第三章 看懂界面与模型(5、5.4、Pro、Codex 怎么选)

一、界面整体布局:一张图认完

打开 ChatGPT 网页版后,整个界面分 4 个大区域:

┌──────────┬─────────────────────────────────────────────┐
│          │  [模型切换器 ▾]    [分享]   [画布]   [头像]    │
│  侧栏     ├─────────────────────────────────────────────┤
│          │                                             │
│ + 新对话  │             对话区(中间)                    │
│          │                                             │
│ 历史      │                                             │
│ Library   │                                             │
│ GPTs     │                                             │
│ Sora     │                                             │
│          ├─────────────────────────────────────────────┤
│ ⚙ 设置   │   [输入框 + 工具按钮(图片 / 文件 / 语音)]      │
└──────────┴─────────────────────────────────────────────┘

主要按钮:

  • 左上角 + 新对话:开一个新会话。养成"一个任务一个会话"的好习惯。
  • 侧栏 - 历史对话:默认只保留 30 天,超过会自动清掉,建议重要的对话手动 Pin(钉住)或 Rename。
  • 侧栏 - Library:系统帮你保存的图片 / Sora 视频。
  • 侧栏 - GPTs:自定义助手商店(第十一章 讲)。
  • 侧栏 - Sora:视频生成入口(第十章 讲)。
  • 侧栏 - 设置:账号、模型、隐私、订阅。
  • 顶部 - 模型切换器:本章重点。
  • 顶部 - 分享按钮:把当前对话生成一个公开链接给别人看。
  • 顶部 - 画布按钮(Canvas):把对话切到"协作画布"模式,适合写长文档 / 改代码(第六章 讲)。
  • 底部输入框 - 工具按钮:上传图片 / PDF / Excel、语音输入、相机、画图开关、联网开关。

把侧栏所有项目点一遍,花不了 3 分钟,但你会对界面"心里有数"。

二、模型菜单详解:8 个名字到底是什么

点顶部"模型切换器 ▾",你会看到(以 Plus 用户为例):

GPT-5.4              ← 默认日常模型
GPT-5.4 Thinking     ← 难题、推理、复杂任务
GPT-5.4 Pro          ← 极难任务(仅 Pro 套餐)
GPT-5                ← 上一代主力,速度快
o4-mini              ← 轻量推理(兼容旧应用)
GPT-5.3-Codex        ← 编程专用(Codex 入口)
─────────────
更多 (More)          ← 见下方

展开"更多"还会看到:

Sora 2               ← 视频生成
Voice                ← 实时语音通话
Deep Research        ← 深度研究(自动联网爬资料)
Operator / Agent     ← 让 AI 操作浏览器(5.4 后已合并)
Image (DALL·E / GPT-image)  ← 画图(已嵌入对话,不必单选)

听起来眼花缭乱?别慌。下面我们用3 张表 + 1 棵决策树讲清楚每一个。

表 1:5 个"对话类"模型谁更适合谁

模型 它最擅长 速度 成本 / 限额 推荐场景
GPT-5.4(默认) 日常对话、写作、问答 用得最多 90% 的日常任务
GPT-5.4 Thinking 推理、复杂逻辑、多步骤任务 慢(10-60s) Plus 限量 40+/天 数学题、复杂分析、写长方案、查代码 Bug
GPT-5.4 Pro 顶级推理、研究级任务 很慢(1-5min) 仅 Pro 套餐 深度研究、博士级作业、技术评估
GPT-5 速度优先的日常 非常快 不限 快速搜资料、改语句、聊天
o4-mini 轻量推理 几乎不限 旧 App 兼容、快速思考型问答

表 2:3 个"专项"模型

模型 它能做什么 是否需要单独切换 推荐场景
GPT-5.3-Codex 编程:写代码、改代码、跑代码、解释代码 是(侧栏点 Codex) 程序员、想入门写小工具的非程序员
Sora 2 文字生成视频,最长 60 秒 1080p 是(侧栏点 Sora) 短视频、广告、宣传片
Voice (Advanced Voice) 实时语音通话,能听你说话也能回复 是(移动端点麦克风耳机图标) 语言练习、开车时聊天、给爸妈用

表 3:3 个"工具型"功能(嵌在对话里)

功能 怎么打开 它是干什么的 推荐场景
联网搜索 输入框点"地球图标" 或 默认自动判断 让模型实时上网查 查最新新闻、股价、政策、近期赛事
Deep Research 模型菜单选 Deep Research 让模型花 5-30 分钟深度爬几十个网站,写一份研究报告 行业调研、技术评估、写综述
画图(DALL·E / GPT-image) 直接在对话里说"画一张……" 文字生成图片 海报、表情包、配图、Logo 草图
Canvas 对话中点顶部"画布"按钮 把回答切成"可逐段编辑"的协作模式 写长文、改代码、长文档协作

表 4:3 个"高阶"模式(Plus 起可用)

模式 入口 它能做什么 推荐场景
GPTs 侧栏 GPTs / Explore GPTs 别人或你自己造的"专业助手" 简历优化、雅思口语、PDF 阅读
Projects 新对话旁的"+ Project" 把多个对话归到一个长期项目下,共享文件和指令 写一本书、做一份长期工作
Agent / Operator 模型菜单 Agent 给它一个任务,它打开浏览器自己做 订机票、整理表格、爬数据

三、决策树:我要做这件事,应该用哪个?

你想做什么?
│
├─ 日常写邮件 / 整理思路 / 聊天 / 翻译
│   └─ 用 GPT-5.4(默认) ✅
│
├─ 解题 / 写论文 / 做复杂方案 / 排查 Bug
│   └─ 用 GPT-5.4 Thinking ✅
│
├─ 写一份"学术 / 研究 / 行业级"的深度报告
│   └─ 用 Deep Research(5-30 分钟出一份带引用的报告)
│
├─ 写代码 / 改代码 / 跑代码
│   └─ 用 Codex(GPT-5.3-Codex 模型)
│
├─ 画图 / 海报 / 表情包 / 配图
│   └─ 在对话里直接说"画一张……"
│
├─ 视频
│   └─ 用 Sora 2(侧栏切到 Sora 入口)
│
├─ 想"语音聊天 / 练口语 / 边走边问"
│   └─ 用 Voice(手机端麦克风图标)
│
├─ 让 AI 自己打开浏览器做事
│   └─ 用 Agent(菜单切换;目前实验阶段,要看好它)
│
├─ 我有一个"长期项目",每次对话都不想从头讲背景
│   └─ 用 Projects
│
├─ 我经常做某一类任务(比如"每周做小红书选题")
│   └─ 用 GPTs(自己做或用别人做的)
│
└─ 想看最新新闻 / 股价 / 比赛结果
    └─ 默认就行(5.4 会自动联网),或主动点联网图标

把这棵树存到收藏夹,每次卡住时翻一翻。

四、Thinking 到底是个啥?什么时候开?

ChatGPT 从 GPT-5 开始引入了"思考型"机制:

  • 不带 Thinking = 像你脱口而出回答一个问题,快但容易出错;
  • 带 Thinking = 模型会先在"草稿纸"上想很多步,然后才给你答案,慢但正确率高很多。

举一个生动的对比,问"鸡兔同笼,头共 35,脚共 94,问鸡兔各几只?":

GPT-5.4(不思考):直接给出"鸡 23 只,兔 12 只"——基本会对,但偶尔会算错。

GPT-5.4 Thinking:会先列方程、设变量、推导,再给出"鸡 23 只,兔 12 只 + 详细推理过程"——几乎不会错,并且能教你怎么算。

什么时候应该开 Thinking?

  • ✅ 数学 / 逻辑题
  • ✅ 代码排错
  • ✅ 多步骤任务(比如"分析这家公司财报")
  • ✅ 复杂写作(一篇 3000 字的方案)
  • ✅ 涉及"如果……那么……"的判断
  • ❌ 只是"翻译一下"、"写个标题"——浪费时间
  • ❌ 紧急的、要快回答的对话

怎么开? 在模型菜单选 GPT-5.4 Thinking,或在对话中输入 /think(部分客户端支持)。

五、Pro 模型:要不要花 100 美元?

GPT-5.4 Pro 是 ChatGPT 目前最强的对话模型,每月 100 美元起。它的能力可以参考:

  • 在"思考时间"上比 Thinking 又长 2-5 倍,平均一次回答耗时 1-5 分钟;
  • 上下文窗口最高 400K tokens(约 100 万字),能"读完一本书";
  • 在 GDPval(专业知识工作评测)上达到 83%,接近行业专家平均水平
  • 适合"代替一个咨询顾问 / 资深律师 / 资深分析师做一份完整方案"。

要不要订? 你符合下面任何一条,就值:

  • 你每天用 ChatGPT 超过 4 小时;
  • 你做研究 / 咨询 / 法务 / 投资 / 写论文,需要"硬核思考";
  • 你做大量 Sora 视频生成;
  • 你需要 Deep Research 和 Agent 的高频次使用。

否则,Plus 完全够,省下钱去吃顿好的。

六、Codex:写代码的"专属 ChatGPT"

如果你是程序员(或想入门写小工具的人),不要在 GPT-5.4 里写代码——切到 Codex

Codex 是一个"为代码而生"的 ChatGPT 子产品:

  • 模型用的是 GPT-5.3-Codex(专为代码训练);
  • 自带"代码沙箱",能真正运行你的代码并把结果展示出来
  • 自带"读懂整个仓库"的能力,能扫描你的项目结构;
  • 桌面 App 能直接调用 VS Code、Xcode、终端;
  • 支持把"任务"丢给它,它自己写完一个 PR 给你。

典型用法

帮我写一个 Python 脚本:监控我的 Gmail 收件箱,每天早上 8 点把昨天的"未读邮件标题 + 发件人 + 第一行内容"汇总成一个表格发到我自己邮箱。

它会写代码、跑测试、修 Bug、最后给你一份完整可运行的脚本。

更详细的 Codex 用法见 第十一章

七、模型选择常见误区

误区 1:模型越贵越好

错。对的模型才是好模型。让 GPT-5.4 Pro 帮你写一句"早安微信",纯属浪费。

误区 2:永远开 Thinking 最稳

错。Thinking 慢、占用配额,简单任务开 Thinking 等于让一个博士给你递茶。

误区 3:模型选错了得删对话重来

错。对话中可以随时切换模型,下一条消息会用新模型回答,上文记忆保留

误区 4:联网开关一直开着才好

错。联网会让模型变慢、有时把网上的废话搬给你。只有需要"近期信息"时再开

误区 5:GPTs 和模型是一个东西

不是。GPTs 是"包装好的助手",模型是"底层引擎"。一个 GPTs 内部用的就是 GPT-5.4 / 5.4 Thinking 之一。

八、几个看似无关、其实很有用的功能

1. 临时聊天(Temporary Chat)

输入框旁边的"≡"可能藏着一个"临时聊天"开关:开了之后,这次对话不会保存到历史、不会用于训练。适合处理敏感话题。

2. 记忆(Memory)

ChatGPT 可以"记住"你告诉它的关键信息(你的名字、职业、爱好),下次对话自动带上。打开 Settings → Personalization → Memory。

  • 好处:不用每次都自我介绍。
  • 坏处:可能"记错"或"记多了"。建议定期清理。

3. 自定义指令(Custom Instructions)

Settings → Personalization → Customize ChatGPT。 两个框:

  • "What would you like ChatGPT to know about you?"(告诉它你的背景)
  • "How would you like ChatGPT to respond?"(告诉它你希望的回答风格)

填好之后,所有对话都会自动加上这两段背景,省得每次重复。

推荐填法(举例):

框 1:我是一名互联网公司行政主管,38 岁女性,每天处理大量邮件、PPT、Excel。家里有个三年级孩子。我居住在北京。 框 2:请用简体中文回答。语气友好但不啰嗦。所有结构化内容请用 markdown 表格或列表。重要信息请加粗。

4. 项目(Projects)

新对话旁边可能有一个"+ Project"按钮。 项目可以:

  • 关联多个对话;
  • 上传多个文件,让所有对话都能看到这些文件;
  • 设置"项目级自定义指令"。

适合:"我要写一本书"、"我要做毕业论文"这种长期任务。

5. 共享对话

点右上角"分享"按钮,生成一个公开链接,发给同事看。注意:链接是公开的,谁有链接谁能看,所以含敏感信息的对话别分享

6. 导出数据

Settings → Data Controls → Export Data,会发一个 .zip 到你邮箱,包含所有对话记录。重要项目建议每月导出一次备份

九、本章一图回顾

                     ChatGPT 的 8 个名字
                            │
        ┌─────────────────┬─┴─────────────────┐
        ▼                 ▼                   ▼
     对话类             专项类               工具类
   ─────────         ─────────             ─────────
   GPT-5             Codex(编程)         联网搜索
   GPT-5.4 ⭐         Sora 2(视频)        Deep Research
   GPT-5.4 Thinking  Voice(语音)         画图
   GPT-5.4 Pro                             Canvas
   o4-mini

                  高阶模式
            ─────────────────
            GPTs / Projects / Agent
                            │
                            ▼
                  90% 的人 90% 的时间
                  用 GPT-5.4(默认)就够了
                  难题切 Thinking
                  视频去 Sora
                  代码去 Codex

十、本章小练习

  1. 找按钮:把侧栏的所有图标都点一遍,确认你能说出每个按钮是干嘛的。
  2. 切模型:随便起一个对话,依次用"GPT-5.4"、"GPT-5.4 Thinking"问同一个问题——"如果一个圆周率精确到小数点后 1000 位,第 999 位是什么数字?"对比两个模型回答的差别。
  3. 试 Canvas:让 ChatGPT 写一段 200 字的产品介绍,然后点"画布"按钮,体会"逐段编辑"的快感。
  4. 填自定义指令:照本章第八节填好两个框,然后开个新对话试试,看回答是不是更"懂你"了。

完成?翻到 第四章 学会和 ChatGPT 说话(提示词入门)