一、界面整体布局:一张图认完
打开 ChatGPT 网页版后,整个界面分 4 个大区域:
┌──────────┬─────────────────────────────────────────────┐
│ │ [模型切换器 ▾] [分享] [画布] [头像] │
│ 侧栏 ├─────────────────────────────────────────────┤
│ │ │
│ + 新对话 │ 对话区(中间) │
│ │ │
│ 历史 │ │
│ Library │ │
│ GPTs │ │
│ Sora │ │
│ ├─────────────────────────────────────────────┤
│ ⚙ 设置 │ [输入框 + 工具按钮(图片 / 文件 / 语音)] │
└──────────┴─────────────────────────────────────────────┘
主要按钮:
- 左上角 + 新对话:开一个新会话。养成"一个任务一个会话"的好习惯。
- 侧栏 - 历史对话:默认只保留 30 天,超过会自动清掉,建议重要的对话手动 Pin(钉住)或 Rename。
- 侧栏 - Library:系统帮你保存的图片 / Sora 视频。
- 侧栏 - GPTs:自定义助手商店(第十一章 讲)。
- 侧栏 - Sora:视频生成入口(第十章 讲)。
- 侧栏 - 设置:账号、模型、隐私、订阅。
- 顶部 - 模型切换器:本章重点。
- 顶部 - 分享按钮:把当前对话生成一个公开链接给别人看。
- 顶部 - 画布按钮(Canvas):把对话切到"协作画布"模式,适合写长文档 / 改代码(第六章 讲)。
- 底部输入框 - 工具按钮:上传图片 / PDF / Excel、语音输入、相机、画图开关、联网开关。
把侧栏所有项目点一遍,花不了 3 分钟,但你会对界面"心里有数"。
二、模型菜单详解:8 个名字到底是什么
点顶部"模型切换器 ▾",你会看到(以 Plus 用户为例):
GPT-5.4 ← 默认日常模型
GPT-5.4 Thinking ← 难题、推理、复杂任务
GPT-5.4 Pro ← 极难任务(仅 Pro 套餐)
GPT-5 ← 上一代主力,速度快
o4-mini ← 轻量推理(兼容旧应用)
GPT-5.3-Codex ← 编程专用(Codex 入口)
─────────────
更多 (More) ← 见下方
展开"更多"还会看到:
Sora 2 ← 视频生成
Voice ← 实时语音通话
Deep Research ← 深度研究(自动联网爬资料)
Operator / Agent ← 让 AI 操作浏览器(5.4 后已合并)
Image (DALL·E / GPT-image) ← 画图(已嵌入对话,不必单选)
听起来眼花缭乱?别慌。下面我们用3 张表 + 1 棵决策树讲清楚每一个。
表 1:5 个"对话类"模型谁更适合谁
| 模型 | 它最擅长 | 速度 | 成本 / 限额 | 推荐场景 |
|---|---|---|---|---|
| GPT-5.4(默认) | 日常对话、写作、问答 | 快 | 用得最多 | 90% 的日常任务 |
| GPT-5.4 Thinking | 推理、复杂逻辑、多步骤任务 | 慢(10-60s) | Plus 限量 40+/天 | 数学题、复杂分析、写长方案、查代码 Bug |
| GPT-5.4 Pro | 顶级推理、研究级任务 | 很慢(1-5min) | 仅 Pro 套餐 | 深度研究、博士级作业、技术评估 |
| GPT-5 | 速度优先的日常 | 非常快 | 不限 | 快速搜资料、改语句、聊天 |
| o4-mini | 轻量推理 | 中 | 几乎不限 | 旧 App 兼容、快速思考型问答 |
表 2:3 个"专项"模型
| 模型 | 它能做什么 | 是否需要单独切换 | 推荐场景 |
|---|---|---|---|
| GPT-5.3-Codex | 编程:写代码、改代码、跑代码、解释代码 | 是(侧栏点 Codex) | 程序员、想入门写小工具的非程序员 |
| Sora 2 | 文字生成视频,最长 60 秒 1080p | 是(侧栏点 Sora) | 短视频、广告、宣传片 |
| Voice (Advanced Voice) | 实时语音通话,能听你说话也能回复 | 是(移动端点麦克风耳机图标) | 语言练习、开车时聊天、给爸妈用 |
表 3:3 个"工具型"功能(嵌在对话里)
| 功能 | 怎么打开 | 它是干什么的 | 推荐场景 |
|---|---|---|---|
| 联网搜索 | 输入框点"地球图标" 或 默认自动判断 | 让模型实时上网查 | 查最新新闻、股价、政策、近期赛事 |
| Deep Research | 模型菜单选 Deep Research | 让模型花 5-30 分钟深度爬几十个网站,写一份研究报告 | 行业调研、技术评估、写综述 |
| 画图(DALL·E / GPT-image) | 直接在对话里说"画一张……" | 文字生成图片 | 海报、表情包、配图、Logo 草图 |
| Canvas | 对话中点顶部"画布"按钮 | 把回答切成"可逐段编辑"的协作模式 | 写长文、改代码、长文档协作 |
表 4:3 个"高阶"模式(Plus 起可用)
| 模式 | 入口 | 它能做什么 | 推荐场景 |
|---|---|---|---|
| GPTs | 侧栏 GPTs / Explore GPTs | 别人或你自己造的"专业助手" | 简历优化、雅思口语、PDF 阅读 |
| Projects | 新对话旁的"+ Project" | 把多个对话归到一个长期项目下,共享文件和指令 | 写一本书、做一份长期工作 |
| Agent / Operator | 模型菜单 Agent | 给它一个任务,它打开浏览器自己做 | 订机票、整理表格、爬数据 |
三、决策树:我要做这件事,应该用哪个?
你想做什么?
│
├─ 日常写邮件 / 整理思路 / 聊天 / 翻译
│ └─ 用 GPT-5.4(默认) ✅
│
├─ 解题 / 写论文 / 做复杂方案 / 排查 Bug
│ └─ 用 GPT-5.4 Thinking ✅
│
├─ 写一份"学术 / 研究 / 行业级"的深度报告
│ └─ 用 Deep Research(5-30 分钟出一份带引用的报告)
│
├─ 写代码 / 改代码 / 跑代码
│ └─ 用 Codex(GPT-5.3-Codex 模型)
│
├─ 画图 / 海报 / 表情包 / 配图
│ └─ 在对话里直接说"画一张……"
│
├─ 视频
│ └─ 用 Sora 2(侧栏切到 Sora 入口)
│
├─ 想"语音聊天 / 练口语 / 边走边问"
│ └─ 用 Voice(手机端麦克风图标)
│
├─ 让 AI 自己打开浏览器做事
│ └─ 用 Agent(菜单切换;目前实验阶段,要看好它)
│
├─ 我有一个"长期项目",每次对话都不想从头讲背景
│ └─ 用 Projects
│
├─ 我经常做某一类任务(比如"每周做小红书选题")
│ └─ 用 GPTs(自己做或用别人做的)
│
└─ 想看最新新闻 / 股价 / 比赛结果
└─ 默认就行(5.4 会自动联网),或主动点联网图标
把这棵树存到收藏夹,每次卡住时翻一翻。
四、Thinking 到底是个啥?什么时候开?
ChatGPT 从 GPT-5 开始引入了"思考型"机制:
- 不带 Thinking = 像你脱口而出回答一个问题,快但容易出错;
- 带 Thinking = 模型会先在"草稿纸"上想很多步,然后才给你答案,慢但正确率高很多。
举一个生动的对比,问"鸡兔同笼,头共 35,脚共 94,问鸡兔各几只?":
GPT-5.4(不思考):直接给出"鸡 23 只,兔 12 只"——基本会对,但偶尔会算错。
GPT-5.4 Thinking:会先列方程、设变量、推导,再给出"鸡 23 只,兔 12 只 + 详细推理过程"——几乎不会错,并且能教你怎么算。
什么时候应该开 Thinking?
- ✅ 数学 / 逻辑题
- ✅ 代码排错
- ✅ 多步骤任务(比如"分析这家公司财报")
- ✅ 复杂写作(一篇 3000 字的方案)
- ✅ 涉及"如果……那么……"的判断
- ❌ 只是"翻译一下"、"写个标题"——浪费时间
- ❌ 紧急的、要快回答的对话
怎么开? 在模型菜单选 GPT-5.4 Thinking,或在对话中输入 /think(部分客户端支持)。
五、Pro 模型:要不要花 100 美元?
GPT-5.4 Pro 是 ChatGPT 目前最强的对话模型,每月 100 美元起。它的能力可以参考:
- 在"思考时间"上比 Thinking 又长 2-5 倍,平均一次回答耗时 1-5 分钟;
- 上下文窗口最高 400K tokens(约 100 万字),能"读完一本书";
- 在 GDPval(专业知识工作评测)上达到 83%,接近行业专家平均水平;
- 适合"代替一个咨询顾问 / 资深律师 / 资深分析师做一份完整方案"。
要不要订? 你符合下面任何一条,就值:
- 你每天用 ChatGPT 超过 4 小时;
- 你做研究 / 咨询 / 法务 / 投资 / 写论文,需要"硬核思考";
- 你做大量 Sora 视频生成;
- 你需要 Deep Research 和 Agent 的高频次使用。
否则,Plus 完全够,省下钱去吃顿好的。
六、Codex:写代码的"专属 ChatGPT"
如果你是程序员(或想入门写小工具的人),不要在 GPT-5.4 里写代码——切到 Codex。
Codex 是一个"为代码而生"的 ChatGPT 子产品:
- 模型用的是 GPT-5.3-Codex(专为代码训练);
- 自带"代码沙箱",能真正运行你的代码并把结果展示出来;
- 自带"读懂整个仓库"的能力,能扫描你的项目结构;
- 桌面 App 能直接调用 VS Code、Xcode、终端;
- 支持把"任务"丢给它,它自己写完一个 PR 给你。
典型用法:
帮我写一个 Python 脚本:监控我的 Gmail 收件箱,每天早上 8 点把昨天的"未读邮件标题 + 发件人 + 第一行内容"汇总成一个表格发到我自己邮箱。
它会写代码、跑测试、修 Bug、最后给你一份完整可运行的脚本。
更详细的 Codex 用法见 第十一章。
七、模型选择常见误区
误区 1:模型越贵越好
错。对的模型才是好模型。让 GPT-5.4 Pro 帮你写一句"早安微信",纯属浪费。
误区 2:永远开 Thinking 最稳
错。Thinking 慢、占用配额,简单任务开 Thinking 等于让一个博士给你递茶。
误区 3:模型选错了得删对话重来
错。对话中可以随时切换模型,下一条消息会用新模型回答,上文记忆保留。
误区 4:联网开关一直开着才好
错。联网会让模型变慢、有时把网上的废话搬给你。只有需要"近期信息"时再开。
误区 5:GPTs 和模型是一个东西
不是。GPTs 是"包装好的助手",模型是"底层引擎"。一个 GPTs 内部用的就是 GPT-5.4 / 5.4 Thinking 之一。
八、几个看似无关、其实很有用的功能
1. 临时聊天(Temporary Chat)
输入框旁边的"≡"可能藏着一个"临时聊天"开关:开了之后,这次对话不会保存到历史、不会用于训练。适合处理敏感话题。
2. 记忆(Memory)
ChatGPT 可以"记住"你告诉它的关键信息(你的名字、职业、爱好),下次对话自动带上。打开 Settings → Personalization → Memory。
- 好处:不用每次都自我介绍。
- 坏处:可能"记错"或"记多了"。建议定期清理。
3. 自定义指令(Custom Instructions)
Settings → Personalization → Customize ChatGPT。 两个框:
- "What would you like ChatGPT to know about you?"(告诉它你的背景)
- "How would you like ChatGPT to respond?"(告诉它你希望的回答风格)
填好之后,所有对话都会自动加上这两段背景,省得每次重复。
推荐填法(举例):
框 1:我是一名互联网公司行政主管,38 岁女性,每天处理大量邮件、PPT、Excel。家里有个三年级孩子。我居住在北京。 框 2:请用简体中文回答。语气友好但不啰嗦。所有结构化内容请用 markdown 表格或列表。重要信息请加粗。
4. 项目(Projects)
新对话旁边可能有一个"+ Project"按钮。 项目可以:
- 关联多个对话;
- 上传多个文件,让所有对话都能看到这些文件;
- 设置"项目级自定义指令"。
适合:"我要写一本书"、"我要做毕业论文"这种长期任务。
5. 共享对话
点右上角"分享"按钮,生成一个公开链接,发给同事看。注意:链接是公开的,谁有链接谁能看,所以含敏感信息的对话别分享。
6. 导出数据
Settings → Data Controls → Export Data,会发一个 .zip 到你邮箱,包含所有对话记录。重要项目建议每月导出一次备份。
九、本章一图回顾
ChatGPT 的 8 个名字
│
┌─────────────────┬─┴─────────────────┐
▼ ▼ ▼
对话类 专项类 工具类
───────── ───────── ─────────
GPT-5 Codex(编程) 联网搜索
GPT-5.4 ⭐ Sora 2(视频) Deep Research
GPT-5.4 Thinking Voice(语音) 画图
GPT-5.4 Pro Canvas
o4-mini
高阶模式
─────────────────
GPTs / Projects / Agent
│
▼
90% 的人 90% 的时间
用 GPT-5.4(默认)就够了
难题切 Thinking
视频去 Sora
代码去 Codex
十、本章小练习
- 找按钮:把侧栏的所有图标都点一遍,确认你能说出每个按钮是干嘛的。
- 切模型:随便起一个对话,依次用"GPT-5.4"、"GPT-5.4 Thinking"问同一个问题——"如果一个圆周率精确到小数点后 1000 位,第 999 位是什么数字?"对比两个模型回答的差别。
- 试 Canvas:让 ChatGPT 写一段 200 字的产品介绍,然后点"画布"按钮,体会"逐段编辑"的快感。
- 填自定义指令:照本章第八节填好两个框,然后开个新对话试试,看回答是不是更"懂你"了。
完成?翻到 第四章 学会和 ChatGPT 说话(提示词入门)。