2.1 一个让人头大的现实:AI 工具太多了
打开应用商店搜"AI",刷出来的 App 多到让人头晕:
ChatGPT、Claude、Gemini、Grok、Perplexity、Copilot、豆包、DeepSeek、Kimi、文心一言、通义千问、智谱清言、腾讯元宝、讯飞星火、商汤商量、阶跃跃问、MiniMax 海螺、面壁智能、零一万物⋯⋯
而且这些每个里面还嵌套了不同的"模型版本"——比如 ChatGPT 里你能选 GPT-5、GPT-5 Thinking、GPT-5 Pro、GPT-4o、o3 等等。
完全是个"AI 选项地狱"。
但你不用焦虑——99% 的普通人,只需要熟练用 1~2 个工具就够了。本章会帮你迅速定位"哪个适合你"。
2.2 先讲方法论:选 AI 工具看 5 个维度
在开始介绍具体产品之前,请你先记住这 5 个维度——后面我们会用这 5 个维度对比每个产品。
维度一:能力强不强(智力水平)
简单讲,就是 AI "聪明不聪明"。
衡量办法:让它做高难度的题。比如美国数学奥赛、研究生级科研问题、复杂代码难题。这些题目有专门的"测试集",业界叫Benchmark(基准测试)。
小知识:你经常会在新闻里看到"某某模型在 X 测试集上得分 95"。这就是在说它的智力水平。常见的测试集名字:MMLU(综合知识)、GPQA(研究生级理科)、HumanEval(代码)、AIME(数学)。
但对普通人来说,不需要过度看 Benchmark——2026 年主流的几个大模型,对普通日常任务能力都是"够用"的。能力差异主要体现在"难题"上。
维度二:会不会"想"(推理能力)
2024 年下半年开始,AI 出现了一个新流派:推理模型(Reasoning Model)。
普通模型是"看到问题立刻答"——快,但容易出错。 推理模型是"看到问题先想 30 秒到几分钟,然后再答"——慢,但准确率高得多。
典型代表:
| 普通模型 | 推理模型 |
|---|---|
| GPT-4o | OpenAI o3 / GPT-5 Thinking |
| Claude 3.5 / 4 默认 | Claude 4 Thinking |
| 豆包 1.6 | 豆包深度思考 |
| DeepSeek-V3 | DeepSeek-R1 / R2 |
| Kimi 2 | Kimi K1.5 推理版 |
| Gemini 2.5 Flash | Gemini 2.5 Pro Thinking |
什么时候用推理模型?
- 数学题、逻辑题、复杂推导 → 用推理模型
- 写代码(特别是复杂逻辑) → 用推理模型
- 战略规划、深度分析 → 用推理模型
- 简单聊天、写文案、找资料 → 用普通模型就够(更快)
维度三:能不能"看"(多模态能力)
多模态 = 能处理文字之外的"媒介"。包括:
- 看图(输入图片):让它"读"一张照片、一张图表、一张截图
- 画图(输出图片):让它生成一张画
- 听声(输入语音):让它"听"你说话
- 说话(输出语音):让它"读"出来给你听
- 看视频(输入视频):让它分析一段视频
- 生成视频(输出视频):让它做一段视频
2026 年主流大模型基本都支持"看图"和"听说",但生成图、生成视频、生成音乐是各自的"专长领域"——往往需要专门的工具(详见后面的"专业垂直派")。
维度四:上下文有多长(记忆力)
上下文长度决定了 AI 一次能"看"多少东西。
- 上下文 8K(约 6000 字):适合短对话
- 上下文 32K(约 24000 字):适合一篇长文章
- 上下文 128K(约 10 万字):适合一本短篇小说 / 一个长合同
- 上下文 200K(约 15 万字):适合一本厚书
- 上下文 1M(约 75 万字):适合一整套财报、整个项目代码库
对普通用户来说,128K 已经够 99% 的场景了。 极少数情况(比如分析整本书)才需要 200K+ 的模型。
维度五:能不能用(访问门槛和价格)
这是普通用户最关心的实际问题:
- 是否需要"科学上网":ChatGPT、Claude、Gemini 等国外产品,在中国大陆访问需要"特殊条件"。豆包、DeepSeek、Kimi 等国产产品在国内可以直接用。
- 是否免费:大部分主流 AI 都有免费版,但能力有上限(比如每天只能用几次最强模型)。付费版(ChatGPT Plus 20 美元/月、Claude Pro 20 美元/月、豆包/Kimi 国内基本免费)解锁更高频次和更强模型。
- 是否需要注册:所有 AI 都需要注册账号;国外的需要邮箱+手机号,国内的多数是手机号注册。
下面我们就用这 5 个维度,把主流工具过一遍。
2.3 国外四大金刚
一、ChatGPT(OpenAI 出品)
| 属性 | 说明 |
|---|---|
| 厂商 | OpenAI(美国) |
| 当前主力模型 | GPT-5、GPT-5 Thinking、GPT-5 Pro、o3 系列 |
| 智力水平 | 顶尖(综合能力 T0) |
| 推理能力 | 强(GPT-5 Thinking、o3 系列专门擅长) |
| 多模态 | 强(能看图、能画图 DALL·E 4、能听说语音) |
| 上下文 | 128K Token(GPT-5 Plus),256K(Pro 用户) |
| 是否免费 | 有免费版,但 GPT-5 Thinking、画图等高级功能需付费(20 美元/月) |
| 国内能否直接用 | 不能,需"科学上网" |
| 适合谁 | 海归、外企、科研、需要全球最强 AI 能力的人 |
ChatGPT 的优势:
- 综合能力业内顶尖——基本上"什么都能做、什么都不差"。
- 生态最丰富——百万级别的"GPTs"(自定义智能体)、各种插件、与微软 Office 深度集成。
- 多模态最完善——一个 App 内就能完成"对话+画图+语音+图像分析+代码执行"。
ChatGPT 的劣势:
- 国内不能直接用——是最大的硬伤。
- 付费才好用——免费版限制多,高级功能基本都要 Plus(20 美元/月)。
- 对中文场景理解略弱于国产 AI——比如中国法律、政策、本地生活信息。
二、Claude(Anthropic 出品)
| 属性 | 说明 |
|---|---|
| 厂商 | Anthropic(美国,由前 OpenAI 高管创立) |
| 当前主力模型 | Claude 4 Opus / Sonnet / Haiku |
| 智力水平 | 顶尖(综合能力 T0) |
| 推理能力 | 强(Claude 4 默认带 Thinking 模式) |
| 多模态 | 中等(能看图,不能直接画图) |
| 上下文 | 200K Token(标准),1M Token(企业版) |
| 是否免费 | 有免费版,Claude Pro 20 美元/月 |
| 国内能否直接用 | 不能,需"科学上网" |
| 适合谁 | 程序员、文字工作者、需要长文档分析的人 |
Claude 的优势:
- 写作能力公认最强——文字流畅、风格自然、长文写作能力业内顶尖。
- 代码能力非常强——Cursor、GitHub Copilot 等开发工具都把 Claude 作为首选模型。
- 长文档处理能力强——200K 上下文,能"吃下"一整本书。
- 更"安全"——拒绝不当请求的策略最严格(这有时是优点,有时是缺点)。
Claude 的劣势:
- 国内不能直接用。
- 不能直接画图(要用其他工具)。
- 有时太"礼貌"——拒绝一些其实合理的请求。
三、Gemini(Google 出品)
| 属性 | 说明 |
|---|---|
| 厂商 | Google(美国) |
| 当前主力模型 | Gemini 2.5 Pro / Flash / Ultra |
| 智力水平 | 顶尖(综合能力 T0) |
| 推理能力 | 强(Gemini 2.5 Thinking) |
| 多模态 | 业界最强(看图、看视频、听音频、画图、生成视频 Veo) |
| 上下文 | 1M Token(业界最长,Pro 200 万) |
| 是否免费 | 免费版较慷慨,付费版 Gemini Advanced 20 美元/月 |
| 国内能否直接用 | 不能,需"科学上网" |
| 适合谁 | 安卓用户、Google 全家桶用户、需要超长上下文的人 |
Gemini 的优势:
- 上下文长度业界第一——1M Token = 75 万字 = 一整套财报或整本《战争与和平》。
- 多模态最完善——是少数能"看视频"的主流模型。
- 与 Google 全家桶深度集成——Gmail、Docs、Sheets、Calendar、YouTube 都内置 Gemini。
- Veo(生成视频)能力强——能生成 1080P、电影级画质的视频。
Gemini 的劣势:
- 国内不能直接用。
- 早期版本口碑不佳——有"懒"、"政治正确过度"等吐槽,2.5 之后大幅改善。
四、Grok(xAI 出品,马斯克旗下)
| 属性 | 说明 |
|---|---|
| 厂商 | xAI(美国,马斯克创立) |
| 当前主力模型 | Grok 4 / Grok 4 Heavy |
| 智力水平 | 强(接近 T0) |
| 推理能力 | 强(Grok 4 自带推理) |
| 多模态 | 中等(能看图、能画图 Aurora) |
| 上下文 | 256K Token |
| 是否免费 | 有免费版(X 平台用户),付费版 SuperGrok 30 美元/月 |
| 国内能否直接用 | 不能,需"科学上网" |
| 适合谁 | X(推特)重度用户、马斯克粉丝、想要"少限制"AI 的人 |
Grok 的优势:
- 能实时获取 X(推特)数据——查时事、查热点、查公众人物言论的速度业内最快。
- 对"敏感话题"限制最少——可以讨论很多其他 AI 拒绝的话题(这有利有弊)。
- 集成在 X App 里——X 用户开箱即用。
Grok 的劣势:
- 国内不能直接用。
- 规模和生态不如前三家。
- "无禁忌"有时变成胡说八道——需要更多甄别。
2.4 国内六大主流
一、豆包(字节跳动出品)
| 属性 | 说明 |
|---|---|
| 厂商 | 字节跳动(北京) |
| 当前主力模型 | 豆包 2.0 Pro、Doubao-Seed-1.6、Doubao-Seed-Code |
| 智力水平 | 强(国内 T1) |
| 推理能力 | 强(豆包深度思考模式) |
| 多模态 | 全(看图、画图 Seedream 4.0、生成视频 Seedance、语音 40+ 音色) |
| 上下文 | 256K Token(个别模型 1M) |
| 是否免费 | 几乎全免费 |
| 国内能否直接用 | 能,无门槛 |
| 适合谁 | 普通大众、家庭用户、移动端为主、低门槛需求 |
豆包的优势:
- 完全免费(截至 2026 年,绝大多数功能不要钱)。
- 入口最多:手机 App、网页、桌面版、抖音内嵌、微信小程序、豆包爱学(教育版)。
- 最适合普通家人——你妈妈用都不用教,打开就会。
- 本地化能力强:识别 20+ 方言、知道中国本地生活信息(公积金、医保、调休等)。
- 多模态完整:拍照、画图、生成视频、语音通话全都有。
豆包的劣势:
- 复杂推理略弱于 DeepSeek。
- 写代码不如 Claude/DeepSeek。
- 学术、专业内容深度略浅(毕竟主打大众)。
二、DeepSeek(深度求索出品)
| 属性 | 说明 |
|---|---|
| 厂商 | 深度求索(杭州,幻方量化背景) |
| 当前主力模型 | DeepSeek-V3.5、DeepSeek-R2 |
| 智力水平 | 顶尖(国内 T0,全球前列) |
| 推理能力 | 极强(R 系列推理能力可与 OpenAI o3 / Claude 4 Thinking 抗衡) |
| 多模态 | 中等(能看图,画图能力较弱) |
| 上下文 | 128K Token |
| 是否免费 | 网页/App 完全免费;API 极便宜(业内最低之一) |
| 国内能否直接用 | 能 |
| 适合谁 | 程序员、研究人员、深度推理需求、追求性价比的人 |
DeepSeek 的优势:
- 推理能力国内最强——R1 在 2025 年 1 月一炮而红,后续 R2 继续领先。
- 写代码能力业内顶尖——和 Claude 并驾齐驱。
- 完全开源——模型权重公开,是开源社区最受欢迎的中文模型。
- 极低价格——API 是 OpenAI 同档次的 1/10 甚至更低。
DeepSeek 的劣势:
- 多模态偏弱——画图、视频、语音功能不如豆包/Kimi。
- 个人版功能较"基础"——没有自定义智能体(需要用 API 自己搭)。
- 响应有时较慢——R 系列推理模型响应较慢,但准确度高。
三、Kimi(月之暗面出品)
| 属性 | 说明 |
|---|---|
| 厂商 | 月之暗面(北京) |
| 当前主力模型 | Kimi K2、Kimi K1.5 推理版 |
| 智力水平 | 强(国内 T1) |
| 推理能力 | 强(K1.5 推理版) |
| 多模态 | 中等(看图、不画图) |
| 上下文 | 2M Token(业内最长,约 150 万字) |
| 是否免费 | 完全免费 |
| 国内能否直接用 | 能 |
| 适合谁 | 文字工作者、长文档处理、研究学习 |
Kimi 的优势:
- 超长上下文——一次能吃下整套财报、整本厚书。
- 联网搜索能力强——能调取大量实时信息。
- 文字能力优秀——适合写作、总结、改稿。
- 完全免费。
Kimi 的劣势:
- 多模态较弱——不能画图、不能生成视频。
- 响应有时较慢(特别是处理超长文档时)。
四、文心一言(百度出品)
| 属性 | 说明 |
|---|---|
| 厂商 | 百度(北京) |
| 当前主力模型 | 文心 5.0、文心 5.0 Turbo |
| 智力水平 | 强(国内 T1) |
| 推理能力 | 中等 |
| 多模态 | 强(看图、画图"文心一格"、生成视频"百度视频生成") |
| 上下文 | 128K Token |
| 是否免费 | 免费版 + 文心一言专业版 49 元/月 |
| 国内能否直接用 | 能 |
| 适合谁 | 百度搜索/网盘老用户、企业用户、需要稳定可靠的人 |
文心一言的优势:
- 百度是国内最早做大模型的——2023 年 3 月就发布了。
- 企业服务和合规性强——很多企业级解决方案。
- 集成在百度全家桶:搜索、网盘、地图、文库都接入了文心。
- 画图能力不错(文心一格)。
文心一言的劣势:
- 个人产品口碑一般——不如豆包/Kimi 易用。
- 付费版门槛较高。
五、通义千问(阿里巴巴出品)
| 属性 | 说明 |
|---|---|
| 厂商 | 阿里云(杭州) |
| 当前主力模型 | 通义千问 3 Max、Qwen3 Max、Qwen3-Plus |
| 智力水平 | 顶尖(国内 T0,开源界领先) |
| 推理能力 | 强(QwQ 推理系列) |
| 多模态 | 强(Qwen-VL 看图、通义万相画图、Wan2.5 生成视频) |
| 上下文 | 1M Token |
| 是否免费 | 网页/App 完全免费 |
| 国内能否直接用 | 能 |
| 适合谁 | 阿里生态用户、开发者、需要开源模型的人 |
通义千问的优势:
- 开源模型业内顶尖——Qwen3 系列在开源排行榜上长期前三。
- 多模态全面——看图、画图、视频、音乐(通义听悟)都有。
- 集成在钉钉、夸克、阿里云等阿里产品里。
- 完全免费。
通义千问的劣势:
- 个人产品体验略不如豆包(界面、流畅度等)。
- 品牌认知度对普通用户略低。
六、智谱清言(智谱 AI 出品)
| 属性 | 说明 |
|---|---|
| 厂商 | 智谱 AI(北京,清华系) |
| 当前主力模型 | GLM-5 / GLM-5-Air |
| 智力水平 | 强(国内 T1) |
| 推理能力 | 强(GLM-Zero 推理版) |
| 多模态 | 强(CogView 画图、CogVideo 视频、CogVoice 语音) |
| 上下文 | 128K Token |
| 是否免费 | 免费版 + 付费版 |
| 国内能否直接用 | 能 |
| 适合谁 | 学术研究、清华系用户、对开源有兴趣的人 |
智谱清言的优势:
- 学术背景深厚——清华大学背景,论文影响力大。
- 多模态完整:GLM、CogView、CogVideo、CogVoice 形成完整矩阵。
- **国内最早做"智能体平台"**之一——智谱 BigModel 平台。
智谱清言的劣势:
- 个人用户认知度不如豆包/Kimi。
- 品牌定位偏 B 端/技术用户。
国产 AI 简明对比表
| 产品 | 一句话定位 | 最大优势 | 最大劣势 | 给谁用 |
|---|---|---|---|---|
| 豆包 | 国民级 AI 助手 | 完全免费、多模态全、入口多 | 推理略弱 | 普通大众、家人、入门用户 |
| DeepSeek | 国产推理之王 | 推理能力顶尖、写代码强 | 多模态弱 | 程序员、研究人员、深度思考者 |
| Kimi | 长文档之王 | 2M 上下文、文字能力强 | 不能画图视频 | 文字工作者、研究学习 |
| 文心一言 | 百度全家桶 | 企业服务强 | 个人体验一般 | 百度老用户、企业用户 |
| 通义千问 | 开源大佬 | 开源顶尖、多模态全 | 品牌认知弱 | 阿里用户、开发者 |
| 智谱清言 | 学院派 | 学术背景、智能体平台 | 个人用户少 | 学术、技术用户 |
2.5 专业垂直派——只做一件事,但做到极致
除了"全能型大模型"外,还有一批"专业型 AI",专精某一项任务。这类工具往往效果更好,但只能干那一件事。
一、AI 画图(图像生成)
| 工具 | 出品方 | 风格 | 适合谁 | 价格 |
|---|---|---|---|---|
| Midjourney | Midjourney | 艺术性极强、风格化重 | 设计师、艺术爱好者 | 10~60 美元/月 |
| DALL·E 4 | OpenAI(含在 ChatGPT 内) | 写实+创意 | ChatGPT 用户 | 含在 Plus 内 |
| Stable Diffusion | Stability AI | 完全开源、可本地部署 | 技术控、有 GPU 的人 | 免费 |
| Flux | Black Forest Labs | 写实质量顶尖 | 摄影师、设计师 | 免费/付费 |
| Ideogram | Ideogram | 文字渲染最强 | 做海报、做 Logo | 免费版+付费 |
| 豆包画图(Seedream) | 字节 | 中文友好、免费 | 普通用户 | 免费 |
| 可灵 AI | 快手 | 视频+图像 | 短视频创作者 | 免费+付费 |
| 即梦 AI | 字节 | 中文友好、设计感强 | 设计师 | 免费+付费 |
| WHEE | 美图 | 美图系,适合人像 | 美图用户 | 免费 |
| 腾讯混元生图 | 腾讯 | 集成在微信 | 微信生态用户 | 免费 |
小建议:普通人不需要装很多。日常用豆包/即梦免费版就够;追求高质量可以试 Midjourney 或 Flux。
二、AI 视频(视频生成)
| 工具 | 出品方 | 特点 | 适合谁 |
|---|---|---|---|
| Sora 2 | OpenAI | 写实电影级、最强 | 创作者、专业用户 |
| Veo 3 | 长视频、物理真实 | Google 用户 | |
| Runway Gen-4 | Runway | 老牌、专业工具链 | 影视、广告 |
| Pika 2.5 | Pika Labs | 易用、适合短视频 | 自媒体 |
| 可灵 AI 2.0 | 快手 | 国产之光、效果强 | 中文创作者 |
| 即梦 AI | 字节 | 字节生态、中文友好 | 抖音创作者 |
| 海螺 AI(MiniMax) | MiniMax | 角色一致性好 | 故事类视频 |
| Vidu | 生数科技(清华系) | 国产、长视频 | 中文创作者 |
三、AI 音乐(音乐生成)
| 工具 | 出品方 | 特点 |
|---|---|---|
| Suno v5 | Suno | 主流之选,能生成完整带歌词歌曲 |
| Udio | Udio | 音乐质感更"专业" |
| 天工 SkyMusic | 昆仑万维 | 国产代表,免费 |
| 海绵音乐 | 字节 | 国产,集成豆包生态 |
四、AI 编程(写代码)
| 工具 | 特点 |
|---|---|
| Cursor | 全球最流行的"AI 优先 IDE",普通人也能用它做小程序 |
| GitHub Copilot | 微软+OpenAI 出品,集成在 VS Code |
| Claude Code / Codex | 命令行 AI 编程助手 |
| Windsurf | Cursor 的对手,类似定位 |
| Trae | 字节出品的 AI IDE,国内可用 |
五、AI 搜索(垂直搜索引擎)
| 工具 | 特点 |
|---|---|
| Perplexity | 全球最知名的 AI 搜索,结果带引用 |
| 秘塔 AI 搜索 | 国产代表,无广告、有大纲 |
| 天工 AI 搜索 | 国产,覆盖学术 |
| ThinkAny | 多源聚合搜索 |
六、AI 阅读/长文档
| 工具 | 特点 |
|---|---|
| NotebookLM | Google 出品,能把文档变成"播客" |
| Kimi 知识库 | 国产代表,处理长文档 |
| Claude Projects | Anthropic 的"项目"功能 |
| 腾讯 IMA | 集成微信,能看公众号文章 |
七、AI 办公
| 工具 | 特点 |
|---|---|
| Microsoft 365 Copilot | 集成在 Word/Excel/PPT/Outlook |
| Google Gemini for Workspace | 集成在 Docs/Sheets/Slides/Gmail |
| 腾讯智能助手 | 集成在腾讯文档、微信 |
| WPS AI | 国产代表,集成在 WPS 全家桶 |
| 钉钉 AI | 集成在钉钉,企业用户福利 |
| 飞书智能伙伴 | 集成在飞书 |
2.6 一棵决策树:你应该用哪个 AI
太复杂?我把上面所有产品按"5 个问题"做成了一棵决策树。只问 5 个问题,告诉你该用哪个。
问题 1:你能"科学上网"吗?
- 不能 → 跳过国外四大金刚(ChatGPT、Claude、Gemini、Grok),只看国产
- 能 → 国内外都可以选
问题 2:你的核心需求是什么?
选项 A:日常聊天 + 信息查询 + 简单写作
- 国内首选:豆包(最全面、最免费)
- 国外首选:ChatGPT(含免费 GPT-5)
选项 B:写代码 / 复杂逻辑 / 数学推理
- 国内首选:DeepSeek(R 系列推理强)
- 国外首选:Claude 4(代码强)或 GPT-5 Thinking
选项 C:写文章 / 创作 / 改稿 / 长文档
- 国内首选:Kimi(2M 上下文)+ DeepSeek(写作好)
- 国外首选:Claude(写作业内最强)
选项 D:画图 / 做设计 / 做视频
- 画图:豆包/即梦(免费)+ Midjourney/Flux(专业)
- 视频:可灵(国产强)/ Sora 2(国外强)
- 音乐:Suno(国外)/ 天工 SkyMusic(国产)
选项 E:办公 / 工作汇报
- 用 Office:装 Microsoft 365 Copilot
- 用 WPS:用 WPS AI
- 用钉钉/飞书:直接用内置的 AI
选项 F:搜索资料 / 做研究
- 国内首选:秘塔 AI 搜索 + Kimi(联网)
- 国外首选:Perplexity + Gemini Deep Research
问题 3:你愿意付费吗?
- 不愿意:国产基本全免费,国外用免费版
- 愿意付一点:ChatGPT Plus / Claude Pro / Gemini Advanced(约 20 美元/月)
- 追求极致:ChatGPT Pro(200 美元/月)/ Claude Max(200 美元/月)
问题 4:你的设备主要是什么?
- Windows + Office → Microsoft Copilot 优先
- Mac + Apple 全家桶 → 关注 Apple Intelligence + ChatGPT
- 安卓 + Google 全家桶 → Gemini 优先
- iPhone + 国内主用 → 豆包 / DeepSeek
- iPhone + 国外主用 → ChatGPT App
问题 5:你想给谁用?
- 给自己(年轻人/上班族) → 主用 1 个综合(豆包或 ChatGPT)+ 1 个推理(DeepSeek)+ 1 个画图(即梦或 Midjourney)
- 给爸妈 → 豆包(最简单)
- 给孩子(学习用) → 豆包爱学 / Kimi(学习版)
- 给团队 → 钉钉/飞书集成的 AI / Microsoft Copilot
2.7 我的"个人推荐组合"
如果让我给一个 2026 年的中国普通人推荐,我会推这套组合:
入门套餐(完全免费,3 个工具)
- 豆包(手机+电脑)—— 日常 80% 的事
- DeepSeek(网页)—— 复杂推理、写代码
- Kimi(网页)—— 长文档、找资料
这三个组合,能满足 95% 的普通人需求,全部免费,全部国内可用。
进阶套餐(少量付费,5 个工具)
在入门套餐基础上加:
- ChatGPT Plus(约 20 美元/月)—— 国际化、最强生态、画图视频一体
- Claude Pro(约 20 美元/月)—— 最强写作和代码
创作者套餐(按需付费,专业向)
- Midjourney 或 Flux(约 10~30 美元/月)—— 专业画图
- 可灵 / Runway / Sora(按用量付费)—— AI 视频
- Suno(10 美元/月)—— AI 音乐
- Cursor(20 美元/月)—— AI 编程(如果你做点小项目)
我个人的"日常使用排序"(仅供参考)
- 70% 用 ChatGPT(最快、最熟、最全能)
- 15% 用 Claude(写作、代码)
- 10% 用 DeepSeek(深度推理)
- 5% 用各种垂直工具(按需)
2.8 几个常见疑问
Q1:我能不能"只用一个"AI?
可以。对 80% 的普通用户,只用一个综合型 AI 就够。 推荐豆包(国内)或 ChatGPT(国外)。
Q2:用一个免费的够吗?
够。2026 年的免费 AI 已经远超你想象。豆包+DeepSeek+Kimi 三个免费组合,能满足绝大多数场景。
Q3:付费版到底值不值?
看需求:
- 重度用户(每天 2 小时以上):值
- 轻度用户(每天 10 分钟):免费版就够
- 专业需求(写代码、做设计):值
Q4:哪个 AI "最聪明"?
2026 年初的"全球第一梯队"(无明显差距):
- ChatGPT(GPT-5、GPT-5 Thinking)
- Claude 4 Opus
- Gemini 2.5 Pro Thinking
- DeepSeek-R2(国产代表)
它们之间的差距对普通用户基本无感。真正的差距来自"你怎么用",不是"你用哪个"。
Q5:未来会有更新的 AI 出现吗?
一定会。 AI 的迭代速度是按"季度"计的。本书写于 2026 年 4 月,可能你看到的时候,已经有了 GPT-6、Claude 5、豆包 3.0、DeepSeek-R3⋯⋯
但底层方法学是稳定的——你今天学会的"怎么提问"、"怎么用上下文"、"怎么避免幻觉",换什么模型都通用。
这就是为什么这本书叫"AI 橙皮书",不是"豆包橙皮书"或"ChatGPT 橙皮书"。
本章小抄
2026 年 AI 江湖速览
──────────────
国外四大金刚(需科学上网):
├─ ChatGPT(GPT-5)—— 综合最强、生态最丰富
├─ Claude 4 —— 写作和代码最强
├─ Gemini 2.5 —— 上下文 1M、多模态最完整
└─ Grok 4 —— X 集成、限制最少
国内六大主流(直接可用,多数免费):
├─ 豆包 —— 国民级、最全面、最易用
├─ DeepSeek —— 推理之王、写代码强
├─ Kimi —— 2M 上下文、文字工作者首选
├─ 文心一言 —— 百度老牌
├─ 通义千问 —— 阿里、开源顶尖
└─ 智谱清言 —— 清华学院派
专业垂直派(按需选):
├─ 画图:Midjourney / Flux / 即梦 / 豆包
├─ 视频:Sora / Veo / 可灵 / Runway
├─ 音乐:Suno / 天工
├─ 代码:Cursor / Copilot
├─ 搜索:Perplexity / 秘塔
└─ 办公:Office Copilot / WPS AI
入门推荐组合(普通人):
└─ 豆包 + DeepSeek + Kimi(三件套,全免费,国内可用)
5 分钟动手实验
任务:选 1~2 个 AI 工具注册账号、跑通"第一次对话"。
步骤:
-
打开应用商店,按以下推荐选 1~2 个安装:
- 国内手机:搜"豆包"、"DeepSeek"、"Kimi" 任选其一
- 国外手机:搜"ChatGPT"、"Claude"、"Gemini" 任选其一
- 电脑:直接访问 doubao.com / deepseek.com / kimi.com / chat.openai.com
-
完成注册(手机号验证或邮箱验证)
-
跑通第一次对话:把下面这段提示词复制进去:
你好!我刚下载你来试用。请你做以下三件事:
1. 用一句话介绍你自己(你叫什么、你是谁做的、你的特长是什么)。
2. 给我看看你能做什么——任意展示一个你最擅长的能力。
3. 给我一个使用建议:作为一个完全新手,我应该从什么任务开始用你?
要求:友好、自然、像和朋友聊天。
- 观察答案:
- 它的"自我介绍"准不准(很多 AI 会一本正经胡说自己是 GPT,要警惕)
- 它演示的能力是否让你眼前一亮
- 它给的"上手建议"是否有帮助
- 选你最喜欢的一个留下来,作为你的"主力 AI"。
这 5 分钟将彻底解决"该用哪个"的问题。
下章预告
下一章 第三章 五分钟上手你的第一个 AI 助手,我们手把手带你完成"第一次和 AI 的完整对话"——不是简单地问一句答一句,而是一次完整的"提问→回答→追问→改进→使用"的完整闭环。
如果你已经选好了主力 AI,准备好打开它跟着练吧。