ORANGE BOOK

第二章 2026 年 AI 工具全景图


2.1 一个让人头大的现实:AI 工具太多了

打开应用商店搜"AI",刷出来的 App 多到让人头晕:

ChatGPT、Claude、Gemini、Grok、Perplexity、Copilot、豆包、DeepSeek、Kimi、文心一言、通义千问、智谱清言、腾讯元宝、讯飞星火、商汤商量、阶跃跃问、MiniMax 海螺、面壁智能、零一万物⋯⋯

而且这些每个里面还嵌套了不同的"模型版本"——比如 ChatGPT 里你能选 GPT-5、GPT-5 Thinking、GPT-5 Pro、GPT-4o、o3 等等。

完全是个"AI 选项地狱"。

但你不用焦虑——99% 的普通人,只需要熟练用 1~2 个工具就够了。本章会帮你迅速定位"哪个适合你"。


2.2 先讲方法论:选 AI 工具看 5 个维度

在开始介绍具体产品之前,请你先记住这 5 个维度——后面我们会用这 5 个维度对比每个产品。

维度一:能力强不强(智力水平)

简单讲,就是 AI "聪明不聪明"。

衡量办法:让它做高难度的题。比如美国数学奥赛、研究生级科研问题、复杂代码难题。这些题目有专门的"测试集",业界叫Benchmark(基准测试)。

小知识:你经常会在新闻里看到"某某模型在 X 测试集上得分 95"。这就是在说它的智力水平。常见的测试集名字:MMLU(综合知识)、GPQA(研究生级理科)、HumanEval(代码)、AIME(数学)。

但对普通人来说,不需要过度看 Benchmark——2026 年主流的几个大模型,对普通日常任务能力都是"够用"的。能力差异主要体现在"难题"上。

维度二:会不会"想"(推理能力)

2024 年下半年开始,AI 出现了一个新流派:推理模型(Reasoning Model)。

普通模型是"看到问题立刻答"——快,但容易出错。 推理模型是"看到问题先想 30 秒到几分钟,然后再答"——慢,但准确率高得多。

典型代表

普通模型 推理模型
GPT-4o OpenAI o3 / GPT-5 Thinking
Claude 3.5 / 4 默认 Claude 4 Thinking
豆包 1.6 豆包深度思考
DeepSeek-V3 DeepSeek-R1 / R2
Kimi 2 Kimi K1.5 推理版
Gemini 2.5 Flash Gemini 2.5 Pro Thinking

什么时候用推理模型?

  • 数学题、逻辑题、复杂推导 → 用推理模型
  • 写代码(特别是复杂逻辑) → 用推理模型
  • 战略规划、深度分析 → 用推理模型
  • 简单聊天、写文案、找资料 → 用普通模型就够(更快)

维度三:能不能"看"(多模态能力)

多模态 = 能处理文字之外的"媒介"。包括:

  • 看图(输入图片):让它"读"一张照片、一张图表、一张截图
  • 画图(输出图片):让它生成一张画
  • 听声(输入语音):让它"听"你说话
  • 说话(输出语音):让它"读"出来给你听
  • 看视频(输入视频):让它分析一段视频
  • 生成视频(输出视频):让它做一段视频

2026 年主流大模型基本都支持"看图"和"听说",但生成图、生成视频、生成音乐是各自的"专长领域"——往往需要专门的工具(详见后面的"专业垂直派")。

维度四:上下文有多长(记忆力)

上下文长度决定了 AI 一次能"看"多少东西。

  • 上下文 8K(约 6000 字):适合短对话
  • 上下文 32K(约 24000 字):适合一篇长文章
  • 上下文 128K(约 10 万字):适合一本短篇小说 / 一个长合同
  • 上下文 200K(约 15 万字):适合一本厚书
  • 上下文 1M(约 75 万字):适合一整套财报、整个项目代码库

对普通用户来说,128K 已经够 99% 的场景了。 极少数情况(比如分析整本书)才需要 200K+ 的模型。

维度五:能不能用(访问门槛和价格)

这是普通用户最关心的实际问题:

  • 是否需要"科学上网":ChatGPT、Claude、Gemini 等国外产品,在中国大陆访问需要"特殊条件"。豆包、DeepSeek、Kimi 等国产产品在国内可以直接用。
  • 是否免费:大部分主流 AI 都有免费版,但能力有上限(比如每天只能用几次最强模型)。付费版(ChatGPT Plus 20 美元/月、Claude Pro 20 美元/月、豆包/Kimi 国内基本免费)解锁更高频次和更强模型。
  • 是否需要注册:所有 AI 都需要注册账号;国外的需要邮箱+手机号,国内的多数是手机号注册。

下面我们就用这 5 个维度,把主流工具过一遍。


2.3 国外四大金刚

一、ChatGPT(OpenAI 出品)

属性 说明
厂商 OpenAI(美国)
当前主力模型 GPT-5、GPT-5 Thinking、GPT-5 Pro、o3 系列
智力水平 顶尖(综合能力 T0)
推理能力 强(GPT-5 Thinking、o3 系列专门擅长)
多模态 强(能看图、能画图 DALL·E 4、能听说语音)
上下文 128K Token(GPT-5 Plus),256K(Pro 用户)
是否免费 有免费版,但 GPT-5 Thinking、画图等高级功能需付费(20 美元/月)
国内能否直接用 不能,需"科学上网"
适合谁 海归、外企、科研、需要全球最强 AI 能力的人

ChatGPT 的优势

  • 综合能力业内顶尖——基本上"什么都能做、什么都不差"。
  • 生态最丰富——百万级别的"GPTs"(自定义智能体)、各种插件、与微软 Office 深度集成。
  • 多模态最完善——一个 App 内就能完成"对话+画图+语音+图像分析+代码执行"。

ChatGPT 的劣势

  • 国内不能直接用——是最大的硬伤。
  • 付费才好用——免费版限制多,高级功能基本都要 Plus(20 美元/月)。
  • 对中文场景理解略弱于国产 AI——比如中国法律、政策、本地生活信息。

二、Claude(Anthropic 出品)

属性 说明
厂商 Anthropic(美国,由前 OpenAI 高管创立)
当前主力模型 Claude 4 Opus / Sonnet / Haiku
智力水平 顶尖(综合能力 T0)
推理能力 强(Claude 4 默认带 Thinking 模式)
多模态 中等(能看图,不能直接画图)
上下文 200K Token(标准),1M Token(企业版)
是否免费 有免费版,Claude Pro 20 美元/月
国内能否直接用 不能,需"科学上网"
适合谁 程序员、文字工作者、需要长文档分析的人

Claude 的优势

  • 写作能力公认最强——文字流畅、风格自然、长文写作能力业内顶尖。
  • 代码能力非常强——Cursor、GitHub Copilot 等开发工具都把 Claude 作为首选模型。
  • 长文档处理能力强——200K 上下文,能"吃下"一整本书。
  • 更"安全"——拒绝不当请求的策略最严格(这有时是优点,有时是缺点)。

Claude 的劣势

  • 国内不能直接用
  • 不能直接画图(要用其他工具)。
  • 有时太"礼貌"——拒绝一些其实合理的请求。

三、Gemini(Google 出品)

属性 说明
厂商 Google(美国)
当前主力模型 Gemini 2.5 Pro / Flash / Ultra
智力水平 顶尖(综合能力 T0)
推理能力 强(Gemini 2.5 Thinking)
多模态 业界最强(看图、看视频、听音频、画图、生成视频 Veo)
上下文 1M Token(业界最长,Pro 200 万)
是否免费 免费版较慷慨,付费版 Gemini Advanced 20 美元/月
国内能否直接用 不能,需"科学上网"
适合谁 安卓用户、Google 全家桶用户、需要超长上下文的人

Gemini 的优势

  • 上下文长度业界第一——1M Token = 75 万字 = 一整套财报或整本《战争与和平》。
  • 多模态最完善——是少数能"看视频"的主流模型。
  • 与 Google 全家桶深度集成——Gmail、Docs、Sheets、Calendar、YouTube 都内置 Gemini。
  • Veo(生成视频)能力强——能生成 1080P、电影级画质的视频。

Gemini 的劣势

  • 国内不能直接用
  • 早期版本口碑不佳——有"懒"、"政治正确过度"等吐槽,2.5 之后大幅改善。

四、Grok(xAI 出品,马斯克旗下)

属性 说明
厂商 xAI(美国,马斯克创立)
当前主力模型 Grok 4 / Grok 4 Heavy
智力水平 强(接近 T0)
推理能力 强(Grok 4 自带推理)
多模态 中等(能看图、能画图 Aurora)
上下文 256K Token
是否免费 有免费版(X 平台用户),付费版 SuperGrok 30 美元/月
国内能否直接用 不能,需"科学上网"
适合谁 X(推特)重度用户、马斯克粉丝、想要"少限制"AI 的人

Grok 的优势

  • 能实时获取 X(推特)数据——查时事、查热点、查公众人物言论的速度业内最快。
  • 对"敏感话题"限制最少——可以讨论很多其他 AI 拒绝的话题(这有利有弊)。
  • 集成在 X App 里——X 用户开箱即用。

Grok 的劣势

  • 国内不能直接用
  • 规模和生态不如前三家
  • "无禁忌"有时变成胡说八道——需要更多甄别。

2.4 国内六大主流

一、豆包(字节跳动出品)

属性 说明
厂商 字节跳动(北京)
当前主力模型 豆包 2.0 Pro、Doubao-Seed-1.6、Doubao-Seed-Code
智力水平 强(国内 T1)
推理能力 强(豆包深度思考模式)
多模态 全(看图、画图 Seedream 4.0、生成视频 Seedance、语音 40+ 音色)
上下文 256K Token(个别模型 1M)
是否免费 几乎全免费
国内能否直接用 ,无门槛
适合谁 普通大众、家庭用户、移动端为主、低门槛需求

豆包的优势

  • 完全免费(截至 2026 年,绝大多数功能不要钱)。
  • 入口最多:手机 App、网页、桌面版、抖音内嵌、微信小程序、豆包爱学(教育版)。
  • 最适合普通家人——你妈妈用都不用教,打开就会。
  • 本地化能力强:识别 20+ 方言、知道中国本地生活信息(公积金、医保、调休等)。
  • 多模态完整:拍照、画图、生成视频、语音通话全都有。

豆包的劣势

  • 复杂推理略弱于 DeepSeek
  • 写代码不如 Claude/DeepSeek
  • 学术、专业内容深度略浅(毕竟主打大众)。

二、DeepSeek(深度求索出品)

属性 说明
厂商 深度求索(杭州,幻方量化背景)
当前主力模型 DeepSeek-V3.5、DeepSeek-R2
智力水平 顶尖(国内 T0,全球前列)
推理能力 极强(R 系列推理能力可与 OpenAI o3 / Claude 4 Thinking 抗衡)
多模态 中等(能看图,画图能力较弱)
上下文 128K Token
是否免费 网页/App 完全免费;API 极便宜(业内最低之一)
国内能否直接用
适合谁 程序员、研究人员、深度推理需求、追求性价比的人

DeepSeek 的优势

  • 推理能力国内最强——R1 在 2025 年 1 月一炮而红,后续 R2 继续领先。
  • 写代码能力业内顶尖——和 Claude 并驾齐驱。
  • 完全开源——模型权重公开,是开源社区最受欢迎的中文模型。
  • 极低价格——API 是 OpenAI 同档次的 1/10 甚至更低。

DeepSeek 的劣势

  • 多模态偏弱——画图、视频、语音功能不如豆包/Kimi。
  • 个人版功能较"基础"——没有自定义智能体(需要用 API 自己搭)。
  • 响应有时较慢——R 系列推理模型响应较慢,但准确度高。

三、Kimi(月之暗面出品)

属性 说明
厂商 月之暗面(北京)
当前主力模型 Kimi K2、Kimi K1.5 推理版
智力水平 强(国内 T1)
推理能力 强(K1.5 推理版)
多模态 中等(看图、不画图)
上下文 2M Token(业内最长,约 150 万字)
是否免费 完全免费
国内能否直接用
适合谁 文字工作者、长文档处理、研究学习

Kimi 的优势

  • 超长上下文——一次能吃下整套财报、整本厚书。
  • 联网搜索能力强——能调取大量实时信息。
  • 文字能力优秀——适合写作、总结、改稿。
  • 完全免费

Kimi 的劣势

  • 多模态较弱——不能画图、不能生成视频。
  • 响应有时较慢(特别是处理超长文档时)。

四、文心一言(百度出品)

属性 说明
厂商 百度(北京)
当前主力模型 文心 5.0、文心 5.0 Turbo
智力水平 强(国内 T1)
推理能力 中等
多模态 强(看图、画图"文心一格"、生成视频"百度视频生成")
上下文 128K Token
是否免费 免费版 + 文心一言专业版 49 元/月
国内能否直接用
适合谁 百度搜索/网盘老用户、企业用户、需要稳定可靠的人

文心一言的优势

  • 百度是国内最早做大模型的——2023 年 3 月就发布了。
  • 企业服务和合规性强——很多企业级解决方案。
  • 集成在百度全家桶:搜索、网盘、地图、文库都接入了文心。
  • 画图能力不错(文心一格)。

文心一言的劣势

  • 个人产品口碑一般——不如豆包/Kimi 易用。
  • 付费版门槛较高

五、通义千问(阿里巴巴出品)

属性 说明
厂商 阿里云(杭州)
当前主力模型 通义千问 3 Max、Qwen3 Max、Qwen3-Plus
智力水平 顶尖(国内 T0,开源界领先)
推理能力 强(QwQ 推理系列)
多模态 强(Qwen-VL 看图、通义万相画图、Wan2.5 生成视频)
上下文 1M Token
是否免费 网页/App 完全免费
国内能否直接用
适合谁 阿里生态用户、开发者、需要开源模型的人

通义千问的优势

  • 开源模型业内顶尖——Qwen3 系列在开源排行榜上长期前三。
  • 多模态全面——看图、画图、视频、音乐(通义听悟)都有。
  • 集成在钉钉、夸克、阿里云等阿里产品里。
  • 完全免费

通义千问的劣势

  • 个人产品体验略不如豆包(界面、流畅度等)。
  • 品牌认知度对普通用户略低

六、智谱清言(智谱 AI 出品)

属性 说明
厂商 智谱 AI(北京,清华系)
当前主力模型 GLM-5 / GLM-5-Air
智力水平 强(国内 T1)
推理能力 强(GLM-Zero 推理版)
多模态 强(CogView 画图、CogVideo 视频、CogVoice 语音)
上下文 128K Token
是否免费 免费版 + 付费版
国内能否直接用
适合谁 学术研究、清华系用户、对开源有兴趣的人

智谱清言的优势

  • 学术背景深厚——清华大学背景,论文影响力大。
  • 多模态完整:GLM、CogView、CogVideo、CogVoice 形成完整矩阵。
  • **国内最早做"智能体平台"**之一——智谱 BigModel 平台。

智谱清言的劣势

  • 个人用户认知度不如豆包/Kimi
  • 品牌定位偏 B 端/技术用户

国产 AI 简明对比表

产品 一句话定位 最大优势 最大劣势 给谁用
豆包 国民级 AI 助手 完全免费、多模态全、入口多 推理略弱 普通大众、家人、入门用户
DeepSeek 国产推理之王 推理能力顶尖、写代码强 多模态弱 程序员、研究人员、深度思考者
Kimi 长文档之王 2M 上下文、文字能力强 不能画图视频 文字工作者、研究学习
文心一言 百度全家桶 企业服务强 个人体验一般 百度老用户、企业用户
通义千问 开源大佬 开源顶尖、多模态全 品牌认知弱 阿里用户、开发者
智谱清言 学院派 学术背景、智能体平台 个人用户少 学术、技术用户

2.5 专业垂直派——只做一件事,但做到极致

除了"全能型大模型"外,还有一批"专业型 AI",专精某一项任务。这类工具往往效果更好,但只能干那一件事。

一、AI 画图(图像生成)

工具 出品方 风格 适合谁 价格
Midjourney Midjourney 艺术性极强、风格化重 设计师、艺术爱好者 10~60 美元/月
DALL·E 4 OpenAI(含在 ChatGPT 内) 写实+创意 ChatGPT 用户 含在 Plus 内
Stable Diffusion Stability AI 完全开源、可本地部署 技术控、有 GPU 的人 免费
Flux Black Forest Labs 写实质量顶尖 摄影师、设计师 免费/付费
Ideogram Ideogram 文字渲染最强 做海报、做 Logo 免费版+付费
豆包画图(Seedream) 字节 中文友好、免费 普通用户 免费
可灵 AI 快手 视频+图像 短视频创作者 免费+付费
即梦 AI 字节 中文友好、设计感强 设计师 免费+付费
WHEE 美图 美图系,适合人像 美图用户 免费
腾讯混元生图 腾讯 集成在微信 微信生态用户 免费

小建议:普通人不需要装很多。日常用豆包/即梦免费版就够;追求高质量可以试 Midjourney 或 Flux。

二、AI 视频(视频生成)

工具 出品方 特点 适合谁
Sora 2 OpenAI 写实电影级、最强 创作者、专业用户
Veo 3 Google 长视频、物理真实 Google 用户
Runway Gen-4 Runway 老牌、专业工具链 影视、广告
Pika 2.5 Pika Labs 易用、适合短视频 自媒体
可灵 AI 2.0 快手 国产之光、效果强 中文创作者
即梦 AI 字节 字节生态、中文友好 抖音创作者
海螺 AI(MiniMax) MiniMax 角色一致性好 故事类视频
Vidu 生数科技(清华系) 国产、长视频 中文创作者

三、AI 音乐(音乐生成)

工具 出品方 特点
Suno v5 Suno 主流之选,能生成完整带歌词歌曲
Udio Udio 音乐质感更"专业"
天工 SkyMusic 昆仑万维 国产代表,免费
海绵音乐 字节 国产,集成豆包生态

四、AI 编程(写代码)

工具 特点
Cursor 全球最流行的"AI 优先 IDE",普通人也能用它做小程序
GitHub Copilot 微软+OpenAI 出品,集成在 VS Code
Claude Code / Codex 命令行 AI 编程助手
Windsurf Cursor 的对手,类似定位
Trae 字节出品的 AI IDE,国内可用

五、AI 搜索(垂直搜索引擎)

工具 特点
Perplexity 全球最知名的 AI 搜索,结果带引用
秘塔 AI 搜索 国产代表,无广告、有大纲
天工 AI 搜索 国产,覆盖学术
ThinkAny 多源聚合搜索

六、AI 阅读/长文档

工具 特点
NotebookLM Google 出品,能把文档变成"播客"
Kimi 知识库 国产代表,处理长文档
Claude Projects Anthropic 的"项目"功能
腾讯 IMA 集成微信,能看公众号文章

七、AI 办公

工具 特点
Microsoft 365 Copilot 集成在 Word/Excel/PPT/Outlook
Google Gemini for Workspace 集成在 Docs/Sheets/Slides/Gmail
腾讯智能助手 集成在腾讯文档、微信
WPS AI 国产代表,集成在 WPS 全家桶
钉钉 AI 集成在钉钉,企业用户福利
飞书智能伙伴 集成在飞书

2.6 一棵决策树:你应该用哪个 AI

太复杂?我把上面所有产品按"5 个问题"做成了一棵决策树。只问 5 个问题,告诉你该用哪个。

问题 1:你能"科学上网"吗?

  • 不能 → 跳过国外四大金刚(ChatGPT、Claude、Gemini、Grok),只看国产
  • → 国内外都可以选

问题 2:你的核心需求是什么?

选项 A:日常聊天 + 信息查询 + 简单写作

  • 国内首选:豆包(最全面、最免费)
  • 国外首选:ChatGPT(含免费 GPT-5)

选项 B:写代码 / 复杂逻辑 / 数学推理

  • 国内首选:DeepSeek(R 系列推理强)
  • 国外首选:Claude 4(代码强)或 GPT-5 Thinking

选项 C:写文章 / 创作 / 改稿 / 长文档

  • 国内首选:Kimi(2M 上下文)+ DeepSeek(写作好)
  • 国外首选:Claude(写作业内最强)

选项 D:画图 / 做设计 / 做视频

  • 画图:豆包/即梦(免费)+ Midjourney/Flux(专业)
  • 视频:可灵(国产强)/ Sora 2(国外强)
  • 音乐:Suno(国外)/ 天工 SkyMusic(国产)

选项 E:办公 / 工作汇报

  • 用 Office:装 Microsoft 365 Copilot
  • 用 WPS:用 WPS AI
  • 用钉钉/飞书:直接用内置的 AI

选项 F:搜索资料 / 做研究

  • 国内首选:秘塔 AI 搜索 + Kimi(联网)
  • 国外首选:Perplexity + Gemini Deep Research

问题 3:你愿意付费吗?

  • 不愿意:国产基本全免费,国外用免费版
  • 愿意付一点:ChatGPT Plus / Claude Pro / Gemini Advanced(约 20 美元/月)
  • 追求极致:ChatGPT Pro(200 美元/月)/ Claude Max(200 美元/月)

问题 4:你的设备主要是什么?

  • Windows + Office → Microsoft Copilot 优先
  • Mac + Apple 全家桶 → 关注 Apple Intelligence + ChatGPT
  • 安卓 + Google 全家桶 → Gemini 优先
  • iPhone + 国内主用 → 豆包 / DeepSeek
  • iPhone + 国外主用 → ChatGPT App

问题 5:你想给谁用?

  • 给自己(年轻人/上班族) → 主用 1 个综合(豆包或 ChatGPT)+ 1 个推理(DeepSeek)+ 1 个画图(即梦或 Midjourney)
  • 给爸妈 → 豆包(最简单)
  • 给孩子(学习用) → 豆包爱学 / Kimi(学习版)
  • 给团队 → 钉钉/飞书集成的 AI / Microsoft Copilot

2.7 我的"个人推荐组合"

如果让我给一个 2026 年的中国普通人推荐,我会推这套组合:

入门套餐(完全免费,3 个工具)

  1. 豆包(手机+电脑)—— 日常 80% 的事
  2. DeepSeek(网页)—— 复杂推理、写代码
  3. Kimi(网页)—— 长文档、找资料

这三个组合,能满足 95% 的普通人需求,全部免费,全部国内可用。

进阶套餐(少量付费,5 个工具)

在入门套餐基础上加:

  1. ChatGPT Plus(约 20 美元/月)—— 国际化、最强生态、画图视频一体
  2. Claude Pro(约 20 美元/月)—— 最强写作和代码

创作者套餐(按需付费,专业向)

  1. Midjourney 或 Flux(约 10~30 美元/月)—— 专业画图
  2. 可灵 / Runway / Sora(按用量付费)—— AI 视频
  3. Suno(10 美元/月)—— AI 音乐
  4. Cursor(20 美元/月)—— AI 编程(如果你做点小项目)

我个人的"日常使用排序"(仅供参考)

  • 70% 用 ChatGPT(最快、最熟、最全能)
  • 15% 用 Claude(写作、代码)
  • 10% 用 DeepSeek(深度推理)
  • 5% 用各种垂直工具(按需)

2.8 几个常见疑问

Q1:我能不能"只用一个"AI?

可以。对 80% 的普通用户,只用一个综合型 AI 就够。 推荐豆包(国内)或 ChatGPT(国外)。

Q2:用一个免费的够吗?

够。2026 年的免费 AI 已经远超你想象。豆包+DeepSeek+Kimi 三个免费组合,能满足绝大多数场景。

Q3:付费版到底值不值?

看需求:

  • 重度用户(每天 2 小时以上):值
  • 轻度用户(每天 10 分钟):免费版就够
  • 专业需求(写代码、做设计):值

Q4:哪个 AI "最聪明"?

2026 年初的"全球第一梯队"(无明显差距):

  • ChatGPT(GPT-5、GPT-5 Thinking)
  • Claude 4 Opus
  • Gemini 2.5 Pro Thinking
  • DeepSeek-R2(国产代表)

它们之间的差距对普通用户基本无感。真正的差距来自"你怎么用",不是"你用哪个"。

Q5:未来会有更新的 AI 出现吗?

一定会。 AI 的迭代速度是按"季度"计的。本书写于 2026 年 4 月,可能你看到的时候,已经有了 GPT-6、Claude 5、豆包 3.0、DeepSeek-R3⋯⋯

底层方法学是稳定的——你今天学会的"怎么提问"、"怎么用上下文"、"怎么避免幻觉",换什么模型都通用。

这就是为什么这本书叫"AI 橙皮书",不是"豆包橙皮书"或"ChatGPT 橙皮书"。


本章小抄

2026 年 AI 江湖速览
──────────────

国外四大金刚(需科学上网):
├─ ChatGPT(GPT-5)—— 综合最强、生态最丰富
├─ Claude 4 —— 写作和代码最强
├─ Gemini 2.5 —— 上下文 1M、多模态最完整
└─ Grok 4 —— X 集成、限制最少

国内六大主流(直接可用,多数免费):
├─ 豆包 —— 国民级、最全面、最易用
├─ DeepSeek —— 推理之王、写代码强
├─ Kimi —— 2M 上下文、文字工作者首选
├─ 文心一言 —— 百度老牌
├─ 通义千问 —— 阿里、开源顶尖
└─ 智谱清言 —— 清华学院派

专业垂直派(按需选):
├─ 画图:Midjourney / Flux / 即梦 / 豆包
├─ 视频:Sora / Veo / 可灵 / Runway
├─ 音乐:Suno / 天工
├─ 代码:Cursor / Copilot
├─ 搜索:Perplexity / 秘塔
└─ 办公:Office Copilot / WPS AI

入门推荐组合(普通人):
└─ 豆包 + DeepSeek + Kimi(三件套,全免费,国内可用)

5 分钟动手实验

任务:选 1~2 个 AI 工具注册账号、跑通"第一次对话"。

步骤

  1. 打开应用商店,按以下推荐选 1~2 个安装:

    • 国内手机:搜"豆包"、"DeepSeek"、"Kimi" 任选其一
    • 国外手机:搜"ChatGPT"、"Claude"、"Gemini" 任选其一
    • 电脑:直接访问 doubao.com / deepseek.com / kimi.com / chat.openai.com
  2. 完成注册(手机号验证或邮箱验证)

  3. 跑通第一次对话:把下面这段提示词复制进去:

你好!我刚下载你来试用。请你做以下三件事:

1. 用一句话介绍你自己(你叫什么、你是谁做的、你的特长是什么)。
2. 给我看看你能做什么——任意展示一个你最擅长的能力。
3. 给我一个使用建议:作为一个完全新手,我应该从什么任务开始用你?

要求:友好、自然、像和朋友聊天。
  1. 观察答案
  • 它的"自我介绍"准不准(很多 AI 会一本正经胡说自己是 GPT,要警惕)
  • 它演示的能力是否让你眼前一亮
  • 它给的"上手建议"是否有帮助
  1. 选你最喜欢的一个留下来,作为你的"主力 AI"。

这 5 分钟将彻底解决"该用哪个"的问题。


下章预告

下一章 第三章 五分钟上手你的第一个 AI 助手,我们手把手带你完成"第一次和 AI 的完整对话"——不是简单地问一句答一句,而是一次完整的"提问→回答→追问→改进→使用"的完整闭环。

如果你已经选好了主力 AI,准备好打开它跟着练吧。