本章你将学到
- Gemini 的身世:它从哪里来、谁在做、当前有几个版本
- Gemini 不是什么:5 个常见的误解
- Gemini 是什么:用一棵树来理解整个产品矩阵
- 它能帮你做的 20 件具体的事
- 它和 ChatGPT、豆包、DeepSeek、Kimi 的对比表
- 5 分钟自检:你到底要不要学它
一、Gemini 的身世(30 秒看完)
- 谁做的:Google(更准确说是 Google DeepMind 团队)。
- 诞生:2023 年 12 月发布第一代 Gemini 1.0(Ultra/Pro/Nano)。
- 关键节点:
- 2024 年初:Bard 改名 Gemini,Gemini App 上线。
- 2024 年 5 月:Gemini 1.5 Pro 推出,首次实现"100 万 token 长上下文"。
- 2024 年 12 月:Gemini 2.0 Flash 推出。
- 2025 年 3-6 月:Gemini 2.5 系列发布(Pro/Flash/Flash-Lite)。
- 2025 年 11 月:Gemini 3 Pro 发布,原生多模态推理上一个大台阶。
- 2026 年 3 月:Gemini 3.1 Pro 发布,旗舰模型,推理能力比 3 Pro 提升一倍。
- 当前家族(2026 年 4 月):
- Gemini 3.1 Pro:旗舰,最强推理。
- Gemini 3 Pro:复杂任务首选。
- Gemini 3 Flash:日常对话/工作的最佳性价比。
- Gemini 3.1 Flash-Lite:极速、便宜,适合大量、简单任务。
- Gemini 2.5 系列:仍保留供向下兼容。
记不住?没关系。普通人只需要记住一句话:"我有四档可选,从慢但聪明,到快但便宜,按场景选就行。"
二、Gemini 不是什么(5 个常见误解)
误解 1:"Gemini 就是 Google 搜索的升级版?"
不是。 Google 搜索给你的是链接——你还要自己点进去读。Gemini 给你的是答案——它已经替你读完、综合好了。
Google 搜索 + Gemini 的关系,类似"图书馆 + 私人秘书"。
误解 2:"Gemini 就是 ChatGPT 的 Google 版?"
部分对,但不全对。 二者都属于"对话式 AI",但 Gemini 的差异在:
- 原生多模态:Gemini 从设计第一天就是"会看视频会听声音"的,ChatGPT 是后来加上的。
- 绑定 Google 全家桶:Gemini 直接进 Gmail、Docs、YouTube、Drive,不需要插件。
- NotebookLM:这是一个 ChatGPT 没有完全等价物的产品。
- 完全免费的 API 试用:AI Studio 给所有人提供免费的 Gemini API 额度。
误解 3:"Gemini 在中国大陆用不了,学了没用?"
学了非常有用,且越来越多人用得上。 三个事实:
- 大陆地区的用户可以通过合规的海外网络访问,Gemini App、网页、AI Studio 都能用。
- 即使你完全不打算用海外服务,Gemini 的方法论(提示词、Deep Research 思路、多模态用法)100% 适用于豆包、文心一言、DeepSeek、Kimi。
- 你身边的同事、客户、合作伙伴,正在大量使用 Gemini,你不懂就会被信息差碾压。
误解 4:"Gemini 只能聊天,不能干活?"
早过时了。 Gemini 现在可以:
- 自己上网搜资料、写报告(Deep Research)。
- 自己看你的屏幕、教你操作(Gemini Live + 屏幕共享)。
- 自己写代码、自己提交 Pull Request(Jules)。
- 自己生成图片(Imagen 4)和视频(Veo 3.1)。
- 自己在 Sheets 里建表、在 Slides 里做 PPT、在 Gmail 里写邮件。
它已经从"聊天机器人"进化到"会动手的 AI 同事"。
误解 5:"这种东西要懂技术才能玩,我学不会。"
这是本书写给你的核心理由。 整本书里我不会让你写一行代码,最复杂的操作就是"复制 - 粘贴 - 点回车"。
三、Gemini 是什么(一棵树)
我用一张"产品树"来帮你建立心智模型:
Gemini (大脑:模型)
│
┌──────────────────┼──────────────────────┐
↓ ↓ ↓
(面向消费者) (面向开发者) (面向企业)
│ │ │
┌────┴───────┐ ┌───┴────────┐ ┌──┴───┐
│ │ │ │ │ │
Gemini App NotebookLM AI Studio Gemini API Workspace Vertex AI
│ │ │ │ │ │
│ (聊天/拍照) │ (资料库) (Web 试玩) (5 行代码) (Gmail/Docs) (云端)
│
├ 文本对话
├ Deep Research(深度调研)
├ Canvas(一键变网页/PPT)
├ Gems(自定义专家)
├ Imagen(画图)
├ Veo(生视频)
└ Gemini Live(实时语音 + 摄像头 + 屏幕)
普通人主要打交道的是左半边:
- Gemini App / 网页(gemini.google.com):日常聊天和大部分功能。
- NotebookLM(notebooklm.google.com):你的"私人专家",专门用于资料消化。
- Gemini in Workspace:Gmail / Docs / Sheets / Slides / Meet / Drive 里的 AI 集成。
进阶用户可以再玩右半边:
- AI Studio(aistudio.google.com):免费试玩各种模型 + 申请 API Key。
- Gemini API:让你的程序、网站、自动化流程接入 AI(本书第十四章会讲)。
四、Gemini 能帮你做的 20 件具体的事
为了避免空谈,我列 20 件普通人立刻能用上的事,每一条都对应本书后续的某一章:
| # | 你想做的事 | 用什么功能 | 详见 |
|---|---|---|---|
| 1 | 一句话查天气、新闻、菜谱 | Gemini App 联网回答 | 第二章 |
| 2 | 拍一张陌生植物/动物的照片认它 | Gemini 多模态识图 | 第六章 |
| 3 | 拿手机摄像头对着冰箱问"晚上吃什么" | Gemini Live 摄像头 | 第六章 |
| 4 | 拿一份 100 页的 PDF 问问题 | 文件上传 | 第六章 |
| 5 | 给 30 分钟的 YouTube 视频做笔记 | YouTube 链接总结 | 第七章 |
| 6 | 让 AI 上网调研 1 小时给你写报告 | Deep Research | 第七章 |
| 7 | 把刚才的报告一键变成网页 | Canvas | 第七章 |
| 8 | 给爸妈写封感谢信 | 文本生成 | 第八章 |
| 9 | 让 AI 当你的英语口语陪练 | Gemini Live 语音 | 第九章 |
| 10 | 把孩子的作业拍下来让 AI 讲解 | 多模态识图 + 解题 | 第九章 |
| 11 | 47 封邮件分类 + 自动起草回复 | Gemini in Gmail | 第十三章 |
| 12 | Google 表格里"一句话生成报表" | Gemini in Sheets | 第十三章 |
| 13 | 30 分钟会议自动转纪要 | Gemini in Meet | 第十三章 |
| 14 | 给小红书写 10 个爆款标题 | 文本生成 + 提示词 | 第十一章 |
| 15 | 一键生成产品宣传图 | Imagen 4 | 第十一章 |
| 16 | 生成 8 秒带音效的产品演示视频 | Veo 3.1 | 第十一章 |
| 17 | 把你工作 5 年的所有报告做成"个人专家" | NotebookLM | 第十二章 |
| 18 | 让 AI 把一份资料读成"双人对话播客" | NotebookLM Audio Overview | 第十二章 |
| 19 | 创建一个"专门写小红书文案"的 Gem | Gems | 第十四章 |
| 20 | 让 AI 帮你写一段 Python 自动化脚本 | Jules / AI Studio | 第十四章 |
五、Gemini vs ChatGPT vs 豆包 vs DeepSeek vs Kimi
很多读者问:"我已经在用 ___,还需要切到 Gemini 吗?" 下面这张表帮你决定。
| 维度 | Gemini | ChatGPT | 豆包 | DeepSeek | Kimi |
|---|---|---|---|---|---|
| 中国大陆直接可用 | ✗(需海外网络) | ✗ | ✓ | ✓ | ✓ |
| 中文水平 | 优秀 | 优秀 | 优秀 | 优秀 | 优秀 |
| 多模态(图/音/视频) | ★★★★★ 原生 | ★★★★ | ★★★★ | ★★ | ★★★ |
| 长上下文 | ★★★★★(1M token) | ★★★★ | ★★★ | ★★★ | ★★★★★(200 万字) |
| 联网搜索 | ★★★★★ | ★★★★ | ★★★★ | ★★★ | ★★★★ |
| 深度调研报告 | ★★★★★ Deep Research | ★★★★★ Deep Research | ★★★ | ★★★ | ★★★★ 探索版 |
| 知识库(个人资料) | ★★★★★ NotebookLM | ★★★ | ★★★ | ★★ | ★★★ |
| 办公套件集成 | ★★★★★ Workspace | ★★★★ | ★★★ | ★ | ★★★ |
| 图片生成 | ★★★★★ Imagen 4 | ★★★★★ | ★★★ | ✗ | ★★ |
| 视频生成 | ★★★★★ Veo 3.1 | ★★★★ Sora | ✗ | ✗ | ✗ |
| 编程能力 | ★★★★★ | ★★★★★ | ★★★ | ★★★★★ | ★★★ |
| 自定义助手 | ★★★★★ Gems | ★★★★★ GPTs | ★★★★ 智能体 | ★★ | ★★★★ 智能体广场 |
| 免费额度 | 大方(含 NotebookLM 全部) | 有限 | 中等 | 慷慨 | 慷慨 |
| 付费起价 | ¥152/月(Pro) | ¥152/月(Plus) | 免费 | 免费 | 免费 |
| 适合的"超能力"场景 | 多模态、长资料、办公自动化、深度调研 | 通用、写作、编程 | 中文短聊、抖音生态 | 编程、推理、省钱 | 长文档、阅读 |
一句话决策:
- 你主要做办公、文档、邮件、调研、学习、做爸妈用的助手 → Gemini 是首选。
- 你主要做纯写作、闲聊、写代码 → ChatGPT、DeepSeek 也很好。
- 你只想用完全免费、中国大陆直接用的中文 AI → 豆包、DeepSeek、Kimi。
- 建议:Gemini + 一个国内 AI(比如 DeepSeek)双修,就是 2026 年最佳组合。
六、Gemini 能解决你的哪些"真痛点"?
我整理了普通人最常见的 12 个痛点,对应到 Gemini 的解决方案:
| 痛点 | Gemini 怎么帮你 |
|---|---|
| 信息过载,每天读不完 | 长资料一键摘要 + Deep Research 写报告 |
| 不会写邮件、不会措辞 | Gmail 内"帮我写"、调整语气 |
| PPT 永远做不完 | Slides 内"用文字生成幻灯片" |
| 表格函数记不住 | Sheets 内"用自然语言描述要的报表" |
| 看不懂英文资料 | 上传 → 翻译 + 摘要 + 关键术语解释 |
| 学英语找不到陪练 | Gemini Live 语音 + 角色扮演 |
| 教孩子作业不会 | 拍照 + "请用小学三年级能懂的话讲一遍" |
| 想吃饭不知道吃什么 | 摄像头拍冰箱 + 推荐 + 食谱 |
| 老人不会用智能手机 | 给爸妈做一个"语音问 Gemini"的快捷方式 |
| 出差找不到攻略 | 一句话生成 7 天行程 + 餐厅 + 交通 |
| 想做副业不知做啥 | 用 Gemini 做用户画像 + 选品 + 文案全套 |
| 资料越来越多管不过来 | NotebookLM 当个人知识库 |
七、5 分钟自检清单:你到底要不要学 Gemini?
回答下面 10 个问题,勾的越多,越值得学。
- 我每天会处理超过 30 封邮件、消息或文档。
- 我经常要看长报告、长论文、长合同、长视频。
- 我用 Gmail / Google Docs / Google Sheets / YouTube。
- 我经常需要"调研一个我不熟悉的领域"。
- 我有孩子,要辅导作业,或者要陪他学英语、读书。
- 我有爸妈,希望他们也能用上 AI(哪怕只是问天气、读药品说明书)。
- 我要做内容(写作、视频、设计),缺灵感和素材。
- 我要做小红书、公众号、抖音、视频号,需要批量生产文案。
- 我希望"用上更新的、能力更强的模型",不愿意被国内某一家平台锁死。
- 我相信 AI 会持续改变工作方式,希望提早学习以保持竞争力。
结果:
- 勾 8 个以上:立刻翻 第二章,今天就把 Gemini 用起来。
- 勾 5-7 个:把这本书当休闲读物,遇到对应章节的痛点再深读。
- 勾 0-4 个:你可能更需要的是"任何一款 AI 入门",可以先看本系列的 DeepSeek 橙皮书 或 豆包橙皮书 这类国内方案。
八、关于"中国大陆访问"的一段诚实话
我必须把话说在最前面:
- 在中国大陆直接访问 gemini.google.com、aistudio.google.com、notebooklm.google.com 是不通的。
- Google 账号也需要海外手机号验证(或者干净的海外网络环境)。
- 本书不提供任何"绕过限制"的技术指南,我建议你按当地法规处理。
但你可以:
- 如果你有海外身份(出差、留学、华侨、商务签):直接去 Google 官网注册账号,用 Gemini 完全合规。
- 如果你公司有海外业务:让公司给你开一个 Google Workspace 子账号,最简单。
- 如果你身边有亲友在海外:让他们帮你完成注册(手机验证),之后你可以管理自己的密码。
- 如果你只是想体验"AI Agent"和"长上下文":完全可以用 DeepSeek、Kimi、豆包,本书的方法论 90% 通用。
后续章节我会默认你已经有了一个能正常使用 Gemini 的环境,不再赘述这一段。
九、本章一图回顾
graph TD
A[Gemini 是什么] --> B[一个 AI 模型家族<br/>3.1 Pro / 3 Flash / Flash-Lite]
A --> C[一系列产品]
C --> C1[Gemini App<br/>日常聊天]
C --> C2[NotebookLM<br/>个人知识库]
C --> C3[Workspace 集成<br/>Gmail/Docs/Sheets]
C --> C4[AI Studio + API<br/>开发者]
A --> D[一组超能力]
D --> D1[多模态<br/>图/音/视频]
D --> D2[Deep Research<br/>自动调研]
D --> D3[Imagen + Veo<br/>画图+视频]
D --> D4[Gems + Live<br/>专家+实时]
十、本章作业
跟着做,5 分钟内完成:
- 打开 https://gemini.google.com(如果打不开,先看完第二章)。
- 把上面的 [5 分钟自检清单] 抄到一张纸上,认真打勾。
- 把这本书的 README 链接收藏到浏览器,方便随时查目录。
十一、下一章预告
下一章 02 第二章 五分钟拥有你的第一个 Gemini,你将完成:
- 注册一个 Google 账号(如果还没有)。
- 在手机和电脑上分别打开 Gemini。
- 完成你的第一次对话——一个让你"哇"的真实场景。
- 看清主界面的 5 个关键按钮。
5 分钟后,你就拥有了人类历史上最强大的 AI 工具之一。
走,翻开第二章。