ORANGE BOOK · GEMINI

第一章 认识 Gemini(从零开始)


本章你将学到

  • Gemini 的身世:它从哪里来、谁在做、当前有几个版本
  • Gemini 不是什么:5 个常见的误解
  • Gemini 是什么:用一棵树来理解整个产品矩阵
  • 它能帮你做的 20 件具体的事
  • 它和 ChatGPT、豆包、DeepSeek、Kimi 的对比表
  • 5 分钟自检:你到底要不要学它

一、Gemini 的身世(30 秒看完)

  • 谁做的:Google(更准确说是 Google DeepMind 团队)。
  • 诞生:2023 年 12 月发布第一代 Gemini 1.0(Ultra/Pro/Nano)。
  • 关键节点
    • 2024 年初:Bard 改名 Gemini,Gemini App 上线。
    • 2024 年 5 月:Gemini 1.5 Pro 推出,首次实现"100 万 token 长上下文"。
    • 2024 年 12 月:Gemini 2.0 Flash 推出。
    • 2025 年 3-6 月:Gemini 2.5 系列发布(Pro/Flash/Flash-Lite)。
    • 2025 年 11 月:Gemini 3 Pro 发布,原生多模态推理上一个大台阶。
    • 2026 年 3 月:Gemini 3.1 Pro 发布,旗舰模型,推理能力比 3 Pro 提升一倍。
  • 当前家族(2026 年 4 月)
    • Gemini 3.1 Pro:旗舰,最强推理。
    • Gemini 3 Pro:复杂任务首选。
    • Gemini 3 Flash:日常对话/工作的最佳性价比。
    • Gemini 3.1 Flash-Lite:极速、便宜,适合大量、简单任务。
    • Gemini 2.5 系列:仍保留供向下兼容。

记不住?没关系。普通人只需要记住一句话:"我有四档可选,从慢但聪明,到快但便宜,按场景选就行。"


二、Gemini 不是什么(5 个常见误解)

误解 1:"Gemini 就是 Google 搜索的升级版?"

不是。 Google 搜索给你的是链接——你还要自己点进去读。Gemini 给你的是答案——它已经替你读完、综合好了。

Google 搜索 + Gemini 的关系,类似"图书馆 + 私人秘书"。

误解 2:"Gemini 就是 ChatGPT 的 Google 版?"

部分对,但不全对。 二者都属于"对话式 AI",但 Gemini 的差异在:

  • 原生多模态:Gemini 从设计第一天就是"会看视频会听声音"的,ChatGPT 是后来加上的。
  • 绑定 Google 全家桶:Gemini 直接进 Gmail、Docs、YouTube、Drive,不需要插件。
  • NotebookLM:这是一个 ChatGPT 没有完全等价物的产品。
  • 完全免费的 API 试用:AI Studio 给所有人提供免费的 Gemini API 额度。

误解 3:"Gemini 在中国大陆用不了,学了没用?"

学了非常有用,且越来越多人用得上。 三个事实:

  • 大陆地区的用户可以通过合规的海外网络访问,Gemini App、网页、AI Studio 都能用。
  • 即使你完全不打算用海外服务,Gemini 的方法论(提示词、Deep Research 思路、多模态用法)100% 适用于豆包、文心一言、DeepSeek、Kimi
  • 你身边的同事、客户、合作伙伴,正在大量使用 Gemini,你不懂就会被信息差碾压

误解 4:"Gemini 只能聊天,不能干活?"

早过时了。 Gemini 现在可以:

  • 自己上网搜资料、写报告(Deep Research)。
  • 自己看你的屏幕、教你操作(Gemini Live + 屏幕共享)。
  • 自己写代码、自己提交 Pull Request(Jules)。
  • 自己生成图片(Imagen 4)和视频(Veo 3.1)。
  • 自己在 Sheets 里建表、在 Slides 里做 PPT、在 Gmail 里写邮件。

它已经从"聊天机器人"进化到"会动手的 AI 同事"。

误解 5:"这种东西要懂技术才能玩,我学不会。"

这是本书写给你的核心理由。 整本书里我不会让你写一行代码,最复杂的操作就是"复制 - 粘贴 - 点回车"。


三、Gemini 是什么(一棵树)

我用一张"产品树"来帮你建立心智模型:

   Gemini (大脑:模型)
   │
   ┌──────────────────┼──────────────────────┐
   ↓  ↓  ↓
   (面向消费者)  (面向开发者)  (面向企业)
   │  │  │
   ┌────┴───────┐  ┌───┴────────┐  ┌──┴───┐
   │  │  │  │  │  │
 Gemini App  NotebookLM  AI Studio  Gemini API  Workspace  Vertex AI
   │  │  │  │  │  │
   │ (聊天/拍照) │ (资料库)  (Web 试玩)  (5 行代码) (Gmail/Docs)  (云端)
   │
   ├ 文本对话
   ├ Deep Research(深度调研)
   ├ Canvas(一键变网页/PPT)
   ├ Gems(自定义专家)
   ├ Imagen(画图)
   ├ Veo(生视频)
   └ Gemini Live(实时语音 + 摄像头 + 屏幕)

普通人主要打交道的是左半边

  • Gemini App / 网页(gemini.google.com):日常聊天和大部分功能。
  • NotebookLM(notebooklm.google.com):你的"私人专家",专门用于资料消化。
  • Gemini in Workspace:Gmail / Docs / Sheets / Slides / Meet / Drive 里的 AI 集成。

进阶用户可以再玩右半边

  • AI Studio(aistudio.google.com):免费试玩各种模型 + 申请 API Key。
  • Gemini API:让你的程序、网站、自动化流程接入 AI(本书第十四章会讲)。

四、Gemini 能帮你做的 20 件具体的事

为了避免空谈,我列 20 件普通人立刻能用上的事,每一条都对应本书后续的某一章:

# 你想做的事 用什么功能 详见
1 一句话查天气、新闻、菜谱 Gemini App 联网回答 第二章
2 拍一张陌生植物/动物的照片认它 Gemini 多模态识图 第六章
3 拿手机摄像头对着冰箱问"晚上吃什么" Gemini Live 摄像头 第六章
4 拿一份 100 页的 PDF 问问题 文件上传 第六章
5 给 30 分钟的 YouTube 视频做笔记 YouTube 链接总结 第七章
6 让 AI 上网调研 1 小时给你写报告 Deep Research 第七章
7 把刚才的报告一键变成网页 Canvas 第七章
8 给爸妈写封感谢信 文本生成 第八章
9 让 AI 当你的英语口语陪练 Gemini Live 语音 第九章
10 把孩子的作业拍下来让 AI 讲解 多模态识图 + 解题 第九章
11 47 封邮件分类 + 自动起草回复 Gemini in Gmail 第十三章
12 Google 表格里"一句话生成报表" Gemini in Sheets 第十三章
13 30 分钟会议自动转纪要 Gemini in Meet 第十三章
14 给小红书写 10 个爆款标题 文本生成 + 提示词 第十一章
15 一键生成产品宣传图 Imagen 4 第十一章
16 生成 8 秒带音效的产品演示视频 Veo 3.1 第十一章
17 把你工作 5 年的所有报告做成"个人专家" NotebookLM 第十二章
18 让 AI 把一份资料读成"双人对话播客" NotebookLM Audio Overview 第十二章
19 创建一个"专门写小红书文案"的 Gem Gems 第十四章
20 让 AI 帮你写一段 Python 自动化脚本 Jules / AI Studio 第十四章

五、Gemini vs ChatGPT vs 豆包 vs DeepSeek vs Kimi

很多读者问:"我已经在用 ___,还需要切到 Gemini 吗?" 下面这张表帮你决定。

维度 Gemini ChatGPT 豆包 DeepSeek Kimi
中国大陆直接可用 ✗(需海外网络)
中文水平 优秀 优秀 优秀 优秀 优秀
多模态(图/音/视频) ★★★★★ 原生 ★★★★ ★★★★ ★★ ★★★
长上下文 ★★★★★(1M token) ★★★★ ★★★ ★★★ ★★★★★(200 万字)
联网搜索 ★★★★★ ★★★★ ★★★★ ★★★ ★★★★
深度调研报告 ★★★★★ Deep Research ★★★★★ Deep Research ★★★ ★★★ ★★★★ 探索版
知识库(个人资料) ★★★★★ NotebookLM ★★★ ★★★ ★★ ★★★
办公套件集成 ★★★★★ Workspace ★★★★ ★★★ ★★★
图片生成 ★★★★★ Imagen 4 ★★★★★ ★★★ ★★
视频生成 ★★★★★ Veo 3.1 ★★★★ Sora
编程能力 ★★★★★ ★★★★★ ★★★ ★★★★★ ★★★
自定义助手 ★★★★★ Gems ★★★★★ GPTs ★★★★ 智能体 ★★ ★★★★ 智能体广场
免费额度 大方(含 NotebookLM 全部) 有限 中等 慷慨 慷慨
付费起价 ¥152/月(Pro) ¥152/月(Plus) 免费 免费 免费
适合的"超能力"场景 多模态、长资料、办公自动化、深度调研 通用、写作、编程 中文短聊、抖音生态 编程、推理、省钱 长文档、阅读

一句话决策:

  • 你主要做办公、文档、邮件、调研、学习、做爸妈用的助手Gemini 是首选
  • 你主要做纯写作、闲聊、写代码 → ChatGPT、DeepSeek 也很好。
  • 你只想用完全免费、中国大陆直接用的中文 AI → 豆包、DeepSeek、Kimi。
  • 建议:Gemini + 一个国内 AI(比如 DeepSeek)双修,就是 2026 年最佳组合。

六、Gemini 能解决你的哪些"真痛点"?

我整理了普通人最常见的 12 个痛点,对应到 Gemini 的解决方案:

痛点 Gemini 怎么帮你
信息过载,每天读不完 长资料一键摘要 + Deep Research 写报告
不会写邮件、不会措辞 Gmail 内"帮我写"、调整语气
PPT 永远做不完 Slides 内"用文字生成幻灯片"
表格函数记不住 Sheets 内"用自然语言描述要的报表"
看不懂英文资料 上传 → 翻译 + 摘要 + 关键术语解释
学英语找不到陪练 Gemini Live 语音 + 角色扮演
教孩子作业不会 拍照 + "请用小学三年级能懂的话讲一遍"
想吃饭不知道吃什么 摄像头拍冰箱 + 推荐 + 食谱
老人不会用智能手机 给爸妈做一个"语音问 Gemini"的快捷方式
出差找不到攻略 一句话生成 7 天行程 + 餐厅 + 交通
想做副业不知做啥 用 Gemini 做用户画像 + 选品 + 文案全套
资料越来越多管不过来 NotebookLM 当个人知识库

七、5 分钟自检清单:你到底要不要学 Gemini?

回答下面 10 个问题,勾的越多,越值得学

  • 我每天会处理超过 30 封邮件、消息或文档。
  • 我经常要看长报告、长论文、长合同、长视频。
  • 我用 Gmail / Google Docs / Google Sheets / YouTube。
  • 我经常需要"调研一个我不熟悉的领域"。
  • 我有孩子,要辅导作业,或者要陪他学英语、读书。
  • 我有爸妈,希望他们也能用上 AI(哪怕只是问天气、读药品说明书)。
  • 我要做内容(写作、视频、设计),缺灵感和素材。
  • 我要做小红书、公众号、抖音、视频号,需要批量生产文案。
  • 我希望"用上更新的、能力更强的模型",不愿意被国内某一家平台锁死。
  • 我相信 AI 会持续改变工作方式,希望提早学习以保持竞争力。

结果:

  • 勾 8 个以上:立刻翻 第二章,今天就把 Gemini 用起来。
  • 勾 5-7 个:把这本书当休闲读物,遇到对应章节的痛点再深读。
  • 勾 0-4 个:你可能更需要的是"任何一款 AI 入门",可以先看本系列的 DeepSeek 橙皮书豆包橙皮书 这类国内方案。

八、关于"中国大陆访问"的一段诚实话

我必须把话说在最前面:

  • 在中国大陆直接访问 gemini.google.com、aistudio.google.com、notebooklm.google.com 是不通的。
  • Google 账号也需要海外手机号验证(或者干净的海外网络环境)。
  • 本书不提供任何"绕过限制"的技术指南,我建议你按当地法规处理。

但你可以:

  1. 如果你有海外身份(出差、留学、华侨、商务签):直接去 Google 官网注册账号,用 Gemini 完全合规。
  2. 如果你公司有海外业务:让公司给你开一个 Google Workspace 子账号,最简单。
  3. 如果你身边有亲友在海外:让他们帮你完成注册(手机验证),之后你可以管理自己的密码。
  4. 如果你只是想体验"AI Agent"和"长上下文":完全可以用 DeepSeekKimi豆包,本书的方法论 90% 通用。

后续章节我会默认你已经有了一个能正常使用 Gemini 的环境,不再赘述这一段。


九、本章一图回顾

graph TD
   A[Gemini 是什么] --> B[一个 AI 模型家族<br/>3.1 Pro / 3 Flash / Flash-Lite]
   A --> C[一系列产品]
   C --> C1[Gemini App<br/>日常聊天]
   C --> C2[NotebookLM<br/>个人知识库]
   C --> C3[Workspace 集成<br/>Gmail/Docs/Sheets]
   C --> C4[AI Studio + API<br/>开发者]
   A --> D[一组超能力]
   D --> D1[多模态<br/>图/音/视频]
   D --> D2[Deep Research<br/>自动调研]
   D --> D3[Imagen + Veo<br/>画图+视频]
   D --> D4[Gems + Live<br/>专家+实时]

十、本章作业

跟着做,5 分钟内完成:

  1. 打开 https://gemini.google.com(如果打不开,先看完第二章)。
  2. 把上面的 [5 分钟自检清单] 抄到一张纸上,认真打勾。
  3. 把这本书的 README 链接收藏到浏览器,方便随时查目录。

十一、下一章预告

下一章 02 第二章 五分钟拥有你的第一个 Gemini,你将完成:

  • 注册一个 Google 账号(如果还没有)。
  • 在手机和电脑上分别打开 Gemini。
  • 完成你的第一次对话——一个让你"哇"的真实场景。
  • 看清主界面的 5 个关键按钮。

5 分钟后,你就拥有了人类历史上最强大的 AI 工具之一。

走,翻开第二章