ORANGE BOOK · GEMINI

第十四章 高阶玩法(Gems、Deep Think、AI Studio、API、Jules、Agent 模式)


本章你将学到

  • Gems 是什么,10 分钟创建 1 个"私人专家"
  • Deep Think 模式:什么时候必须用、怎么用
  • AI Studio:免费试玩所有模型 + 申请 API Key
  • 5 行 Python 代码玩转 Gemini API
  • Jules:让 AI 替你写 / 改代码(即使你不懂)
  • Agent 模式与未来一年路线图

一、Gems:把"一次性提示词"变成"专属 AI 助手"

什么是 Gem?

普通对话像"每次新员工上班"——你都要从头解释你是谁、做什么、风格如何。 Gem 是一个"已经背好你简历 + 风格 + 工作内容" 的"专属员工"。

每次你打开它,它已经知道你要做什么

Gem 的 4 个组成

  1. 名字 + 头像(自定义图标)。
  2. 指令(Instruction):告诉它"你是谁、要做什么、用什么风格、不能做什么"。
  3. 知识(Knowledge):可上传 10 个文件 / 连接 Google Drive,作为它的私人知识库。
  4. 触发对话(Starter prompts):4 个建议的"打开后第一句话"。

创建你的第一个 Gem(10 分钟)

Step 1:进入 Gem Manager

  1. 打开 gemini.google.com
  2. 左侧侧边栏点钻石图标"Gems"。
  3. 选 "+ New Gem"。

Step 2:写指令

给一个最简单的例子——"小红书爆款文案专家":

名字:小红书爆款专家

指令:
你是一位有 5 年经验、运营过 50 万粉账号的小红书爆款专家。
你专门帮我(一位 30 岁女性、定位"30+ 上海上班族的省钱攻略") 写笔记文案。

每次我给你一个"主题",你按下面 6 步输出:
1)3 个候选标题(12 字内、含数字 / 反差 / 痛点)
2)开头 3 行钩子(不要"大家好我是 ___")
3)正文 5 段(每段 30-50 字 + 1 个 emoji)
4)3 个具体方法 / 案例 / 数据
5)结尾"金句 + 引导评论的问题"
6)5 个核心 tag + 3 个长尾 tag

风格:
- 真诚不装、有数据
- 不要"姐妹们"、"集美们" 这种词
- 必须有"我自己的故事 / 数据"

不要:
- 鸡汤
- 营销号常用废话("在这个 ___ 的时代")
- 完美人设

完成后,问我"你最喜欢哪一版?我们继续优化"。

Step 3:上传知识

如果你已经有过去爆款笔记的 PDF / 链接,上传作为参考。

Step 4:保存

→ 现在你有了一个"专属小红书专家"。

给普通人推荐的 10 个 Gem

Gem 名 干什么
小红书爆款专家 写文案
邮件外交官 起草各种工作邮件
周报机器人 把流水账变周报
私人健身教练 周计划 + 餐单
育儿心理学家 给孩子相关问题答疑
英语口语陪练 角色扮演 + 改稿
论文导师 论文选题 + 框架
Excel 翻译官 自然语言 → 公式
决策助理 帮你做对比、利弊分析
睡前故事家 每晚一个原创故事

二、Deep Think:Ultra 用户的"思考最强模式"

Deep Think 是什么?

普通模式 = 系统 1(直觉、快) Deep Think = 系统 2(反复思考、慢)

它会:

  • 同时探索多个解题路径
  • 自我评估、互相反驳
  • 反复迭代直到找到最优解

它的"硬实力"(2026 年)

  • Humanity's Last Exam:48.4%(普通模型 < 30%)
  • ARC-AGI-2:52.9%(普通模型 < 25%)

→ 简单说,人类最难的题目它能解

怎么用

  • 入口:Gemini App / 网页 → 选 Gemini 3.1 Pro 模型 → 输入框旁边切换 "Deep Think"。
  • 要求:Google AI Ultra 套餐。
  • 代价:单次回答时间 1-5 分钟(vs 普通 5-30 秒)。

什么时候必须用 Deep Think?

  • 高考压轴题、奥数题
  • 复杂代码 bug 调试
  • 商业策略权衡(多个变量 + 长期影响)
  • 数学证明
  • 复杂逻辑题

什么时候不要用

  • 日常聊天 / 写邮件 / 文案
  • 联网搜索
  • 多模态识图

Deep Think 是"慢模式",不是"全能模式"


三、AI Studio:开发者的游乐场

AI Studio 是什么?

https://aistudio.google.com

它是 Google 给开发者准备的"试玩 + 调试 + 申请 API Key" 的网页工具。

它对普通人也很有用

  • 可以试玩所有模型,包括最新预览版
  • 可以测试不同的 system instruction(系统提示)
  • 可以完全免费 申请 API Key
  • 可以一键导出代码到 Python / Node.js / cURL

申请免费 API Key(2 分钟)

  1. 打开 aistudio.google.com
  2. 登录 Google 账号
  3. 左上角点 "Get API key"
  4. 选 "Create API key in new project"(或选已有项目)
  5. 复制下来(格式:AIzaSy...

保管好这个 Key。它就像密码,泄露后别人能用你的额度。

免费额度(2026 年 4 月)

  • Gemini 2.5 Pro / 2.5 Flash / 2.5 Flash-Lite 免费可用
  • 具体 RPM(每分钟请求)/ TPM(每分钟 token)/ RPD(每天请求)请登录后在 AI Studio 查
  • 重置时间:每天太平洋时间 0 点

Free 额度足够"个人小工具",但不能用于生产环境 / 处理敏感数据 / 服务欧洲终端用户


四、5 行 Python 玩转 Gemini API

不会写代码?没关系,你只需要复制这 5 行

准备

pip install google-genai

5 行代码

from google import genai

client = genai.Client(api_key="你的API_KEY")
resp = client.models.generate_content(model="gemini-2.5-flash", contents="你好,介绍一下你自己")
print(resp.text)

→ 运行 → 输出 Gemini 的回答。

进阶 1:用环境变量保存 API Key(更安全)

export GEMINI_API_KEY="AIzaSy..."
import os
from google import genai

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
resp = client.models.generate_content(model="gemini-2.5-flash", contents="...")
print(resp.text)

进阶 2:流式输出(边写边显示)

for chunk in client.models.generate_content_stream(model="gemini-2.5-flash",
   contents="写一首关于上海的诗"):
   print(chunk.text, end="")

进阶 3:结构化输出(拿 JSON)

from pydantic import BaseModel

class WeatherInfo(BaseModel):
   city: str
   temperature: int
   weather: str

resp = client.models.generate_content(model="gemini-2.5-flash",
   contents="今天上海天气如何?",
   config={"response_mime_type": "application/json", "response_schema": WeatherInfo})
print(resp.parsed)
# WeatherInfo(city='上海', temperature=18, weather='多云')

进阶 4:多模态

from PIL import Image

img = Image.open("photo.jpg")
resp = client.models.generate_content(model="gemini-2.5-flash",
   contents=["这张图里是什么?", img])
print(resp.text)

普通人能拿 API 做什么?

  • 写一个"每天早上自动生成今日待办" 脚本。
  • 写一个"批量翻译 1000 条产品标题" 工具。
  • 给你的微信公众号做"自动客服"。
  • 把 Gemini 接入 Telegram / Discord 做群机器人。

五、Jules:让 AI 替你写代码

Jules 是什么?

https://jules.google.com

Jules 是 Google 推出的异步编程代理(async coding agent),简单说:

  • 它会读你的整个代码仓库
  • 根据你的一句话需求,自动写代码 + 提交 Pull Request
  • 你只需要审查 → 合并

适合的人

  • 程序员:让 Jules 干"机械重复的活"。
  • 半懂技术的产品经理 / 设计师:可以让 Jules 帮你修小 bug、加小功能。
  • 完全不懂代码的人:可以让 Jules 帮你做"小工具"(比如读 Excel、自动发邮件)。

怎么用(10 分钟)

Step 1:注册

  1. 打开 jules.google.com
  2. 用 Google 账号登录
  3. 点 "Connect to GitHub" → 授权

Step 2:选仓库

  • 选你想让 Jules 工作的 GitHub 仓库(如果你没有,先用模板创建一个)
  • 选分支

Step 3:写任务

帮我加一个功能:
- 读取 data/users.csv
- 找出过去 7 天注册的用户
- 给每个用户发一封欢迎邮件(用 Mailgun API)
- 把发送结果写回 data/log.csv

环境变量:
- MAILGUN_API_KEY
- MAILGUN_DOMAIN

请先给我一个执行计划。

Step 4:审查计划 → 批准 → 等待

  • Jules 会先给一份"我打算这么做" 的计划。
  • 你说"OK" 后,它开始写代码。
  • 完成后会自动提交 PR 给你。
  • 你审查 → 合并。

Jules 的边界

  • 能做:CRUD 类功能、bug 修复、文档补全、测试用例、重构。
  • 不能做:复杂架构设计、需要业务深判断的功能。
  • 建议:把仓库里加一个 AGENTS.md 文件,告诉 Jules 项目的"风格 / 注意事项",准确率会大幅提升。

六、Agent 模式:什么是"AI 自己干活"?

Agent ≠ Chatbot

  • Chatbot:一问一答,等你输入。
  • Agent:你说"目标",它自己拆任务、调工具、调 API、循环执行直到完成。

Gemini 的 Agent 能力

能力 具体表现
Deep Research 自动浏览网页、写报告
Workspace 自动化 "帮我创建" 时去读 Drive / Gmail
Jules 自动写代码 + 提 PR
Code Execution API 模式下 AI 可以"写完代码自己跑一遍验证"
Tool Use 调用搜索 / 计算器 / 你给的自定义工具

你今天就能用的 Agent 玩法

玩法 A:让 AI 当"出差总管"

我下周一到周三去深圳出差。

请按下列步骤"端到端" 帮我搞定:
1)查机票(联网)
2)订酒店(联网)
3)规划每天行程
4)准备客户拜访资料(用 Drive 里"客户 A、B、C 的文档")
5)做一份完整的"出差大礼包" Canvas 网页,含所有信息
6)把 Canvas 链接给我,我打印 / 转发

玩法 B:"今晚的我把明早的我安排好"

请基于:
- 我今天的日历
- 我未读的所有邮件
- 我 Drive 里"待办" 文件夹

帮我:
1)整理出"明天必做的 3 件事"
2)每件事的"准备资料 / 联系人 / 时间窗口"
3)把上面整理成一份"明早 8 点打开就能开始" 的 brief
4)发到我邮箱,标题"明日 brief - 4 月 20 日"

七、6 个高阶组合套路

套路 1:Gem + Knowledge

把你的"过去所有作品" 上传到一个 Gem 的 Knowledge。 这个 Gem 就成了"你自己的 AI 化身",风格 100% 像你

套路 2:Deep Research + Canvas + Gem

Deep Research 跑一份调研报告
→ Canvas 一键变网页
→ 把报告内容放进 "市场分析专家" Gem 的 Knowledge
→ 以后随时问"基于上次调研,___ 怎么看"

套路 3:NotebookLM + AI Studio API

把 NotebookLM 当"知识库",写一个 Python 脚本:

  • 每天自动从 NotebookLM 取最新摘要
  • 通过 API 自动生成日报
  • 自动发邮件给你

套路 4:Jules + AGENTS.md

在你的 GitHub 仓库根目录加一个 AGENTS.md:

"这个项目是个人博客,使用 Next.js + Tailwind。
代码风格:
- 所有 component 单独一个文件
- 文件命名:kebab-case
- 中文注释
- 测试用 Vitest

任何 PR 必须包含:
- 单元测试
- 中文注释"

→ Jules 完全按你的风格写代码。

套路 5:Imagen + Veo + Canvas

Imagen 生主视觉 → Veo 让它动起来 → Canvas 把它嵌进网页 → 一份"动态视觉营销 H5"。

套路 6:Gem + Live + 摄像头

创建一个 Gem:"健身私教",加上你的体态评估资料。 打开 Gemini Live → 摄像头对着你做动作 → AI 实时纠正姿势。


八、3 个真实场景小案例

案例 A:自由职业者用 5 个 Gem 干"5 个员工的活"

她有 5 个 Gem:

  1. 客户对接专家
  2. 文案专家
  3. 图片设计专家(Imagen prompt 模板)
  4. 月报专家
  5. 客户案例专家

1 人收入抵 5 个员工,月 8 万

案例 B:考研学生用 Deep Think 解物理压轴题

他过去物理压轴题"每题 40 分钟",用 Deep Think 自检 + 引导,缩到 15 分钟

→ 物理高考 138(满分 150)。

案例 C:完全不懂代码的产品经理用 Jules 做"内部小工具"

他自己写了一个用户调研问卷,但不会做"自动汇总" 工具。让 Jules:

帮我做一个 Python 脚本:
- 读取 Google Sheets 里的问卷数据
- 按"用户类型" 分组统计
- 生成一份 PDF 报告,含 5 张图
- 自动发我邮箱

→ 30 分钟搞定,节省了找开发的 1 周


九、5 个常见的"翻车"

翻车 1:Gem 指令太长(5000 字)

→ AI 越来越偏离。Gem 指令控制在 1500 字内

翻车 2:Deep Think 用在简单问题

→ 慢且没必要。只用于"真的复杂" 的题

翻车 3:API Key 被传到 GitHub 公开仓

→ 别人会用你的额度。用环境变量,加 .gitignore

翻车 4:Jules 写的代码没看就合并

→ AI 偶尔会写错。永远要 review

翻车 5:Agent 跑偏

→ 任务太宽。给清晰的"输入 - 输出 - 边界"


十、本章一图回顾

   ┌─────────────────────────┐
   │  高阶玩法 6 兄弟  │
   └─────────────────────────┘
   │
   ┌─────┬───────┬───────┼───────┬────────┬────────┐
   ↓  ↓  ↓  ↓  ↓  ↓  ↓
   Gems  Deep  AI  API  Jules  Agent
   Think  Studio  (统称)
   │  │  │  │  │  │
   │  │  │  │  │  └─ 自动循环
   │  │  │  │  └─ AI 写代码
   │  │  │  └─ 5 行 Python 玩 Gemini
   │  │  └─ 申请免费 Key + 试玩
   │  └─ Ultra 用户解最难题
   └─ "私人助手"

  组合套路:
  Gem + Knowledge / Deep Research + Canvas + Gem
  NotebookLM + API / Jules + AGENTS.md
  Imagen + Veo + Canvas / Gem + Live + 摄像头

十一、本章作业

  • 创建你的第一个 Gem(推荐"邮件外交官" 或"周报机器人")。
  • 申请一个 AI Studio API Key(即使你不会写代码,存着)。
  • 如果你会一点编程,跑一遍"5 行 Python" 例子。
  • 试一次 Jules(用一个示例仓库)。

十二、下一章预告

下一章 15 第十五章 避坑、安全、隐私与未来,带你做"全书收官":

  • 新手 10 大坑
  • 数据安全 / 隐私 / API Key 管理
  • AI 时代普通人的"防被淘汰" 路线图
  • 未来 12 个月 Gemini 路线图

去看最后一章 →