本章你将学到
- Gems 是什么,10 分钟创建 1 个"私人专家"
- Deep Think 模式:什么时候必须用、怎么用
- AI Studio:免费试玩所有模型 + 申请 API Key
- 5 行 Python 代码玩转 Gemini API
- Jules:让 AI 替你写 / 改代码(即使你不懂)
- Agent 模式与未来一年路线图
一、Gems:把"一次性提示词"变成"专属 AI 助手"
什么是 Gem?
普通对话像"每次新员工上班"——你都要从头解释你是谁、做什么、风格如何。 Gem 是一个"已经背好你简历 + 风格 + 工作内容" 的"专属员工"。
每次你打开它,它已经知道你要做什么。
Gem 的 4 个组成
- 名字 + 头像(自定义图标)。
- 指令(Instruction):告诉它"你是谁、要做什么、用什么风格、不能做什么"。
- 知识(Knowledge):可上传 10 个文件 / 连接 Google Drive,作为它的私人知识库。
- 触发对话(Starter prompts):4 个建议的"打开后第一句话"。
创建你的第一个 Gem(10 分钟)
Step 1:进入 Gem Manager
- 打开 gemini.google.com。
- 左侧侧边栏点钻石图标"Gems"。
- 选 "+ New Gem"。
Step 2:写指令
给一个最简单的例子——"小红书爆款文案专家":
名字:小红书爆款专家
指令:
你是一位有 5 年经验、运营过 50 万粉账号的小红书爆款专家。
你专门帮我(一位 30 岁女性、定位"30+ 上海上班族的省钱攻略") 写笔记文案。
每次我给你一个"主题",你按下面 6 步输出:
1)3 个候选标题(12 字内、含数字 / 反差 / 痛点)
2)开头 3 行钩子(不要"大家好我是 ___")
3)正文 5 段(每段 30-50 字 + 1 个 emoji)
4)3 个具体方法 / 案例 / 数据
5)结尾"金句 + 引导评论的问题"
6)5 个核心 tag + 3 个长尾 tag
风格:
- 真诚不装、有数据
- 不要"姐妹们"、"集美们" 这种词
- 必须有"我自己的故事 / 数据"
不要:
- 鸡汤
- 营销号常用废话("在这个 ___ 的时代")
- 完美人设
完成后,问我"你最喜欢哪一版?我们继续优化"。
Step 3:上传知识
如果你已经有过去爆款笔记的 PDF / 链接,上传作为参考。
Step 4:保存
→ 现在你有了一个"专属小红书专家"。
给普通人推荐的 10 个 Gem
| Gem 名 | 干什么 |
|---|---|
| 小红书爆款专家 | 写文案 |
| 邮件外交官 | 起草各种工作邮件 |
| 周报机器人 | 把流水账变周报 |
| 私人健身教练 | 周计划 + 餐单 |
| 育儿心理学家 | 给孩子相关问题答疑 |
| 英语口语陪练 | 角色扮演 + 改稿 |
| 论文导师 | 论文选题 + 框架 |
| Excel 翻译官 | 自然语言 → 公式 |
| 决策助理 | 帮你做对比、利弊分析 |
| 睡前故事家 | 每晚一个原创故事 |
二、Deep Think:Ultra 用户的"思考最强模式"
Deep Think 是什么?
普通模式 = 系统 1(直觉、快) Deep Think = 系统 2(反复思考、慢)
它会:
- 同时探索多个解题路径
- 自我评估、互相反驳
- 反复迭代直到找到最优解
它的"硬实力"(2026 年)
- Humanity's Last Exam:48.4%(普通模型 < 30%)
- ARC-AGI-2:52.9%(普通模型 < 25%)
→ 简单说,人类最难的题目它能解。
怎么用
- 入口:Gemini App / 网页 → 选 Gemini 3.1 Pro 模型 → 输入框旁边切换 "Deep Think"。
- 要求:Google AI Ultra 套餐。
- 代价:单次回答时间 1-5 分钟(vs 普通 5-30 秒)。
什么时候必须用 Deep Think?
- 高考压轴题、奥数题
- 复杂代码 bug 调试
- 商业策略权衡(多个变量 + 长期影响)
- 数学证明
- 复杂逻辑题
什么时候不要用
- 日常聊天 / 写邮件 / 文案
- 联网搜索
- 多模态识图
→ Deep Think 是"慢模式",不是"全能模式"。
三、AI Studio:开发者的游乐场
AI Studio 是什么?
它是 Google 给开发者准备的"试玩 + 调试 + 申请 API Key" 的网页工具。
但它对普通人也很有用:
- 可以试玩所有模型,包括最新预览版
- 可以测试不同的 system instruction(系统提示)
- 可以完全免费 申请 API Key
- 可以一键导出代码到 Python / Node.js / cURL
申请免费 API Key(2 分钟)
- 打开 aistudio.google.com
- 登录 Google 账号
- 左上角点 "Get API key"
- 选 "Create API key in new project"(或选已有项目)
- 复制下来(格式:
AIzaSy...)
保管好这个 Key。它就像密码,泄露后别人能用你的额度。
免费额度(2026 年 4 月)
- Gemini 2.5 Pro / 2.5 Flash / 2.5 Flash-Lite 免费可用
- 具体 RPM(每分钟请求)/ TPM(每分钟 token)/ RPD(每天请求)请登录后在 AI Studio 查
- 重置时间:每天太平洋时间 0 点
Free 额度足够"个人小工具",但不能用于生产环境 / 处理敏感数据 / 服务欧洲终端用户。
四、5 行 Python 玩转 Gemini API
不会写代码?没关系,你只需要复制这 5 行。
准备
pip install google-genai
5 行代码
from google import genai
client = genai.Client(api_key="你的API_KEY")
resp = client.models.generate_content(model="gemini-2.5-flash", contents="你好,介绍一下你自己")
print(resp.text)
→ 运行 → 输出 Gemini 的回答。
进阶 1:用环境变量保存 API Key(更安全)
export GEMINI_API_KEY="AIzaSy..."
import os
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
resp = client.models.generate_content(model="gemini-2.5-flash", contents="...")
print(resp.text)
进阶 2:流式输出(边写边显示)
for chunk in client.models.generate_content_stream(model="gemini-2.5-flash",
contents="写一首关于上海的诗"):
print(chunk.text, end="")
进阶 3:结构化输出(拿 JSON)
from pydantic import BaseModel
class WeatherInfo(BaseModel):
city: str
temperature: int
weather: str
resp = client.models.generate_content(model="gemini-2.5-flash",
contents="今天上海天气如何?",
config={"response_mime_type": "application/json", "response_schema": WeatherInfo})
print(resp.parsed)
# WeatherInfo(city='上海', temperature=18, weather='多云')
进阶 4:多模态
from PIL import Image
img = Image.open("photo.jpg")
resp = client.models.generate_content(model="gemini-2.5-flash",
contents=["这张图里是什么?", img])
print(resp.text)
普通人能拿 API 做什么?
- 写一个"每天早上自动生成今日待办" 脚本。
- 写一个"批量翻译 1000 条产品标题" 工具。
- 给你的微信公众号做"自动客服"。
- 把 Gemini 接入 Telegram / Discord 做群机器人。
五、Jules:让 AI 替你写代码
Jules 是什么?
Jules 是 Google 推出的异步编程代理(async coding agent),简单说:
- 它会读你的整个代码仓库
- 根据你的一句话需求,自动写代码 + 提交 Pull Request
- 你只需要审查 → 合并
适合的人
- 程序员:让 Jules 干"机械重复的活"。
- 半懂技术的产品经理 / 设计师:可以让 Jules 帮你修小 bug、加小功能。
- 完全不懂代码的人:可以让 Jules 帮你做"小工具"(比如读 Excel、自动发邮件)。
怎么用(10 分钟)
Step 1:注册
- 打开 jules.google.com
- 用 Google 账号登录
- 点 "Connect to GitHub" → 授权
Step 2:选仓库
- 选你想让 Jules 工作的 GitHub 仓库(如果你没有,先用模板创建一个)
- 选分支
Step 3:写任务
帮我加一个功能:
- 读取 data/users.csv
- 找出过去 7 天注册的用户
- 给每个用户发一封欢迎邮件(用 Mailgun API)
- 把发送结果写回 data/log.csv
环境变量:
- MAILGUN_API_KEY
- MAILGUN_DOMAIN
请先给我一个执行计划。
Step 4:审查计划 → 批准 → 等待
- Jules 会先给一份"我打算这么做" 的计划。
- 你说"OK" 后,它开始写代码。
- 完成后会自动提交 PR 给你。
- 你审查 → 合并。
Jules 的边界
- 能做:CRUD 类功能、bug 修复、文档补全、测试用例、重构。
- 不能做:复杂架构设计、需要业务深判断的功能。
- 建议:把仓库里加一个
AGENTS.md文件,告诉 Jules 项目的"风格 / 注意事项",准确率会大幅提升。
六、Agent 模式:什么是"AI 自己干活"?
Agent ≠ Chatbot
- Chatbot:一问一答,等你输入。
- Agent:你说"目标",它自己拆任务、调工具、调 API、循环执行直到完成。
Gemini 的 Agent 能力
| 能力 | 具体表现 |
|---|---|
| Deep Research | 自动浏览网页、写报告 |
| Workspace 自动化 | "帮我创建" 时去读 Drive / Gmail |
| Jules | 自动写代码 + 提 PR |
| Code Execution | API 模式下 AI 可以"写完代码自己跑一遍验证" |
| Tool Use | 调用搜索 / 计算器 / 你给的自定义工具 |
你今天就能用的 Agent 玩法
玩法 A:让 AI 当"出差总管"
我下周一到周三去深圳出差。
请按下列步骤"端到端" 帮我搞定:
1)查机票(联网)
2)订酒店(联网)
3)规划每天行程
4)准备客户拜访资料(用 Drive 里"客户 A、B、C 的文档")
5)做一份完整的"出差大礼包" Canvas 网页,含所有信息
6)把 Canvas 链接给我,我打印 / 转发
玩法 B:"今晚的我把明早的我安排好"
请基于:
- 我今天的日历
- 我未读的所有邮件
- 我 Drive 里"待办" 文件夹
帮我:
1)整理出"明天必做的 3 件事"
2)每件事的"准备资料 / 联系人 / 时间窗口"
3)把上面整理成一份"明早 8 点打开就能开始" 的 brief
4)发到我邮箱,标题"明日 brief - 4 月 20 日"
七、6 个高阶组合套路
套路 1:Gem + Knowledge
把你的"过去所有作品" 上传到一个 Gem 的 Knowledge。 这个 Gem 就成了"你自己的 AI 化身",风格 100% 像你。
套路 2:Deep Research + Canvas + Gem
Deep Research 跑一份调研报告
→ Canvas 一键变网页
→ 把报告内容放进 "市场分析专家" Gem 的 Knowledge
→ 以后随时问"基于上次调研,___ 怎么看"
套路 3:NotebookLM + AI Studio API
把 NotebookLM 当"知识库",写一个 Python 脚本:
- 每天自动从 NotebookLM 取最新摘要
- 通过 API 自动生成日报
- 自动发邮件给你
套路 4:Jules + AGENTS.md
在你的 GitHub 仓库根目录加一个 AGENTS.md:
"这个项目是个人博客,使用 Next.js + Tailwind。
代码风格:
- 所有 component 单独一个文件
- 文件命名:kebab-case
- 中文注释
- 测试用 Vitest
任何 PR 必须包含:
- 单元测试
- 中文注释"
→ Jules 完全按你的风格写代码。
套路 5:Imagen + Veo + Canvas
Imagen 生主视觉 → Veo 让它动起来 → Canvas 把它嵌进网页 → 一份"动态视觉营销 H5"。
套路 6:Gem + Live + 摄像头
创建一个 Gem:"健身私教",加上你的体态评估资料。 打开 Gemini Live → 摄像头对着你做动作 → AI 实时纠正姿势。
八、3 个真实场景小案例
案例 A:自由职业者用 5 个 Gem 干"5 个员工的活"
她有 5 个 Gem:
- 客户对接专家
- 文案专家
- 图片设计专家(Imagen prompt 模板)
- 月报专家
- 客户案例专家
→ 1 人收入抵 5 个员工,月 8 万。
案例 B:考研学生用 Deep Think 解物理压轴题
他过去物理压轴题"每题 40 分钟",用 Deep Think 自检 + 引导,缩到 15 分钟。
→ 物理高考 138(满分 150)。
案例 C:完全不懂代码的产品经理用 Jules 做"内部小工具"
他自己写了一个用户调研问卷,但不会做"自动汇总" 工具。让 Jules:
帮我做一个 Python 脚本:
- 读取 Google Sheets 里的问卷数据
- 按"用户类型" 分组统计
- 生成一份 PDF 报告,含 5 张图
- 自动发我邮箱
→ 30 分钟搞定,节省了找开发的 1 周。
九、5 个常见的"翻车"
翻车 1:Gem 指令太长(5000 字)
→ AI 越来越偏离。Gem 指令控制在 1500 字内。
翻车 2:Deep Think 用在简单问题
→ 慢且没必要。只用于"真的复杂" 的题。
翻车 3:API Key 被传到 GitHub 公开仓
→ 别人会用你的额度。用环境变量,加 .gitignore。
翻车 4:Jules 写的代码没看就合并
→ AI 偶尔会写错。永远要 review。
翻车 5:Agent 跑偏
→ 任务太宽。给清晰的"输入 - 输出 - 边界"。
十、本章一图回顾
┌─────────────────────────┐
│ 高阶玩法 6 兄弟 │
└─────────────────────────┘
│
┌─────┬───────┬───────┼───────┬────────┬────────┐
↓ ↓ ↓ ↓ ↓ ↓ ↓
Gems Deep AI API Jules Agent
Think Studio (统称)
│ │ │ │ │ │
│ │ │ │ │ └─ 自动循环
│ │ │ │ └─ AI 写代码
│ │ │ └─ 5 行 Python 玩 Gemini
│ │ └─ 申请免费 Key + 试玩
│ └─ Ultra 用户解最难题
└─ "私人助手"
组合套路:
Gem + Knowledge / Deep Research + Canvas + Gem
NotebookLM + API / Jules + AGENTS.md
Imagen + Veo + Canvas / Gem + Live + 摄像头
十一、本章作业
- 创建你的第一个 Gem(推荐"邮件外交官" 或"周报机器人")。
- 申请一个 AI Studio API Key(即使你不会写代码,存着)。
- 如果你会一点编程,跑一遍"5 行 Python" 例子。
- 试一次 Jules(用一个示例仓库)。
十二、下一章预告
下一章 15 第十五章 避坑、安全、隐私与未来,带你做"全书收官":
- 新手 10 大坑
- 数据安全 / 隐私 / API Key 管理
- AI 时代普通人的"防被淘汰" 路线图
- 未来 12 个月 Gemini 路线图