一、先用一张图理解"大模型"和 OpenClaw 的关系
你 OpenClaw 大模型 API 外部世界
─ ───────── ───────────── ────────
你说一句话 → 接收任务 → 调大模型推理 → 决定下一步做什么
↓
继续推理
↓
← 返回操作指令 ←
↓
执行(开浏览器、写文件、发邮件……)
↓
再问大模型 → 下一步……
关键认知:
- OpenClaw 自己不思考,它是"手"。
- 大模型负责思考,是"脑"。
- 一次任务可能调几次到几十次大模型 API。
- 你的费用 = 大模型 API 费用(OpenClaw 本身免费)。
理解了这一点,你就能理解"为什么要选合适的模型"——不同的脑子,价格、速度、聪明程度差别很大。
二、6 大模型横向对比表
| 模型 | 厂商 | 国内能直连吗 | 价格(每百万 tokens) | 速度 | 聪明程度 | 适用场景 |
|---|---|---|---|---|---|---|
| DeepSeek-Chat (V3) | 深度求索 | 能 | 输入 ¥1 / 输出 ¥4 | 快 | 中等偏上 | 日常任务、首选 |
| DeepSeek-Reasoner (R1) | 深度求索 | 能 | 输入 ¥4 / 输出 ¥16 | 慢 | 高(推理) | 复杂决策、写代码 |
| Kimi K2 | 月之暗面 | 能 | 输入 ¥4 / 输出 ¥12 | 中 | 高 | 中文、长文档 |
| GPT-5.2 | OpenAI | 不能(要中转) | 输入 $2.5 / 输出 $10 | 快 | 高 | 综合首选 |
| Claude Sonnet 4.6 | Anthropic | 不能(要中转) | 输入 $3 / 输出 $15 | 中 | 极高 | 长文写作、Agent |
| Gemini 2.5 Pro | 不能(要中转) | 输入 $1.25 / 输出 $5 | 快 | 高 | 多模态、长上下文 | |
| Llama 3.3 70B | Meta(本地) | - | 完全免费 | 看你显卡 | 中 | 完全离线场景 |
| Qwen 3 32B | 阿里(本地) | - | 完全免费 | 看你显卡 | 中 | 中文场景离线 |
价格按 2026 年 4 月行情,会变动,以官方为准。
怎么选?三句话告诉你
- 国内 90% 的普通用户:主用 DeepSeek-Chat,复杂任务切到 DeepSeek-Reasoner。够用、便宜、稳定。
- 海外用户 / 追求最佳效果:主用 Claude Sonnet 4.6(写作 / Agent 最强),偶尔用 Gemini 2.5 Pro 处理超长文档。
- 隐私敏感 / 完全离线:本地装 Ollama + Qwen 3 32B(中文)或 Llama 3.3 70B(英文)。需要 32GB 内存以上。
三、配置 DeepSeek(国内首选)
国内用户读这一节就够了。
步骤 1:注册并领 API Key
- 浏览器访问 https://platform.deepseek.com
- 用手机号注册,新用户送 5 元额度。
- 进入"API Keys"页面 → 点"创建新 API Key"
- 命名为
openclaw,复制保存(只显示一次)。
步骤 2:在 OpenClaw 里加上
openclaw models add
按提示选:
? Choose provider: deepseek
? Enter API Key: sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
? Choose model(s): deepseek-chat, deepseek-reasoner
? Set as default? Yes (deepseek-chat)
步骤 3:测试
openclaw models test deepseek/deepseek-chat
openclaw models test deepseek/deepseek-reasoner
都看到 ✓ Model is reachable, latency: xxx ms 就 OK。
进阶:手工编辑配置文件
如果你想精细控制,编辑 ~/.openclaw/openclaw.json:
{
"models": {
"providers": {
"deepseek": {
"type": "openai-compatible",
"baseUrl": "https://api.deepseek.com/v1",
"auth": { "type": "bearer", "token": "${DEEPSEEK_API_KEY}" },
"models": [
{ "id": "deepseek-chat", "context": 65536 },
{ "id": "deepseek-reasoner", "context": 65536, "thinking": true }
]
}
}
},
"agents": {
"defaults": {
"model": "deepseek/deepseek-chat",
"temperature": 0.3,
"maxTokens": 4096
}
}
}
API Key 用 ${DEEPSEEK_API_KEY} 表示从环境变量读取,不要硬编码到配置文件里。然后在终端:
# macOS / Linux
echo 'export DEEPSEEK_API_KEY="sk-xxxxxx"' >> ~/.zshrc
source ~/.zshrc
# Windows PowerShell
[Environment]::SetEnvironmentVariable("DEEPSEEK_API_KEY", "sk-xxxxxx", "User")
四、配置 Kimi(中文与长文档)
Kimi 的强项是中文理解和超长上下文(200 万 tokens),处理长篇 PDF / 长视频字幕特别好用。
步骤 1:领 Key
去 https://platform.moonshot.cn,新用户送 15 元。
步骤 2:配置
openclaw models add
# 选 kimi / moonshot
# 推荐模型:moonshot-v1-32k 或 kimi-k2-200k
或手工编辑配置:
{
"models": {
"providers": {
"moonshot": {
"type": "openai-compatible",
"baseUrl": "https://api.moonshot.cn/v1",
"auth": { "type": "bearer", "token": "${MOONSHOT_API_KEY}" },
"models": [
{ "id": "moonshot-v1-32k", "context": 32768 },
{ "id": "kimi-k2-200k", "context": 200000 }
]
}
}
}
}
五、配置 OpenAI(GPT 系列)
国内用户直连困难,建议走"中转站"或自建代理。中转站价格通常和官方差不多甚至略低。
中转站方案(最简单)
随便搜"OpenAI 中转 API"找一家口碑好的(推荐看运营时间 6 个月以上、有清晰退款条款的)。拿到中转地址和 Key 后:
openclaw models add
? Choose provider: openai
? Base URL: https://你的中转地址/v1
? API Key: sk-xxxxxx
? Models: gpt-5.2, gpt-4.1-mini
直连方案
如果你能稳定访问 OpenAI 官网:
{
"openai": {
"type": "openai",
"baseUrl": "https://api.openai.com/v1",
"auth": { "type": "bearer", "token": "${OPENAI_API_KEY}" },
"models": [
{ "id": "gpt-5.2", "context": 200000 },
{ "id": "gpt-4.1-mini", "context": 128000 }
]
}
}
六、配置 Claude(写作与 Agent 最强)
Claude 是 OpenClaw 官方"亲儿子"模型——OpenClaw 的提示词风格、工具调用规范天然贴合 Claude,复杂 Agent 任务效果最好。
用官方 API
去 https://console.anthropic.com 注册(需要海外手机号或信用卡)。
openclaw models add
# 选 anthropic
# 推荐:claude-sonnet-4.6(性价比之王)、claude-opus-4.7(最强但贵)
用中转站
国内绝大多数用户走中转,搜"Claude API 中转"找口碑好的。配置时 provider 还是选 anthropic,但 baseUrl 填中转站给的地址。
七、配置 Gemini(多模态与长上下文)
Gemini 的两大优势:最便宜的旗舰模型、200 万 tokens 上下文(适合一次性吞整本书)。
步骤
- 去 https://aistudio.google.com,登录后点"Get API Key",免费申请。
- 配置:
openclaw models add
# 选 google / gemini
# 推荐:gemini-2.5-pro
或手工:
{
"google": {
"type": "google",
"baseUrl": "https://generativelanguage.googleapis.com/v1beta",
"auth": { "type": "bearer", "token": "${GOOGLE_API_KEY}" },
"models": [
{ "id": "gemini-2.5-pro", "context": 2000000 },
{ "id": "gemini-2.5-flash", "context": 1000000 }
]
}
}
八、本地大模型:Ollama 方案
如果你完全不想花钱、不想数据上云、家里有一台像样的电脑(建议 32GB 内存 + 独立显卡),本地跑大模型是最佳选择。
第 1 步:装 Ollama
去 https://ollama.com/download 下载安装包,一路下一步。
第 2 步:拉一个模型
# 中文场景,推荐 Qwen 3 32B(约 19GB)
ollama pull qwen3:32b
# 英文场景,推荐 Llama 3.3 70B(约 40GB,需要 64GB 内存)
ollama pull llama3.3:70b
# 内存不够?退而求其次
ollama pull qwen3:8b # 5GB,效果一般,但能跑
第 3 步:测试
ollama run qwen3:32b
# 你会进入对话界面,输入"你好"试试
第 4 步:在 OpenClaw 里加上
openclaw models add
# 选 ollama
# Base URL 默认 http://localhost:11434
# 选你已拉的模型
何时该用本地模型
- 处理敏感数据(合同、医疗记录、私人日记)。
- 你没有信用卡,懒得开通海外服务。
- 你愿意接受比 GPT/Claude 慢 3-5 倍的速度。
- 你要做大量重复任务(批量处理 1 万张图、跑一个月监控),用 API 烧不起。
本地模型的局限
- Agent 能力弱:复杂工具调用容易出错,建议本地模型只跑"翻译、总结、分类"这类简单活。
- 速度慢:32B 模型在 M2 Pro 上约每秒 5 tokens,是 DeepSeek API 的 1/10。
- 占资源:跑起来会让电脑发烫,建议外接电源使用。
九、终极策略:主大脑 + 廉价副脑
这是本章最值钱的一节,看完之后你的 OpenClaw 月开销可以降低 70%。
思路
不是所有任务都需要"最聪明"的脑子。我们把任务分成三档:
| 档位 | 例子 | 配什么模型 |
|---|---|---|
| 重决策(10%) | 写一份产品方案、做架构选型、写代码 | 贵的(DeepSeek-Reasoner / Claude Sonnet) |
| 中等任务(30%) | 总结邮件、整理纪要、写周报 | 中等的(DeepSeek-Chat / GPT-4.1-mini) |
| 大量体力活(60%) | 分类、提取、翻译、查询 | 便宜的(DeepSeek-Chat / 本地 Qwen) |
在 OpenClaw 里如何配
编辑 ~/.openclaw/openclaw.json:
{
"agents": {
"defaults": {
"model": "deepseek/deepseek-chat",
"fallback": "ollama/qwen3:8b"
},
"profiles": {
"thinking": {
"model": "deepseek/deepseek-reasoner",
"thinking": true,
"useFor": ["coding", "planning", "architecture"]
},
"cheap": {
"model": "ollama/qwen3:8b",
"useFor": ["classification", "extraction", "translation"]
},
"longContext": {
"model": "google/gemini-2.5-pro",
"useFor": ["summarize-book", "summarize-meeting"]
}
}
}
}
之后你在对话里可以这样指定:
@thinking 帮我设计一个用户登录模块的架构
或:
/model cheap
请把这 200 条客户反馈分成 BUG / 优化 / 新需求 / 无效 四类
子代理省钱实战
更高级的玩法是用第九章 子代理的能力,主代理用贵的脑子做规划,分发任务给便宜的脑子去执行。
例:每天早上的"个人早报"流程
主代理 (deepseek-reasoner)
├─ 子代理 1 (cheap) → 抓微信群关键消息
├─ 子代理 2 (cheap) → 抓邮件并三句话总结
├─ 子代理 3 (cheap) → 抓 36 氪 + Hacker News
└─ 子代理 4 (cheap) → 查天气 + 日历 + 通勤
↓
主代理汇总成一份 300 字早报
整个流程一次成本约 0.05 元,每月 1.5 元。
十、模型常用管理命令
# 列出所有已配模型
openclaw models list
# 查看某模型详情
openclaw models info deepseek/deepseek-chat
# 测试可用性
openclaw models test deepseek/deepseek-chat
# 设为默认
openclaw models set-default deepseek/deepseek-chat
# 删除一个模型
openclaw models remove deepseek/deepseek-chat
# 查看本月消耗(如果厂商支持)
openclaw models usage --since "2026-04-01"
十一、踩坑提示
- 不要把 API Key 硬编码到配置文件,并把配置文件传到 GitHub——会被秒爬。一定用环境变量。
- 不要在公司电脑上配自费 API——出差报销时最好先和老板对一句话。
- 国内中转站要选老牌的,跑路的太多了,建议先充小额测试 1-2 周再大额充。
- 本地模型不要用低于 7B 参数的,再小就是"人工智障"。
- 同一个 Key 不要在多台机器复用,建议每台机器一个 Key,方便审计。
本章一图回顾
┌─────────────────────────────────────┐
│ 你的 OpenClaw │
└─────────────────────────────────────┘
│
┌───────────────┼─────────────────┐
│ │ │
主大脑 副大脑(便宜) 本地大脑(免费)
───── ─────────── ────────────
重决策 大量体力活 敏感数据
完全离线
DeepSeek DeepSeek Ollama +
Reasoner Chat Qwen3-32b
或 Claude 或 GPT-mini 或 Llama3.3
Sonnet
下章预告
模型配好了,下一章 第四章 学会和它对话 我们解决"怎么让 AI 听懂你"的问题——也就是写提示词。看完之后你会知道为什么"上下文比提示词更重要",并能写出至少 3 个能稳定复用的指令模板。