给它装上大脑 · OpenClaw 橙皮书

一、先用一张图理解"大模型"和 OpenClaw 的关系

你         OpenClaw         大模型 API           外部世界
─         ─────────         ─────────────         ────────
你说一句话 → 接收任务  →   调大模型推理   →    决定下一步做什么
                              ↓
                          继续推理
                              ↓
                  ←   返回操作指令  ←
                              ↓
            执行（开浏览器、写文件、发邮件……）
                              ↓
                          再问大模型     →   下一步……

关键认知：

OpenClaw 自己不思考，它是"手"。
大模型负责思考，是"脑"。
一次任务可能调几次到几十次大模型 API。
你的费用 = 大模型 API 费用（OpenClaw 本身免费）。

理解了这一点，你就能理解"为什么要选合适的模型"——不同的脑子，价格、速度、聪明程度差别很大。

二、6 大模型横向对比表

模型	厂商	国内能直连吗	价格（每百万 tokens）	速度	聪明程度	适用场景
DeepSeek-Chat (V3)	深度求索	能	输入 ¥1 / 输出 ¥4	快	中等偏上	日常任务、首选
DeepSeek-Reasoner (R1)	深度求索	能	输入 ¥4 / 输出 ¥16	慢	高（推理）	复杂决策、写代码
Kimi K2	月之暗面	能	输入 ¥4 / 输出 ¥12	中	高	中文、长文档
GPT-5.2	OpenAI	不能（要中转）	输入 $2.5 / 输出 $10	快	高	综合首选
Claude Sonnet 4.6	Anthropic	不能（要中转）	输入 $3 / 输出 $15	中	极高	长文写作、Agent
Gemini 2.5 Pro	Google	不能（要中转）	输入 $1.25 / 输出 $5	快	高	多模态、长上下文
Llama 3.3 70B	Meta（本地）	-	完全免费	看你显卡	中	完全离线场景
Qwen 3 32B	阿里（本地）	-	完全免费	看你显卡	中	中文场景离线

价格按 2026 年 4 月行情，会变动，以官方为准。

怎么选？三句话告诉你

国内 90% 的普通用户：主用 DeepSeek-Chat，复杂任务切到 DeepSeek-Reasoner。够用、便宜、稳定。
海外用户 / 追求最佳效果：主用 Claude Sonnet 4.6（写作 / Agent 最强），偶尔用 Gemini 2.5 Pro 处理超长文档。
隐私敏感 / 完全离线：本地装 Ollama + Qwen 3 32B（中文）或 Llama 3.3 70B（英文）。需要 32GB 内存以上。

三、配置 DeepSeek（国内首选）

国内用户读这一节就够了。

步骤 1：注册并领 API Key

浏览器访问 https://platform.deepseek.com
用手机号注册，新用户送 5 元额度。
进入"API Keys"页面 → 点"创建新 API Key"
命名为 openclaw，复制保存（只显示一次）。

步骤 2：在 OpenClaw 里加上

openclaw models add

按提示选：

? Choose provider: deepseek
? Enter API Key: sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
? Choose model(s): deepseek-chat, deepseek-reasoner
? Set as default? Yes (deepseek-chat)

步骤 3：测试

openclaw models test deepseek/deepseek-chat
openclaw models test deepseek/deepseek-reasoner

都看到 ✓ Model is reachable, latency: xxx ms 就 OK。

进阶：手工编辑配置文件

如果你想精细控制，编辑 ~/.openclaw/openclaw.json：

{
  "models": {
    "providers": {
      "deepseek": {
        "type": "openai-compatible",
        "baseUrl": "https://api.deepseek.com/v1",
        "auth": { "type": "bearer", "token": "${DEEPSEEK_API_KEY}" },
        "models": [
          { "id": "deepseek-chat", "context": 65536 },
          { "id": "deepseek-reasoner", "context": 65536, "thinking": true }
        ]
      }
    }
  },
  "agents": {
    "defaults": {
      "model": "deepseek/deepseek-chat",
      "temperature": 0.3,
      "maxTokens": 4096
    }
  }
}

API Key 用 ${DEEPSEEK_API_KEY} 表示从环境变量读取，不要硬编码到配置文件里。然后在终端：

# macOS / Linux
echo 'export DEEPSEEK_API_KEY="sk-xxxxxx"' >> ~/.zshrc
source ~/.zshrc

# Windows PowerShell
[Environment]::SetEnvironmentVariable("DEEPSEEK_API_KEY", "sk-xxxxxx", "User")

四、配置 Kimi（中文与长文档）

Kimi 的强项是中文理解和超长上下文（200 万 tokens），处理长篇 PDF / 长视频字幕特别好用。

步骤 1：领 Key

去 https://platform.moonshot.cn，新用户送 15 元。

步骤 2：配置

openclaw models add
# 选 kimi / moonshot
# 推荐模型：moonshot-v1-32k 或 kimi-k2-200k

或手工编辑配置：

{
  "models": {
    "providers": {
      "moonshot": {
        "type": "openai-compatible",
        "baseUrl": "https://api.moonshot.cn/v1",
        "auth": { "type": "bearer", "token": "${MOONSHOT_API_KEY}" },
        "models": [
          { "id": "moonshot-v1-32k", "context": 32768 },
          { "id": "kimi-k2-200k", "context": 200000 }
        ]
      }
    }
  }
}

五、配置 OpenAI（GPT 系列）

国内用户直连困难，建议走"中转站"或自建代理。中转站价格通常和官方差不多甚至略低。

中转站方案（最简单）

随便搜"OpenAI 中转 API"找一家口碑好的（推荐看运营时间 6 个月以上、有清晰退款条款的）。拿到中转地址和 Key 后：

openclaw models add

? Choose provider: openai
? Base URL: https://你的中转地址/v1
? API Key: sk-xxxxxx
? Models: gpt-5.2, gpt-4.1-mini

直连方案

如果你能稳定访问 OpenAI 官网：

{
  "openai": {
    "type": "openai",
    "baseUrl": "https://api.openai.com/v1",
    "auth": { "type": "bearer", "token": "${OPENAI_API_KEY}" },
    "models": [
      { "id": "gpt-5.2", "context": 200000 },
      { "id": "gpt-4.1-mini", "context": 128000 }
    ]
  }
}

六、配置 Claude（写作与 Agent 最强）

Claude 是 OpenClaw 官方"亲儿子"模型——OpenClaw 的提示词风格、工具调用规范天然贴合 Claude，复杂 Agent 任务效果最好。

用官方 API

去 https://console.anthropic.com 注册（需要海外手机号或信用卡）。

openclaw models add
# 选 anthropic
# 推荐：claude-sonnet-4.6（性价比之王）、claude-opus-4.7（最强但贵）

用中转站

国内绝大多数用户走中转，搜"Claude API 中转"找口碑好的。配置时 provider 还是选 anthropic，但 baseUrl 填中转站给的地址。

七、配置 Gemini（多模态与长上下文）

Gemini 的两大优势：最便宜的旗舰模型、200 万 tokens 上下文（适合一次性吞整本书）。

步骤

去 https://aistudio.google.com，登录后点"Get API Key"，免费申请。
配置：

openclaw models add
# 选 google / gemini
# 推荐：gemini-2.5-pro

或手工：

{
  "google": {
    "type": "google",
    "baseUrl": "https://generativelanguage.googleapis.com/v1beta",
    "auth": { "type": "bearer", "token": "${GOOGLE_API_KEY}" },
    "models": [
      { "id": "gemini-2.5-pro", "context": 2000000 },
      { "id": "gemini-2.5-flash", "context": 1000000 }
    ]
  }
}

八、本地大模型：Ollama 方案

如果你完全不想花钱、不想数据上云、家里有一台像样的电脑（建议 32GB 内存 + 独立显卡），本地跑大模型是最佳选择。

第 1 步：装 Ollama

去 https://ollama.com/download 下载安装包，一路下一步。

第 2 步：拉一个模型

# 中文场景，推荐 Qwen 3 32B（约 19GB）
ollama pull qwen3:32b

# 英文场景，推荐 Llama 3.3 70B（约 40GB，需要 64GB 内存）
ollama pull llama3.3:70b

# 内存不够？退而求其次
ollama pull qwen3:8b   # 5GB，效果一般，但能跑

第 3 步：测试

ollama run qwen3:32b
# 你会进入对话界面，输入"你好"试试

第 4 步：在 OpenClaw 里加上

openclaw models add
# 选 ollama
# Base URL 默认 http://localhost:11434
# 选你已拉的模型

何时该用本地模型

处理敏感数据（合同、医疗记录、私人日记）。
你没有信用卡，懒得开通海外服务。
你愿意接受比 GPT/Claude 慢 3-5 倍的速度。
你要做大量重复任务（批量处理 1 万张图、跑一个月监控），用 API 烧不起。

本地模型的局限

Agent 能力弱：复杂工具调用容易出错，建议本地模型只跑"翻译、总结、分类"这类简单活。
速度慢：32B 模型在 M2 Pro 上约每秒 5 tokens，是 DeepSeek API 的 1/10。
占资源：跑起来会让电脑发烫，建议外接电源使用。

九、终极策略：主大脑 + 廉价副脑

这是本章最值钱的一节，看完之后你的 OpenClaw 月开销可以降低 70%。

思路

不是所有任务都需要"最聪明"的脑子。我们把任务分成三档：

档位	例子	配什么模型
重决策（10%）	写一份产品方案、做架构选型、写代码	贵的（DeepSeek-Reasoner / Claude Sonnet）
中等任务（30%）	总结邮件、整理纪要、写周报	中等的（DeepSeek-Chat / GPT-4.1-mini）
大量体力活（60%）	分类、提取、翻译、查询	便宜的（DeepSeek-Chat / 本地 Qwen）

在 OpenClaw 里如何配

编辑 ~/.openclaw/openclaw.json：

{
  "agents": {
    "defaults": {
      "model": "deepseek/deepseek-chat",
      "fallback": "ollama/qwen3:8b"
    },
    "profiles": {
      "thinking": {
        "model": "deepseek/deepseek-reasoner",
        "thinking": true,
        "useFor": ["coding", "planning", "architecture"]
      },
      "cheap": {
        "model": "ollama/qwen3:8b",
        "useFor": ["classification", "extraction", "translation"]
      },
      "longContext": {
        "model": "google/gemini-2.5-pro",
        "useFor": ["summarize-book", "summarize-meeting"]
      }
    }
  }
}

之后你在对话里可以这样指定：

@thinking 帮我设计一个用户登录模块的架构

或：

/model cheap
请把这 200 条客户反馈分成 BUG / 优化 / 新需求 / 无效 四类

子代理省钱实战

更高级的玩法是用第九章子代理的能力，主代理用贵的脑子做规划，分发任务给便宜的脑子去执行。

例：每天早上的"个人早报"流程

主代理 (deepseek-reasoner)
  ├─ 子代理 1 (cheap) → 抓微信群关键消息
  ├─ 子代理 2 (cheap) → 抓邮件并三句话总结
  ├─ 子代理 3 (cheap) → 抓 36 氪 + Hacker News
  └─ 子代理 4 (cheap) → 查天气 + 日历 + 通勤
        ↓
主代理汇总成一份 300 字早报

整个流程一次成本约 0.05 元，每月 1.5 元。

十、模型常用管理命令

# 列出所有已配模型
openclaw models list

# 查看某模型详情
openclaw models info deepseek/deepseek-chat

# 测试可用性
openclaw models test deepseek/deepseek-chat

# 设为默认
openclaw models set-default deepseek/deepseek-chat

# 删除一个模型
openclaw models remove deepseek/deepseek-chat

# 查看本月消耗（如果厂商支持）
openclaw models usage --since "2026-04-01"

十一、踩坑提示

不要把 API Key 硬编码到配置文件，并把配置文件传到 GitHub——会被秒爬。一定用环境变量。
不要在公司电脑上配自费 API——出差报销时最好先和老板对一句话。
国内中转站要选老牌的，跑路的太多了，建议先充小额测试 1-2 周再大额充。
本地模型不要用低于 7B 参数的，再小就是"人工智障"。
同一个 Key 不要在多台机器复用，建议每台机器一个 Key，方便审计。

本章一图回顾

        ┌─────────────────────────────────────┐
        │         你的 OpenClaw                │
        └─────────────────────────────────────┘
                        │
        ┌───────────────┼─────────────────┐
        │               │                 │
   主大脑          副大脑（便宜）        本地大脑（免费）
   ─────           ───────────           ────────────
   重决策           大量体力活            敏感数据
                                        完全离线
   DeepSeek         DeepSeek            Ollama +
   Reasoner         Chat                Qwen3-32b
   或 Claude        或 GPT-mini         或 Llama3.3
   Sonnet

下章预告

模型配好了，下一章第四章学会和它对话我们解决"怎么让 AI 听懂你"的问题——也就是写提示词。看完之后你会知道为什么"上下文比提示词更重要"，并能写出至少 3 个能稳定复用的指令模板。