ORANGE BOOK · OPENCLAW

第三章 给它装上大脑(模型配置)


一、先用一张图理解"大模型"和 OpenClaw 的关系

你         OpenClaw         大模型 API           外部世界
─         ─────────         ─────────────         ────────
你说一句话 → 接收任务  →   调大模型推理   →    决定下一步做什么
                              ↓
                          继续推理
                              ↓
                  ←   返回操作指令  ←
                              ↓
            执行(开浏览器、写文件、发邮件……)
                              ↓
                          再问大模型     →   下一步……

关键认知

  • OpenClaw 自己不思考,它是"手"。
  • 大模型负责思考,是"脑"。
  • 一次任务可能调几次到几十次大模型 API。
  • 你的费用 = 大模型 API 费用(OpenClaw 本身免费)。

理解了这一点,你就能理解"为什么要选合适的模型"——不同的脑子,价格、速度、聪明程度差别很大。

二、6 大模型横向对比表

模型 厂商 国内能直连吗 价格(每百万 tokens) 速度 聪明程度 适用场景
DeepSeek-Chat (V3) 深度求索 输入 ¥1 / 输出 ¥4 中等偏上 日常任务、首选
DeepSeek-Reasoner (R1) 深度求索 输入 ¥4 / 输出 ¥16 高(推理) 复杂决策、写代码
Kimi K2 月之暗面 输入 ¥4 / 输出 ¥12 中文、长文档
GPT-5.2 OpenAI 不能(要中转) 输入 $2.5 / 输出 $10 综合首选
Claude Sonnet 4.6 Anthropic 不能(要中转) 输入 $3 / 输出 $15 极高 长文写作、Agent
Gemini 2.5 Pro Google 不能(要中转) 输入 $1.25 / 输出 $5 多模态、长上下文
Llama 3.3 70B Meta(本地) - 完全免费 看你显卡 完全离线场景
Qwen 3 32B 阿里(本地) - 完全免费 看你显卡 中文场景离线

价格按 2026 年 4 月行情,会变动,以官方为准。

怎么选?三句话告诉你

  1. 国内 90% 的普通用户:主用 DeepSeek-Chat,复杂任务切到 DeepSeek-Reasoner。够用、便宜、稳定
  2. 海外用户 / 追求最佳效果:主用 Claude Sonnet 4.6(写作 / Agent 最强),偶尔用 Gemini 2.5 Pro 处理超长文档。
  3. 隐私敏感 / 完全离线:本地装 Ollama + Qwen 3 32B(中文)或 Llama 3.3 70B(英文)。需要 32GB 内存以上。

三、配置 DeepSeek(国内首选)

国内用户读这一节就够了。

步骤 1:注册并领 API Key

  1. 浏览器访问 https://platform.deepseek.com
  2. 用手机号注册,新用户送 5 元额度。
  3. 进入"API Keys"页面 → 点"创建新 API Key"
  4. 命名为 openclaw,复制保存(只显示一次)。

步骤 2:在 OpenClaw 里加上

openclaw models add

按提示选:

? Choose provider: deepseek
? Enter API Key: sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
? Choose model(s): deepseek-chat, deepseek-reasoner
? Set as default? Yes (deepseek-chat)

步骤 3:测试

openclaw models test deepseek/deepseek-chat
openclaw models test deepseek/deepseek-reasoner

都看到 ✓ Model is reachable, latency: xxx ms 就 OK。

进阶:手工编辑配置文件

如果你想精细控制,编辑 ~/.openclaw/openclaw.json

{
  "models": {
    "providers": {
      "deepseek": {
        "type": "openai-compatible",
        "baseUrl": "https://api.deepseek.com/v1",
        "auth": { "type": "bearer", "token": "${DEEPSEEK_API_KEY}" },
        "models": [
          { "id": "deepseek-chat", "context": 65536 },
          { "id": "deepseek-reasoner", "context": 65536, "thinking": true }
        ]
      }
    }
  },
  "agents": {
    "defaults": {
      "model": "deepseek/deepseek-chat",
      "temperature": 0.3,
      "maxTokens": 4096
    }
  }
}

API Key 用 ${DEEPSEEK_API_KEY} 表示从环境变量读取,不要硬编码到配置文件里。然后在终端:

# macOS / Linux
echo 'export DEEPSEEK_API_KEY="sk-xxxxxx"' >> ~/.zshrc
source ~/.zshrc

# Windows PowerShell
[Environment]::SetEnvironmentVariable("DEEPSEEK_API_KEY", "sk-xxxxxx", "User")

四、配置 Kimi(中文与长文档)

Kimi 的强项是中文理解和超长上下文(200 万 tokens),处理长篇 PDF / 长视频字幕特别好用。

步骤 1:领 Key

https://platform.moonshot.cn,新用户送 15 元。

步骤 2:配置

openclaw models add
# 选 kimi / moonshot
# 推荐模型:moonshot-v1-32k 或 kimi-k2-200k

或手工编辑配置:

{
  "models": {
    "providers": {
      "moonshot": {
        "type": "openai-compatible",
        "baseUrl": "https://api.moonshot.cn/v1",
        "auth": { "type": "bearer", "token": "${MOONSHOT_API_KEY}" },
        "models": [
          { "id": "moonshot-v1-32k", "context": 32768 },
          { "id": "kimi-k2-200k", "context": 200000 }
        ]
      }
    }
  }
}

五、配置 OpenAI(GPT 系列)

国内用户直连困难,建议走"中转站"或自建代理。中转站价格通常和官方差不多甚至略低。

中转站方案(最简单)

随便搜"OpenAI 中转 API"找一家口碑好的(推荐看运营时间 6 个月以上、有清晰退款条款的)。拿到中转地址和 Key 后:

openclaw models add
? Choose provider: openai
? Base URL: https://你的中转地址/v1
? API Key: sk-xxxxxx
? Models: gpt-5.2, gpt-4.1-mini

直连方案

如果你能稳定访问 OpenAI 官网:

{
  "openai": {
    "type": "openai",
    "baseUrl": "https://api.openai.com/v1",
    "auth": { "type": "bearer", "token": "${OPENAI_API_KEY}" },
    "models": [
      { "id": "gpt-5.2", "context": 200000 },
      { "id": "gpt-4.1-mini", "context": 128000 }
    ]
  }
}

六、配置 Claude(写作与 Agent 最强)

Claude 是 OpenClaw 官方"亲儿子"模型——OpenClaw 的提示词风格、工具调用规范天然贴合 Claude,复杂 Agent 任务效果最好。

用官方 API

https://console.anthropic.com 注册(需要海外手机号或信用卡)。

openclaw models add
# 选 anthropic
# 推荐:claude-sonnet-4.6(性价比之王)、claude-opus-4.7(最强但贵)

用中转站

国内绝大多数用户走中转,搜"Claude API 中转"找口碑好的。配置时 provider 还是选 anthropic,但 baseUrl 填中转站给的地址。

七、配置 Gemini(多模态与长上下文)

Gemini 的两大优势:最便宜的旗舰模型200 万 tokens 上下文(适合一次性吞整本书)。

步骤

  1. https://aistudio.google.com,登录后点"Get API Key",免费申请。
  2. 配置:
openclaw models add
# 选 google / gemini
# 推荐:gemini-2.5-pro

或手工:

{
  "google": {
    "type": "google",
    "baseUrl": "https://generativelanguage.googleapis.com/v1beta",
    "auth": { "type": "bearer", "token": "${GOOGLE_API_KEY}" },
    "models": [
      { "id": "gemini-2.5-pro", "context": 2000000 },
      { "id": "gemini-2.5-flash", "context": 1000000 }
    ]
  }
}

八、本地大模型:Ollama 方案

如果你完全不想花钱、不想数据上云、家里有一台像样的电脑(建议 32GB 内存 + 独立显卡),本地跑大模型是最佳选择。

第 1 步:装 Ollama

https://ollama.com/download 下载安装包,一路下一步。

第 2 步:拉一个模型

# 中文场景,推荐 Qwen 3 32B(约 19GB)
ollama pull qwen3:32b

# 英文场景,推荐 Llama 3.3 70B(约 40GB,需要 64GB 内存)
ollama pull llama3.3:70b

# 内存不够?退而求其次
ollama pull qwen3:8b   # 5GB,效果一般,但能跑

第 3 步:测试

ollama run qwen3:32b
# 你会进入对话界面,输入"你好"试试

第 4 步:在 OpenClaw 里加上

openclaw models add
# 选 ollama
# Base URL 默认 http://localhost:11434
# 选你已拉的模型

何时该用本地模型

  • 处理敏感数据(合同、医疗记录、私人日记)。
  • 没有信用卡,懒得开通海外服务。
  • 你愿意接受比 GPT/Claude 慢 3-5 倍的速度。
  • 你要做大量重复任务(批量处理 1 万张图、跑一个月监控),用 API 烧不起。

本地模型的局限

  • Agent 能力弱:复杂工具调用容易出错,建议本地模型只跑"翻译、总结、分类"这类简单活。
  • 速度慢:32B 模型在 M2 Pro 上约每秒 5 tokens,是 DeepSeek API 的 1/10。
  • 占资源:跑起来会让电脑发烫,建议外接电源使用。

九、终极策略:主大脑 + 廉价副脑

这是本章最值钱的一节,看完之后你的 OpenClaw 月开销可以降低 70%。

思路

不是所有任务都需要"最聪明"的脑子。我们把任务分成三档:

档位 例子 配什么模型
重决策(10%) 写一份产品方案、做架构选型、写代码 贵的(DeepSeek-Reasoner / Claude Sonnet)
中等任务(30%) 总结邮件、整理纪要、写周报 中等的(DeepSeek-Chat / GPT-4.1-mini)
大量体力活(60%) 分类、提取、翻译、查询 便宜的(DeepSeek-Chat / 本地 Qwen)

在 OpenClaw 里如何配

编辑 ~/.openclaw/openclaw.json

{
  "agents": {
    "defaults": {
      "model": "deepseek/deepseek-chat",
      "fallback": "ollama/qwen3:8b"
    },
    "profiles": {
      "thinking": {
        "model": "deepseek/deepseek-reasoner",
        "thinking": true,
        "useFor": ["coding", "planning", "architecture"]
      },
      "cheap": {
        "model": "ollama/qwen3:8b",
        "useFor": ["classification", "extraction", "translation"]
      },
      "longContext": {
        "model": "google/gemini-2.5-pro",
        "useFor": ["summarize-book", "summarize-meeting"]
      }
    }
  }
}

之后你在对话里可以这样指定:

@thinking 帮我设计一个用户登录模块的架构

或:

/model cheap
请把这 200 条客户反馈分成 BUG / 优化 / 新需求 / 无效 四类

子代理省钱实战

更高级的玩法是用第九章 子代理的能力,主代理用贵的脑子做规划,分发任务给便宜的脑子去执行

例:每天早上的"个人早报"流程

主代理 (deepseek-reasoner)
  ├─ 子代理 1 (cheap) → 抓微信群关键消息
  ├─ 子代理 2 (cheap) → 抓邮件并三句话总结
  ├─ 子代理 3 (cheap) → 抓 36 氪 + Hacker News
  └─ 子代理 4 (cheap) → 查天气 + 日历 + 通勤
        ↓
主代理汇总成一份 300 字早报

整个流程一次成本约 0.05 元,每月 1.5 元。

十、模型常用管理命令

# 列出所有已配模型
openclaw models list

# 查看某模型详情
openclaw models info deepseek/deepseek-chat

# 测试可用性
openclaw models test deepseek/deepseek-chat

# 设为默认
openclaw models set-default deepseek/deepseek-chat

# 删除一个模型
openclaw models remove deepseek/deepseek-chat

# 查看本月消耗(如果厂商支持)
openclaw models usage --since "2026-04-01"

十一、踩坑提示

  1. 不要把 API Key 硬编码到配置文件,并把配置文件传到 GitHub——会被秒爬。一定用环境变量。
  2. 不要在公司电脑上配自费 API——出差报销时最好先和老板对一句话。
  3. 国内中转站要选老牌的,跑路的太多了,建议先充小额测试 1-2 周再大额充。
  4. 本地模型不要用低于 7B 参数的,再小就是"人工智障"。
  5. 同一个 Key 不要在多台机器复用,建议每台机器一个 Key,方便审计。

本章一图回顾

        ┌─────────────────────────────────────┐
        │         你的 OpenClaw                │
        └─────────────────────────────────────┘
                        │
        ┌───────────────┼─────────────────┐
        │               │                 │
   主大脑          副大脑(便宜)        本地大脑(免费)
   ─────           ───────────           ────────────
   重决策           大量体力活            敏感数据
                                        完全离线
   DeepSeek         DeepSeek            Ollama +
   Reasoner         Chat                Qwen3-32b
   或 Claude        或 GPT-mini         或 Llama3.3
   Sonnet

下章预告

模型配好了,下一章 第四章 学会和它对话 我们解决"怎么让 AI 听懂你"的问题——也就是写提示词。看完之后你会知道为什么"上下文比提示词更重要",并能写出至少 3 个能稳定复用的指令模板。