把本地AI接入你日常用的软件 · 本地 AI 橙皮书

14.1 为什么"接入日常软件"是关键一步

第 4–13 章我们一直在 Cherry Studio / Ollama 自己的窗口里使用本地 AI。这有个问题：

你写文档时还要切到另一个窗口去问 AI——这就增加了"摩擦"，让 AI 不再"顺手"。

真正"用起来"的 AI，应该出现在你正在用的窗口里。你写邮件时，AI 在邮件里。你写笔记时，AI 在笔记里。你写代码时，AI 在编辑器里。

这就是本章要做的事——把本地 AI"埋进"你的日常工具，让它无处不在但又不打扰。

14.2 共同基础：Ollama 的 OpenAI 兼容 API

下面所有玩法的底层都是同一个秘诀：

Ollama 默认在 http://localhost:11434/v1 暴露一个 OpenAI 兼容 API。

任何"能配 OpenAI API"的工具，把：

API URL 改为 http://localhost:11434/v1
API Key 改为任意字符串（如 ollama，本地不校验）
Model 改为 qwen3:8b 等本地模型名

就能立刻把它接到你本地。

LM Studio 类似：在 Developer 标签页 Start Server 后，地址 http://localhost:1234/v1。

下面所有"接入"的工具，都用这一招。

14.3 接入 1：浏览器（Chrome / Edge / Firefox / Arc）

沉浸式翻译

第八章已经讲过——把翻译服务设为 OpenAI 兼容，URL 填 http://localhost:11434/v1/chat/completions。

之后浏览任何网页，"双语对照翻译"使用本地模型。

Monica（功能极全的浏览器 AI 插件）

设置 → AI 模型 → 添加自定义模型 → OpenAI Compatible：

Base URL: http://localhost:11434/v1
API Key: ollama
Model: qwen3:8b

之后 Monica 的"翻译、总结、写邮件、问答"全部走本地。

Sider / OpenAI Translator / 智阅 GPT

同样的配置思路：找设置里"自定义模型"或"OpenAI Compatible"，填三件事。

一键浏览器侧边栏聊天：Page Assist

Page Assist 是一个开源 Chrome 扩展，专门为本地 Ollama 设计：

Chrome 扩展商店搜 "Page Assist"
安装
它自动检测本地 Ollama 服务
点扩展图标，在右侧出现一个聊天侧边栏
选模型，开始对话

支持当前页面问答、网页翻译、网页总结——完全本地，开箱即用。

14.4 接入 2：Obsidian（笔记神器）

Smart Connections 插件

Obsidian 最强的本地 AI 插件：

Obsidian 设置 → 社区插件 → 搜 "Smart Connections" → 安装
设置 → AI Model → "Local: Ollama"
选模型 qwen3:8b

效果：

每条笔记右侧自动显示"语义相关"的其他笔记
可以"基于全部笔记"问答
完全本地的 Notion AI

Obsidian Copilot

另一个流行插件：

装 "Copilot for Obsidian"
设置里选 "Custom" provider
URL: http://localhost:11434/v1/chat/completions
Model: qwen3:8b

效果：

当前笔记里 Cmd + P → "Copilot: Ask Copilot"
可以划线选中一段问"扩展这一段"、"改写这一段"、"总结这一段"
全部基于当前笔记 + 本地模型

Text Generator 插件

第三个选择，更灵活：

自带丰富模板（写小说、写日报、写学习卡片）
可以自定义 prompt 模板
同样支持 Ollama

14.5 接入 3：VS Code（开发者必备）

Continue（第九章详细讲过）

回顾配置：

{
  "models": [
    {
      "title": "Qwen 2.5 Coder 7B",
      "provider": "ollama",
      "model": "qwen2.5-coder:7b",
      "apiBase": "http://localhost:11434"
    }
  ]
}

Cline / Roo Code

侧边栏 Agent，第十三章用过。适合"让 AI 自己读项目、修改多个文件"。

CodeGPT（轻量替代）

如果你只想要"基础聊天 + 代码解释"，CodeGPT 比 Continue 更轻：

装 CodeGPT 插件
设置 → Provider → Ollama
选模型

14.6 接入 4：Apple 快捷指令（Mac / iOS）

Apple Shortcuts 能调用任何 HTTP API——意味着你能把本地 AI 接进任何 Apple 系操作。

例 1：选中文字翻译

新建快捷指令：

输入：选中文字
添加动作 → "获取 URL 的内容"
URL: http://localhost:11434/api/chat
方法: POST

请求体（JSON）:

{
  "model": "qwen3:8b",
  "messages": [
    {"role": "system", "content": "你是中英互译专家。"},
    {"role": "user", "content": "翻译：[选中的文字]"}
  ],
  "stream": false
}

解析 JSON → 输出 message.content
显示通知 / 复制到剪贴板

绑定全局快捷键 Option + T——之后在任何 App 里选中文字，按一下就翻译。

例 2：iPhone 远程接 Mac 本地 AI

在 iOS 快捷指令里同样配置 HTTP 请求，URL 改为 Mac 的内网 IP（如 http://192.168.1.100:11434/api/chat）。配合 Tailscale，外出时手机也能用家里 Mac 的本地 AI。

例 3：Siri 直接调本地 AI

把上面的快捷指令命名为"问 AI"，对 Siri 说"问 AI 今天该穿什么"——Siri 调用快捷指令，背后是本地 AI 答你。

14.7 接入 5：Raycast（Mac 效率工具）

Raycast 是 Mac 上的"超级启动器"，社区扩展非常多。

Raycast AI 自定义模型（Pro 版）

Raycast Pro 用户可以：

设置 → AI → Custom Models
添加 OpenAI Compatible
Base URL: http://localhost:11434/v1
Model: qwen3:8b

之后所有 Raycast AI 功能（AI Chat、AI Commands、Quick AI）走本地。

免费替代：Local AI Chat 扩展

社区扩展：

Raycast → Extensions → Store → 搜 "Local AI"
安装 "Ollama Chat" 或 "Local AI Chat"
配置本地 Ollama
主键 → "Chat with Ollama"

自定义 Quick AI Commands

Raycast 自带"Quick Commands"——你可以为不同任务建独立的快捷启动：

Cmd + Space → 输入 "翻译" → 选中文字翻译
Cmd + Space → 输入 "总结" → 总结当前剪贴板
Cmd + Space → 输入 "改写" → 改写选中文字

把每个 Command 都连到本地 Ollama，整个 Mac 充满了"无处不在的本地 AI"。

14.8 接入 6：微信（个人助手）

重要：直接读取微信聊天有违反微信用户协议的风险。下面方案仅适合"本地辅助"，不要做自动收发。

方案 A：微信侧边栏 + Cherry Studio

最稳的方式：开两个窗口，一边微信，一边 Cherry Studio。看到要回的消息，复制到 Cherry Studio 用本地 AI 起草，再粘回去。

方案 B：屏幕扩展 + 全局快捷键

用 Raycast 或 Apple 快捷指令做一个"复制 + AI 处理 + 替换剪贴板"的快捷键。看到消息：

复制
按全局快捷键 → AI 自动起草回复
粘贴回微信

方案 C：微信公众号管理（运营场景）

如果你是公众号运营：

用 Itchat / WeChatAlpaca 这种半官方库连接你的服务号
接入 Ollama，自动回复用户提问
用本地知识库（第十一章）作为"产品 FAQ"

注意：商业账号一定看清微信开放平台的协议。

方案 D：完全替代——飞书 / 钉钉机器人

公司沟通工具用飞书 / 钉钉，可以官方支持机器人接入：

飞书开发后台 → 创建机器人
配置 webhook
你的服务器（甚至就是你 Mac）跑一个小服务，收到消息后调本地 Ollama，再回复

整套流程完全合规且本地化。

14.9 接入 7：Office / Google Docs

Word 接入：用 OnlyOffice 或 LibreOffice

微软 Office 暂无好的本地 AI 插件。替代方案：

OnlyOffice：开源 Office 套件，支持插件
LibreOffice：装 LocalAI 插件
WPS：内置 AI（云端的，不算本地）

Google Docs：用 Add-on + Apps Script

写一个 Apps Script，把选中文字 POST 到家里 Ollama：

function callLocalAI(prompt) {
  // 注意：需要本地 AI 暴露在公网（如通过 Tailscale Funnel 或 ngrok）
  const url = 'http://your-tailscale-ip:11434/api/chat';
  const response = UrlFetchApp.fetch(url, {
    method: 'POST',
    contentType: 'application/json',
    payload: JSON.stringify({
      model: 'qwen3:8b',
      messages: [{role: 'user', content: prompt}],
      stream: false
    })
  });
  return JSON.parse(response.getContentText()).message.content;
}

注意安全：暴露在公网必须加密 + 鉴权。

Markdown 编辑器（推荐）

如果你愿意从 Word / Docs 迁移到 markdown：

Typora：装 markmaid 或调用外部命令
Obsidian：第 14.4 节
VSCode + Markdown Preview：第 14.5 节

14.10 接入 8：邮件客户端

Apple Mail（Mac）

用 MailMate 或 Apple 快捷指令包装：

[选中邮件正文] → [快捷指令"AI 起草回复"] → [本地 Ollama] → [自动新建草稿邮件]

Outlook

新版 Outlook 支持插件——但本地 AI 插件少。 最实用方案：用 14.10 节的 Apple 快捷指令做剪贴板桥接。

国产邮箱（网易、QQ、腾讯）

它们都内置了"AI 助手"——但都是云端的。 真要本地化：用浏览器版邮箱 + Page Assist 插件。

14.11 接入 9：终端（Mac / Linux 高阶）

让你的终端命令也能"问 AI"：

Aichat（CLI AI）

brew install aichat
echo "model: ollama:qwen3:8b" >> ~/.aichat/config.yaml

之后：

aichat "解释一下这条命令做什么：tar -czvf x.tar.gz dir/"
aichat -e "我想把当前目录所有 .png 转成 .webp"   # 让它直接执行

Shell GPT

pip install shell-gpt
sgpt --provider ollama --model qwen3:8b "解释 SIGTERM 是什么"

Fabric（最酷的 CLI Agent）

brew install fabric
fabric -p summarize -m qwen3:8b < article.md

Fabric 有 200+ 个内置"模式"（summarize、translate、extract_wisdom 等），和管道符完美结合——这是 Unix 老炮儿的最爱。

14.12 接入 10：日常脚本（家庭自动化）

例子：每天早上读日历给你听

#!/bin/bash
# ~/bin/morning_brief.sh
EVENTS=$(icalBuddy eventsToday)
SUMMARY=$(curl -s http://localhost:11434/api/generate -d "{
  \"model\": \"qwen3:8b\",
  \"prompt\": \"用一段 50 字以内的话总结今天日程，语气轻松：$EVENTS\",
  \"stream\": false
}" | jq -r .response)
say -v Tingting "$SUMMARY"

设个 cron 每天 8:00 跑：

0 8 * * * /Users/me/bin/morning_brief.sh

早上 8 点，本地 AI 用中文女声给你读今天日程。

14.13 部署模式：让本地 AI"一处部署，全家共用"

如果你想让全家人 / 全办公室共享一台机器跑的本地 AI：

方案：Mac mini / 服务器作为"家庭 AI 中心"

一台 Mac mini 24/32 GB（约 7000–12000 元）
装 Ollama，让它监听 0.0.0.0:11434
路由器设固定内网 IP（如 192.168.1.100）
全家人在自己设备上用 Cherry Studio / Page Assist / 浏览器扩展，URL 都填 http://192.168.1.100:11434

效果：

一次硬件投入，全家都用
所有数据在家里
通过 Tailscale 让家人外出时也能用
通过 Open WebUI 给老人 / 孩子做友好界面

14.14 安全与隐私的几个关键点

1. 不要无脑暴露 0.0.0.0:11434

如果你的 Ollama 监听在 0.0.0.0，意味着同一局域网（甚至公网，如果路由器映射了）任何人都能用。 最佳实践：

局域网内：可以 0.0.0.0，但加防火墙规则
公网访问：必须用 Tailscale / WireGuard / Cloudflare Tunnel + 鉴权

2. 关掉所有"使用统计"

Cherry Studio、AnythingLLM 默认都会发"匿名使用统计"。设置里关掉。

3. 浏览器插件谨慎装

某些浏览器插件号称"用本地模型"，实际仍把内容发到自己服务器。 判断方法：插件设置里有没有"完全离线模式"开关。

4. 给家人一份"使用规则"

如果共享家庭 AI 中心：

不能用 AI 处理涉密工作内容（除非你公司允许）
不能用 AI 替小孩做作业（设监督）
重要决策必须人工核对

14.15 本章小练习

练习 1：浏览器 + 沉浸式翻译接本地

按 14.3 节，让你浏览器右键翻译走本地 Ollama。测试：打开一个英文网页，比较"云端翻译"和"本地翻译"的差异。

练习 2：Obsidian + Smart Connections

如果你用 Obsidian，装 Smart Connections 接到本地。 亲身体验："我半年前写的某篇笔记里有讲过这个观点"——AI 几秒帮你找到。

练习 3：写一个 Apple 快捷指令

按 14.6 节例 1，做一个"选中文字翻译"快捷指令。绑定全局快捷键，你的 Mac 从此每个 App 都能划词翻译——全程本地。

14.16 一句话记住

本地 AI 不应该住在某个单独窗口里——它应该出现在你每天用的每一个软件里，像水电一样默默供给。

下一章第十五章 · 常见问题与避坑，我们终于直面"为什么我的本地 AI 这么慢、为什么爆显存、为什么胡说八道"——所有新手必踩的坑，一一拆穿。