ORANGE BOOK · LOCAL AI

第十四章 把本地 AI 接入你日常用的软件

14.1 为什么"接入日常软件"是关键一步

第 4–13 章我们一直在 Cherry Studio / Ollama 自己的窗口里使用本地 AI。这有个问题:

你写文档时还要切到另一个窗口去问 AI——这就增加了"摩擦",让 AI 不再"顺手"

真正"用起来"的 AI,应该出现在你正在用的窗口里。 你写邮件时,AI 在邮件里。 你写笔记时,AI 在笔记里。 你写代码时,AI 在编辑器里。

这就是本章要做的事——把本地 AI"埋进"你的日常工具,让它无处不在但又不打扰

14.2 共同基础:Ollama 的 OpenAI 兼容 API

下面所有玩法的底层都是同一个秘诀:

Ollama 默认在 http://localhost:11434/v1 暴露一个 OpenAI 兼容 API

任何"能配 OpenAI API"的工具,把:

  • API URL 改为 http://localhost:11434/v1
  • API Key 改为任意字符串(如 ollama,本地不校验)
  • Model 改为 qwen3:8b 等本地模型名

就能立刻把它接到你本地。

LM Studio 类似:在 Developer 标签页 Start Server 后,地址 http://localhost:1234/v1

下面所有"接入"的工具,都用这一招。

14.3 接入 1:浏览器(Chrome / Edge / Firefox / Arc)

沉浸式翻译

第八章已经讲过——把翻译服务设为 OpenAI 兼容,URL 填 http://localhost:11434/v1/chat/completions

之后浏览任何网页,"双语对照翻译"使用本地模型。

Monica(功能极全的浏览器 AI 插件)

设置 → AI 模型 → 添加自定义模型 → OpenAI Compatible:

  • Base URL: http://localhost:11434/v1
  • API Key: ollama
  • Model: qwen3:8b

之后 Monica 的"翻译、总结、写邮件、问答"全部走本地。

Sider / OpenAI Translator / 智阅 GPT

同样的配置思路:找设置里"自定义模型"或"OpenAI Compatible",填三件事。

一键浏览器侧边栏聊天:Page Assist

Page Assist 是一个开源 Chrome 扩展,专门为本地 Ollama 设计

  1. Chrome 扩展商店搜 "Page Assist"
  2. 安装
  3. 它自动检测本地 Ollama 服务
  4. 点扩展图标,在右侧出现一个聊天侧边栏
  5. 选模型,开始对话

支持当前页面问答、网页翻译、网页总结——完全本地,开箱即用

14.4 接入 2:Obsidian(笔记神器)

Smart Connections 插件

Obsidian 最强的本地 AI 插件:

  1. Obsidian 设置 → 社区插件 → 搜 "Smart Connections" → 安装
  2. 设置 → AI Model → "Local: Ollama"
  3. 选模型 qwen3:8b

效果:

  • 每条笔记右侧自动显示"语义相关"的其他笔记
  • 可以"基于全部笔记"问答
  • 完全本地的 Notion AI

Obsidian Copilot

另一个流行插件:

  1. 装 "Copilot for Obsidian"
  2. 设置里选 "Custom" provider
  3. URL: http://localhost:11434/v1/chat/completions
  4. Model: qwen3:8b

效果:

  • 当前笔记里 Cmd + P → "Copilot: Ask Copilot"
  • 可以划线选中一段问"扩展这一段"、"改写这一段"、"总结这一段"
  • 全部基于当前笔记 + 本地模型

Text Generator 插件

第三个选择,更灵活:

  • 自带丰富模板(写小说、写日报、写学习卡片)
  • 可以自定义 prompt 模板
  • 同样支持 Ollama

14.5 接入 3:VS Code(开发者必备)

Continue(第九章详细讲过)

回顾配置:

{
  "models": [
    {
      "title": "Qwen 2.5 Coder 7B",
      "provider": "ollama",
      "model": "qwen2.5-coder:7b",
      "apiBase": "http://localhost:11434"
    }
  ]
}

Cline / Roo Code

侧边栏 Agent,第十三章用过。 适合"让 AI 自己读项目、修改多个文件"。

CodeGPT(轻量替代)

如果你只想要"基础聊天 + 代码解释",CodeGPT 比 Continue 更轻:

  1. 装 CodeGPT 插件
  2. 设置 → Provider → Ollama
  3. 选模型

14.6 接入 4:Apple 快捷指令(Mac / iOS)

Apple Shortcuts 能调用任何 HTTP API——意味着你能把本地 AI 接进任何 Apple 系操作

例 1:选中文字翻译

新建快捷指令:

  1. 输入:选中文字
  2. 添加动作 → "获取 URL 的内容"
  3. URL: http://localhost:11434/api/chat
  4. 方法: POST
  5. 请求体(JSON):
    {
      "model": "qwen3:8b",
      "messages": [
        {"role": "system", "content": "你是中英互译专家。"},
        {"role": "user", "content": "翻译:[选中的文字]"}
      ],
      "stream": false
    }
    
  6. 解析 JSON → 输出 message.content
  7. 显示通知 / 复制到剪贴板

绑定全局快捷键 Option + T——之后在任何 App 里选中文字,按一下就翻译。

例 2:iPhone 远程接 Mac 本地 AI

在 iOS 快捷指令里同样配置 HTTP 请求,URL 改为 Mac 的内网 IP(如 http://192.168.1.100:11434/api/chat)。 配合 Tailscale,外出时手机也能用家里 Mac 的本地 AI

例 3:Siri 直接调本地 AI

把上面的快捷指令命名为"问 AI",对 Siri 说"问 AI 今天该穿什么"——Siri 调用快捷指令,背后是本地 AI 答你。

14.7 接入 5:Raycast(Mac 效率工具)

Raycast 是 Mac 上的"超级启动器",社区扩展非常多。

Raycast AI 自定义模型(Pro 版)

Raycast Pro 用户可以:

  1. 设置 → AI → Custom Models
  2. 添加 OpenAI Compatible
  3. Base URL: http://localhost:11434/v1
  4. Model: qwen3:8b

之后所有 Raycast AI 功能(AI Chat、AI Commands、Quick AI)走本地。

免费替代:Local AI Chat 扩展

社区扩展:

  1. Raycast → Extensions → Store → 搜 "Local AI"
  2. 安装 "Ollama Chat" 或 "Local AI Chat"
  3. 配置本地 Ollama
  4. 主键 → "Chat with Ollama"

自定义 Quick AI Commands

Raycast 自带"Quick Commands"——你可以为不同任务建独立的快捷启动:

  • Cmd + Space → 输入 "翻译" → 选中文字翻译
  • Cmd + Space → 输入 "总结" → 总结当前剪贴板
  • Cmd + Space → 输入 "改写" → 改写选中文字

把每个 Command 都连到本地 Ollama,整个 Mac 充满了"无处不在的本地 AI"

14.8 接入 6:微信(个人助手)

重要:直接读取微信聊天有违反微信用户协议的风险。下面方案仅适合"本地辅助",不要做自动收发。

方案 A:微信侧边栏 + Cherry Studio

最稳的方式:开两个窗口,一边微信,一边 Cherry Studio。 看到要回的消息,复制到 Cherry Studio 用本地 AI 起草,再粘回去。

方案 B:屏幕扩展 + 全局快捷键

用 Raycast 或 Apple 快捷指令做一个"复制 + AI 处理 + 替换剪贴板"的快捷键。 看到消息:

  1. 复制
  2. 按全局快捷键 → AI 自动起草回复
  3. 粘贴回微信

方案 C:微信公众号管理(运营场景)

如果你是公众号运营:

  • 用 Itchat / WeChatAlpaca 这种半官方库连接你的服务号
  • 接入 Ollama,自动回复用户提问
  • 用本地知识库(第十一章)作为"产品 FAQ"

注意:商业账号一定看清微信开放平台的协议。

方案 D:完全替代——飞书 / 钉钉机器人

公司沟通工具用飞书 / 钉钉,可以官方支持机器人接入:

  1. 飞书开发后台 → 创建机器人
  2. 配置 webhook
  3. 你的服务器(甚至就是你 Mac)跑一个小服务,收到消息后调本地 Ollama,再回复

整套流程完全合规且本地化

14.9 接入 7:Office / Google Docs

Word 接入:用 OnlyOffice 或 LibreOffice

微软 Office 暂无好的本地 AI 插件。替代方案

  • OnlyOffice:开源 Office 套件,支持插件
  • LibreOffice:装 LocalAI 插件
  • WPS:内置 AI(云端的,不算本地)

Google Docs:用 Add-on + Apps Script

写一个 Apps Script,把选中文字 POST 到家里 Ollama:

function callLocalAI(prompt) {
  // 注意:需要本地 AI 暴露在公网(如通过 Tailscale Funnel 或 ngrok)
  const url = 'http://your-tailscale-ip:11434/api/chat';
  const response = UrlFetchApp.fetch(url, {
    method: 'POST',
    contentType: 'application/json',
    payload: JSON.stringify({
      model: 'qwen3:8b',
      messages: [{role: 'user', content: prompt}],
      stream: false
    })
  });
  return JSON.parse(response.getContentText()).message.content;
}

注意安全:暴露在公网必须加密 + 鉴权。

Markdown 编辑器(推荐)

如果你愿意从 Word / Docs 迁移到 markdown:

  • Typora:装 markmaid 或调用外部命令
  • Obsidian:第 14.4 节
  • VSCode + Markdown Preview:第 14.5 节

14.10 接入 8:邮件客户端

Apple Mail(Mac)

用 MailMate 或 Apple 快捷指令包装:

[选中邮件正文] → [快捷指令"AI 起草回复"] → [本地 Ollama] → [自动新建草稿邮件]

Outlook

新版 Outlook 支持插件——但本地 AI 插件少。 最实用方案:用 14.10 节的 Apple 快捷指令做剪贴板桥接。

国产邮箱(网易、QQ、腾讯)

它们都内置了"AI 助手"——但都是云端的。 真要本地化:用浏览器版邮箱 + Page Assist 插件。

14.11 接入 9:终端(Mac / Linux 高阶)

让你的终端命令也能"问 AI":

Aichat(CLI AI)

brew install aichat
echo "model: ollama:qwen3:8b" >> ~/.aichat/config.yaml

之后:

aichat "解释一下这条命令做什么:tar -czvf x.tar.gz dir/"
aichat -e "我想把当前目录所有 .png 转成 .webp"   # 让它直接执行

Shell GPT

pip install shell-gpt
sgpt --provider ollama --model qwen3:8b "解释 SIGTERM 是什么"

Fabric(最酷的 CLI Agent)

brew install fabric
fabric -p summarize -m qwen3:8b < article.md

Fabric 有 200+ 个内置"模式"(summarize、translate、extract_wisdom 等),和管道符完美结合——这是 Unix 老炮儿的最爱。

14.12 接入 10:日常脚本(家庭自动化)

例子:每天早上读日历给你听

#!/bin/bash
# ~/bin/morning_brief.sh
EVENTS=$(icalBuddy eventsToday)
SUMMARY=$(curl -s http://localhost:11434/api/generate -d "{
  \"model\": \"qwen3:8b\",
  \"prompt\": \"用一段 50 字以内的话总结今天日程,语气轻松:$EVENTS\",
  \"stream\": false
}" | jq -r .response)
say -v Tingting "$SUMMARY"

设个 cron 每天 8:00 跑:

0 8 * * * /Users/me/bin/morning_brief.sh

早上 8 点,本地 AI 用中文女声给你读今天日程

14.13 部署模式:让本地 AI"一处部署,全家共用"

如果你想让全家人 / 全办公室共享一台机器跑的本地 AI:

方案:Mac mini / 服务器作为"家庭 AI 中心"

  1. 一台 Mac mini 24/32 GB(约 7000–12000 元)
  2. 装 Ollama,让它监听 0.0.0.0:11434
  3. 路由器设固定内网 IP(如 192.168.1.100)
  4. 全家人在自己设备上用 Cherry Studio / Page Assist / 浏览器扩展,URL 都填 http://192.168.1.100:11434

效果:

  • 一次硬件投入,全家都用
  • 所有数据在家里
  • 通过 Tailscale 让家人外出时也能用
  • 通过 Open WebUI 给老人 / 孩子做友好界面

14.14 安全与隐私的几个关键点

1. 不要无脑暴露 0.0.0.0:11434

如果你的 Ollama 监听在 0.0.0.0,意味着同一局域网(甚至公网,如果路由器映射了)任何人都能用。 最佳实践

  • 局域网内:可以 0.0.0.0,但加防火墙规则
  • 公网访问:必须用 Tailscale / WireGuard / Cloudflare Tunnel + 鉴权

2. 关掉所有"使用统计"

Cherry Studio、AnythingLLM 默认都会发"匿名使用统计"。设置里关掉。

3. 浏览器插件谨慎装

某些浏览器插件号称"用本地模型",实际仍把内容发到自己服务器。 判断方法:插件设置里有没有"完全离线模式"开关。

4. 给家人一份"使用规则"

如果共享家庭 AI 中心:

  • 不能用 AI 处理涉密工作内容(除非你公司允许)
  • 不能用 AI 替小孩做作业(设监督)
  • 重要决策必须人工核对

14.15 本章小练习

练习 1:浏览器 + 沉浸式翻译接本地

按 14.3 节,让你浏览器右键翻译走本地 Ollama。 测试:打开一个英文网页,比较"云端翻译"和"本地翻译"的差异。

练习 2:Obsidian + Smart Connections

如果你用 Obsidian,装 Smart Connections 接到本地。 亲身体验:"我半年前写的某篇笔记里有讲过这个观点"——AI 几秒帮你找到。

练习 3:写一个 Apple 快捷指令

按 14.6 节例 1,做一个"选中文字翻译"快捷指令。 绑定全局快捷键,你的 Mac 从此每个 App 都能划词翻译——全程本地

14.16 一句话记住

本地 AI 不应该住在某个单独窗口里——它应该出现在你每天用的每一个软件里,像水电一样默默供给。

下一章 第十五章 · 常见问题与避坑,我们终于直面"为什么我的本地 AI 这么慢、为什么爆显存、为什么胡说八道"——所有新手必踩的坑,一一拆穿。