14.1 为什么"接入日常软件"是关键一步
第 4–13 章我们一直在 Cherry Studio / Ollama 自己的窗口里使用本地 AI。这有个问题:
你写文档时还要切到另一个窗口去问 AI——这就增加了"摩擦",让 AI 不再"顺手"。
真正"用起来"的 AI,应该出现在你正在用的窗口里。 你写邮件时,AI 在邮件里。 你写笔记时,AI 在笔记里。 你写代码时,AI 在编辑器里。
这就是本章要做的事——把本地 AI"埋进"你的日常工具,让它无处不在但又不打扰。
14.2 共同基础:Ollama 的 OpenAI 兼容 API
下面所有玩法的底层都是同一个秘诀:
Ollama 默认在
http://localhost:11434/v1暴露一个 OpenAI 兼容 API。
任何"能配 OpenAI API"的工具,把:
- API URL 改为
http://localhost:11434/v1 - API Key 改为任意字符串(如
ollama,本地不校验) - Model 改为
qwen3:8b等本地模型名
就能立刻把它接到你本地。
LM Studio 类似:在 Developer 标签页 Start Server 后,地址 http://localhost:1234/v1。
下面所有"接入"的工具,都用这一招。
14.3 接入 1:浏览器(Chrome / Edge / Firefox / Arc)
沉浸式翻译
第八章已经讲过——把翻译服务设为 OpenAI 兼容,URL 填 http://localhost:11434/v1/chat/completions。
之后浏览任何网页,"双语对照翻译"使用本地模型。
Monica(功能极全的浏览器 AI 插件)
设置 → AI 模型 → 添加自定义模型 → OpenAI Compatible:
- Base URL:
http://localhost:11434/v1 - API Key:
ollama - Model:
qwen3:8b
之后 Monica 的"翻译、总结、写邮件、问答"全部走本地。
Sider / OpenAI Translator / 智阅 GPT
同样的配置思路:找设置里"自定义模型"或"OpenAI Compatible",填三件事。
一键浏览器侧边栏聊天:Page Assist
Page Assist 是一个开源 Chrome 扩展,专门为本地 Ollama 设计:
- Chrome 扩展商店搜 "Page Assist"
- 安装
- 它自动检测本地 Ollama 服务
- 点扩展图标,在右侧出现一个聊天侧边栏
- 选模型,开始对话
支持当前页面问答、网页翻译、网页总结——完全本地,开箱即用。
14.4 接入 2:Obsidian(笔记神器)
Smart Connections 插件
Obsidian 最强的本地 AI 插件:
- Obsidian 设置 → 社区插件 → 搜 "Smart Connections" → 安装
- 设置 → AI Model → "Local: Ollama"
- 选模型
qwen3:8b
效果:
- 每条笔记右侧自动显示"语义相关"的其他笔记
- 可以"基于全部笔记"问答
- 完全本地的 Notion AI
Obsidian Copilot
另一个流行插件:
- 装 "Copilot for Obsidian"
- 设置里选 "Custom" provider
- URL:
http://localhost:11434/v1/chat/completions - Model:
qwen3:8b
效果:
- 当前笔记里
Cmd + P→ "Copilot: Ask Copilot" - 可以划线选中一段问"扩展这一段"、"改写这一段"、"总结这一段"
- 全部基于当前笔记 + 本地模型
Text Generator 插件
第三个选择,更灵活:
- 自带丰富模板(写小说、写日报、写学习卡片)
- 可以自定义 prompt 模板
- 同样支持 Ollama
14.5 接入 3:VS Code(开发者必备)
Continue(第九章详细讲过)
回顾配置:
{
"models": [
{
"title": "Qwen 2.5 Coder 7B",
"provider": "ollama",
"model": "qwen2.5-coder:7b",
"apiBase": "http://localhost:11434"
}
]
}
Cline / Roo Code
侧边栏 Agent,第十三章用过。 适合"让 AI 自己读项目、修改多个文件"。
CodeGPT(轻量替代)
如果你只想要"基础聊天 + 代码解释",CodeGPT 比 Continue 更轻:
- 装 CodeGPT 插件
- 设置 → Provider → Ollama
- 选模型
14.6 接入 4:Apple 快捷指令(Mac / iOS)
Apple Shortcuts 能调用任何 HTTP API——意味着你能把本地 AI 接进任何 Apple 系操作。
例 1:选中文字翻译
新建快捷指令:
- 输入:选中文字
- 添加动作 → "获取 URL 的内容"
- URL:
http://localhost:11434/api/chat - 方法: POST
- 请求体(JSON):
{ "model": "qwen3:8b", "messages": [ {"role": "system", "content": "你是中英互译专家。"}, {"role": "user", "content": "翻译:[选中的文字]"} ], "stream": false } - 解析 JSON → 输出 message.content
- 显示通知 / 复制到剪贴板
绑定全局快捷键 Option + T——之后在任何 App 里选中文字,按一下就翻译。
例 2:iPhone 远程接 Mac 本地 AI
在 iOS 快捷指令里同样配置 HTTP 请求,URL 改为 Mac 的内网 IP(如 http://192.168.1.100:11434/api/chat)。
配合 Tailscale,外出时手机也能用家里 Mac 的本地 AI。
例 3:Siri 直接调本地 AI
把上面的快捷指令命名为"问 AI",对 Siri 说"问 AI 今天该穿什么"——Siri 调用快捷指令,背后是本地 AI 答你。
14.7 接入 5:Raycast(Mac 效率工具)
Raycast 是 Mac 上的"超级启动器",社区扩展非常多。
Raycast AI 自定义模型(Pro 版)
Raycast Pro 用户可以:
- 设置 → AI → Custom Models
- 添加 OpenAI Compatible
- Base URL:
http://localhost:11434/v1 - Model:
qwen3:8b
之后所有 Raycast AI 功能(AI Chat、AI Commands、Quick AI)走本地。
免费替代:Local AI Chat 扩展
社区扩展:
- Raycast → Extensions → Store → 搜 "Local AI"
- 安装 "Ollama Chat" 或 "Local AI Chat"
- 配置本地 Ollama
- 主键 → "Chat with Ollama"
自定义 Quick AI Commands
Raycast 自带"Quick Commands"——你可以为不同任务建独立的快捷启动:
Cmd + Space→ 输入 "翻译" → 选中文字翻译Cmd + Space→ 输入 "总结" → 总结当前剪贴板Cmd + Space→ 输入 "改写" → 改写选中文字
把每个 Command 都连到本地 Ollama,整个 Mac 充满了"无处不在的本地 AI"。
14.8 接入 6:微信(个人助手)
重要:直接读取微信聊天有违反微信用户协议的风险。下面方案仅适合"本地辅助",不要做自动收发。
方案 A:微信侧边栏 + Cherry Studio
最稳的方式:开两个窗口,一边微信,一边 Cherry Studio。 看到要回的消息,复制到 Cherry Studio 用本地 AI 起草,再粘回去。
方案 B:屏幕扩展 + 全局快捷键
用 Raycast 或 Apple 快捷指令做一个"复制 + AI 处理 + 替换剪贴板"的快捷键。 看到消息:
- 复制
- 按全局快捷键 → AI 自动起草回复
- 粘贴回微信
方案 C:微信公众号管理(运营场景)
如果你是公众号运营:
- 用 Itchat / WeChatAlpaca 这种半官方库连接你的服务号
- 接入 Ollama,自动回复用户提问
- 用本地知识库(第十一章)作为"产品 FAQ"
注意:商业账号一定看清微信开放平台的协议。
方案 D:完全替代——飞书 / 钉钉机器人
公司沟通工具用飞书 / 钉钉,可以官方支持机器人接入:
- 飞书开发后台 → 创建机器人
- 配置 webhook
- 你的服务器(甚至就是你 Mac)跑一个小服务,收到消息后调本地 Ollama,再回复
整套流程完全合规且本地化。
14.9 接入 7:Office / Google Docs
Word 接入:用 OnlyOffice 或 LibreOffice
微软 Office 暂无好的本地 AI 插件。替代方案:
- OnlyOffice:开源 Office 套件,支持插件
- LibreOffice:装 LocalAI 插件
- WPS:内置 AI(云端的,不算本地)
Google Docs:用 Add-on + Apps Script
写一个 Apps Script,把选中文字 POST 到家里 Ollama:
function callLocalAI(prompt) {
// 注意:需要本地 AI 暴露在公网(如通过 Tailscale Funnel 或 ngrok)
const url = 'http://your-tailscale-ip:11434/api/chat';
const response = UrlFetchApp.fetch(url, {
method: 'POST',
contentType: 'application/json',
payload: JSON.stringify({
model: 'qwen3:8b',
messages: [{role: 'user', content: prompt}],
stream: false
})
});
return JSON.parse(response.getContentText()).message.content;
}
注意安全:暴露在公网必须加密 + 鉴权。
Markdown 编辑器(推荐)
如果你愿意从 Word / Docs 迁移到 markdown:
- Typora:装 markmaid 或调用外部命令
- Obsidian:第 14.4 节
- VSCode + Markdown Preview:第 14.5 节
14.10 接入 8:邮件客户端
Apple Mail(Mac)
用 MailMate 或 Apple 快捷指令包装:
[选中邮件正文] → [快捷指令"AI 起草回复"] → [本地 Ollama] → [自动新建草稿邮件]
Outlook
新版 Outlook 支持插件——但本地 AI 插件少。 最实用方案:用 14.10 节的 Apple 快捷指令做剪贴板桥接。
国产邮箱(网易、QQ、腾讯)
它们都内置了"AI 助手"——但都是云端的。 真要本地化:用浏览器版邮箱 + Page Assist 插件。
14.11 接入 9:终端(Mac / Linux 高阶)
让你的终端命令也能"问 AI":
Aichat(CLI AI)
brew install aichat
echo "model: ollama:qwen3:8b" >> ~/.aichat/config.yaml
之后:
aichat "解释一下这条命令做什么:tar -czvf x.tar.gz dir/"
aichat -e "我想把当前目录所有 .png 转成 .webp" # 让它直接执行
Shell GPT
pip install shell-gpt
sgpt --provider ollama --model qwen3:8b "解释 SIGTERM 是什么"
Fabric(最酷的 CLI Agent)
brew install fabric
fabric -p summarize -m qwen3:8b < article.md
Fabric 有 200+ 个内置"模式"(summarize、translate、extract_wisdom 等),和管道符完美结合——这是 Unix 老炮儿的最爱。
14.12 接入 10:日常脚本(家庭自动化)
例子:每天早上读日历给你听
#!/bin/bash
# ~/bin/morning_brief.sh
EVENTS=$(icalBuddy eventsToday)
SUMMARY=$(curl -s http://localhost:11434/api/generate -d "{
\"model\": \"qwen3:8b\",
\"prompt\": \"用一段 50 字以内的话总结今天日程,语气轻松:$EVENTS\",
\"stream\": false
}" | jq -r .response)
say -v Tingting "$SUMMARY"
设个 cron 每天 8:00 跑:
0 8 * * * /Users/me/bin/morning_brief.sh
早上 8 点,本地 AI 用中文女声给你读今天日程。
14.13 部署模式:让本地 AI"一处部署,全家共用"
如果你想让全家人 / 全办公室共享一台机器跑的本地 AI:
方案:Mac mini / 服务器作为"家庭 AI 中心"
- 一台 Mac mini 24/32 GB(约 7000–12000 元)
- 装 Ollama,让它监听
0.0.0.0:11434 - 路由器设固定内网 IP(如 192.168.1.100)
- 全家人在自己设备上用 Cherry Studio / Page Assist / 浏览器扩展,URL 都填
http://192.168.1.100:11434
效果:
- 一次硬件投入,全家都用
- 所有数据在家里
- 通过 Tailscale 让家人外出时也能用
- 通过 Open WebUI 给老人 / 孩子做友好界面
14.14 安全与隐私的几个关键点
1. 不要无脑暴露 0.0.0.0:11434
如果你的 Ollama 监听在 0.0.0.0,意味着同一局域网(甚至公网,如果路由器映射了)任何人都能用。
最佳实践:
- 局域网内:可以 0.0.0.0,但加防火墙规则
- 公网访问:必须用 Tailscale / WireGuard / Cloudflare Tunnel + 鉴权
2. 关掉所有"使用统计"
Cherry Studio、AnythingLLM 默认都会发"匿名使用统计"。设置里关掉。
3. 浏览器插件谨慎装
某些浏览器插件号称"用本地模型",实际仍把内容发到自己服务器。 判断方法:插件设置里有没有"完全离线模式"开关。
4. 给家人一份"使用规则"
如果共享家庭 AI 中心:
- 不能用 AI 处理涉密工作内容(除非你公司允许)
- 不能用 AI 替小孩做作业(设监督)
- 重要决策必须人工核对
14.15 本章小练习
练习 1:浏览器 + 沉浸式翻译接本地
按 14.3 节,让你浏览器右键翻译走本地 Ollama。 测试:打开一个英文网页,比较"云端翻译"和"本地翻译"的差异。
练习 2:Obsidian + Smart Connections
如果你用 Obsidian,装 Smart Connections 接到本地。 亲身体验:"我半年前写的某篇笔记里有讲过这个观点"——AI 几秒帮你找到。
练习 3:写一个 Apple 快捷指令
按 14.6 节例 1,做一个"选中文字翻译"快捷指令。 绑定全局快捷键,你的 Mac 从此每个 App 都能划词翻译——全程本地。
14.16 一句话记住
本地 AI 不应该住在某个单独窗口里——它应该出现在你每天用的每一个软件里,像水电一样默默供给。
下一章 第十五章 · 常见问题与避坑,我们终于直面"为什么我的本地 AI 这么慢、为什么爆显存、为什么胡说八道"——所有新手必踩的坑,一一拆穿。