Ollama OpenClaw本地AI助手搭建完整指南:多平台消息渠道接入与模型配置实战
我在树莓派上跑了半年多的本地AI之后,今年把一套完整的工作流迁移到了VPS上:用Ollama做推理引擎,OpenClaw做消息网关,接入微信/Telegram/QQ,24小时运行不掉线。这套组合最吸引我的一点是:OpenClaw原生支持Ollama作为推理后端,ollama launch openclaw一条命令就能把两者串起来。本文把我从安装到生产环境可用的完整过程整理出来,重点覆盖**Ollama部署配置**、**OpenClaw安装初始化**、**多平台渠道接入**、**模型选择与云端备胎方案**4个核心环节,以及我踩过的3个真实坑。
为什么选Ollama + OpenClaw这个组合
如果你想搭建一个自己的AI助手,常见的选项有两条路:
路线A:直接用云端API(OpenAI / Claude / MiniMax等)。省事,但每次对话都要钱,数据经过第三方服务器。
路线B:完全本地部署(Ollama + 前端界面)。数据完全自主,但多平台接入要自己写代码。
Ollama + OpenClaw是第三条路——本地推理为主,云端API为辅。Ollama负责模型管理和推理,OpenClaw负责把AI接入各种消息渠道(微信、Telegram、Discord、QQ等)。你可以在家里用Mac跑本地模型,出门时自动切换到云端API继续服务。
根据Ollama官方文档(2026-05验证),ollama launch openclaw这个命令会自动处理OpenClaw的安装、安全配置、模型选择和网关启动,整个流程不需要手动敲多行配置。
第一步:安装Ollama(VPS环境)
在Linux VPS上安装Ollama有三种方式,按推荐顺序:
方式一:官方一键脚本(推荐)
curl -fsSL https://ollama.com/install.sh | sh
脚本会自动检测系统环境,安装到/usr/local/bin/ollama,创建ollama用户和 systemd 服务。安装完成后运行:
ollama serve # 启动Ollama服务
确认服务正常:
curl http://localhost:11434/api/generate -d '{"model":"gemma3","prompt":"hello","stream":false}'
返回JSON包含response字段即表示服务正常运行。
方式二:Docker方式(适合已有Docker环境的VPS)
docker run -d \
--name ollama \
-p 11434:11434 \
-v ollama_data:/root/.ollama \
ollama/ollama:latest
注意Docker方式默认不以systemd服务运行,重启后需要手动docker start ollama。生产环境建议用方式一。
方式三:手动下载二进制
从 ollama.com/download 下载对应架构的二进制文件,适合无法运行安装脚本的最小化Linux环境。下载后:
chmod +x Ollama-linux-amd64
sudo mv Ollama-linux-amd64 /usr/local/bin/ollama
版本验证:
ollama --version
写作本文时最新版本为0.5.x系列(具体小版本号建议查看 github.com/ollama/ollama/releases)。
第二步:拉取并管理模型
Ollama安装好后,默认不包含任何模型。需要手动拉取:
拉取基础模型
ollama pull gemma3 # 拉取Gemma 3b(适合轻量任务)
ollama pull qwen3.5 # 拉取Qwen 3.5b(支持视觉)
ollama pull deepseek-v4-flash # DeepSeek闪电版(性价比高)
查看已下载模型
ollama list
输出格式类似:
NAME SIZE MODIFIED
deepseek-v4-flash 4.7GB 5 hours ago
gemma3 4.9GB 2 days ago
qwen3.5 7.2GB 3 days ago
**磁盘空间注意点:** 模型文件保存在~/.ollama/models。如果VPS硬盘紧张,用ollama pull --no-cache 可以避免重复下载。
GPU配置(如VPS有NVIDIA GPU):
Ollama会自动检测NVIDIA GPU,不需要额外配置。如果有多个GPU,可以通过环境变量指定:
CUDA_VISIBLE_DEVICES=0 ollama serve
无GPU的VPS用CPU推理,响应速度会明显慢于GPU推理,实测qwen3.5b在2核CPU VPS上约3-5秒/token。
第三步:安装并启动OpenClaw
OpenClaw有两种安装方式:通过Ollama一键安装(最简单),或npm手动安装。
方式一:通过Ollama安装(推荐)
ollama launch openclaw
这条命令会依次:
1. 检测OpenClaw是否已安装,如未安装则通过npm安装
2. 启动安全配置向导(首次启动时)
3. 让你从已下载模型列表中选择一个作为默认模型
4. 自动启动Gateway daemon并打开TUI界面
方式二:npm手动安装
npm install -g openclaw
openclaw gateway start
openclaw configure # 交互式配置
验证OpenClaw运行状态:
openclaw gateway status
正常输出应包含Gateway running字样和当前配置的模型名称。
OpenClaw配置文件位置:
- Linux/macOS:`~/.openclaw/`
- 配置文件:`~/.openclaw/config.yml`
- 技能目录:`~/.openclaw/skills/`
第四步:接入消息渠道(微信/Telegram/QQ)
OpenClaw支持同时接入多个消息渠道。以Telegram和QQ为例:
接入Telegram:
1. 在 Telegram BotFather(@BotFather)创建一个机器人,获得 HTTP API Token
2. 运行配置命令:
openclaw configure --section channels
3. 选择Telegram,输入Token即完成
接入QQ(QQ频道):
openclaw configure --section channels
选择QQ频道模式,需要配置QQ机器人Token和AppID,具体流程参考 QQ开放平台文档。
多渠道同时在线:
OpenClaw的Gateway设计为多渠道消息的统一入口,不同渠道的消息会汇聚到同一个AI后端处理,无需为每个渠道单独配置AI。
渠道接入的坑:
- Telegram Bot的隐私模式默认为 restrictive,新成员无法查看历史消息。进入 @BotFather → /mybots → 你的机器人 → Group privacy → Turn off 才能让机器人看到群里的所有消息。
- QQ频道机器人需要在 QQ 开放平台创建应用并申请对应的消息权限,否则消息接收不到。
第五步:配置云端API备胎(外出时自动切换)
本地模型毕竟受限于VPS算力,外出时可能需要切换到云端API。OpenClaw的模型配置支持多模型路由。
配置文件(~/.openclaw/config.yml)示例:
model: qwen3.5:local
fallback:
- name: kimi-k2.5:cloud
type: cloud
- name: minimax-m2.7:cloud
type: cloud
当本地模型响应超时(默认30秒)时,OpenClaw自动尝试fallback列表中的云端模型。云端API需要提前在OpenClaw中配置好相应的API Key。
使用云端API的场景:
- VPS算力不足,跑不动大模型(7B以上模型在2核VPS上太慢)
- 需要多模态能力(视觉处理等),本地只有CPU
- 外出时手机接收消息,希望AI响应更快
我踩过的3个真实坑
坑1:Ollama服务重启后模型丢失
Ollama的模型存储在~/.ollama/models。如果VPS重启前执行了错误的清理脚本或Docker清理,可能把模型目录也清掉。
**解决:** 把~/.ollama目录重定向到数据盘(如果有的话),或者定期备份:
# 备份模型(按需)
tar -czf ollama_models_backup.tar.gz ~/.ollama/models
**坑2:OpenClaw的 --yes 参数在非交互环境下失效**
ollama launch openclaw --yes是官方推荐的自动化启动参数,理论上可以跳过交互式选择。但我在实测中发现,如果~/.openclaw/config.yml已经存在且包含完整的模型配置,--yes会跳过选择并使用已保存的配置;但如果配置文件不存在,--yes仍然会尝试交互式配置导致在cron脚本中卡住。
**解决:** 提前准备好config.yml配置文件,确保运行--yes前配置已完整:
# 检查配置文件是否存在
ls -la ~/.openclaw/config.yml
如果不存在,先运行一次完整的交互式配置生成配置文件,然后再在cron中使用--yes。
坑3:Telegram机器人消息延迟
OpenClaw的Gateway到Telegram之间如果网络链路不稳定,消息延迟可能达到10秒以上。这不是OpenClaw本身的问题,而是Telegram API的polling机制限制。
解决: 在VPS上配置一个反代,把Telegram的polling换成webhook模式,减少网络往返。具体需要在Telegram BotFather设置webhook URL指向你的反代服务器。
适合人群与不适合人群
适合:
- 有自托管需求,不想让聊天数据经过第三方服务器
- 有VPS,希望24小时运行AI助手
- 开发者,想用本地模型做测试和调试
不适合:
- 没有技术背景,无法维护VPS环境
- 预算极度紧张,本地GPU/VPS成本高于云端API订阅
- 需要实时性极强的对话响应(CPU推理延迟高)
相关工具横向对比
| 工具 | 模型管理 | 消息渠道接入 | 本地优先 | 开源 |
|---|---|---|---|---|
| Ollama + OpenClaw | ✅ Ollama | ✅ 多渠道 | ✅ 支持 | ✅ 全开源 |
| OpenAI API + Telegram Bot | ❌ 不支持 | ✅ 需要自建 | ❌ 纯云端 | ✅ Bot开源 |
| Jan AI | ✅ 内置 | ❌ 无 | ✅ 支持 | ✅ 开源 |
| LM Studio | ✅ 内置 | ❌ 无 | ✅ 支持 | ✅ 开源 |
如果你只需要在电脑前使用,LM Studio / Jan AI 更适合;如果需要多平台消息接入,Ollama + OpenClaw 是目前最完整的开源方案。
---
**透明声明:** 本文涉及的工具 Ollama、OpenClaw 均为开源项目(MIT/Apache 2.0),作者与这些项目无商业关系。本文末尾提到的 MiniMax API 为有价格的服务,配置前请查阅 MiniMax 官方定价。
👉 立即参与:https://platform.minimaxi.com/subscribe/token-plan?code=E5yur9NOub&source=link
📌 This article was AI-assisted generated and human-reviewed | TechPassive — An AI-driven content testing site focused on real tool reviews
🔗 Recommended Tools
These are carefully selected tools. Using our affiliate links supports us to keep producing quality content: