Ollama OpenClaw本地AI助手搭建完整指南：多平台消息渠道接入与模型配置实战

OllamaOpenClaw本地AIAI助手VPS建站自托管

我在树莓派上跑了半年多的本地AI之后，今年把一套完整的工作流迁移到了VPS上：用Ollama做推理引擎，OpenClaw做消息网关，接入微信/Telegram/QQ，24小时运行不掉线。这套组合最吸引我的一点是：OpenClaw原生支持Ollama作为推理后端，ollama launch openclaw一条命令就能把两者串起来。本文把我从安装到生产环境可用的完整过程整理出来，重点覆盖**Ollama部署配置**、**OpenClaw安装初始化**、**多平台渠道接入**、**模型选择与云端备胎方案**4个核心环节，以及我踩过的3个真实坑。

为什么选Ollama + OpenClaw这个组合

如果你想搭建一个自己的AI助手，常见的选项有两条路：

路线A：直接用云端API（OpenAI / Claude / MiniMax等）。省事，但每次对话都要钱，数据经过第三方服务器。

路线B：完全本地部署（Ollama + 前端界面）。数据完全自主，但多平台接入要自己写代码。

Ollama + OpenClaw是第三条路——本地推理为主，云端API为辅。Ollama负责模型管理和推理，OpenClaw负责把AI接入各种消息渠道（微信、Telegram、Discord、QQ等）。你可以在家里用Mac跑本地模型，出门时自动切换到云端API继续服务。

根据Ollama官方文档（2026-05验证），ollama launch openclaw这个命令会自动处理OpenClaw的安装、安全配置、模型选择和网关启动，整个流程不需要手动敲多行配置。

第一步：安装Ollama（VPS环境）

在Linux VPS上安装Ollama有三种方式，按推荐顺序：

方式一：官方一键脚本（推荐）

curl -fsSL https://ollama.com/install.sh | sh

脚本会自动检测系统环境，安装到/usr/local/bin/ollama，创建ollama用户和 systemd 服务。安装完成后运行：

ollama serve  # 启动Ollama服务

确认服务正常：

curl http://localhost:11434/api/generate -d '{"model":"gemma3","prompt":"hello","stream":false}'

返回JSON包含response字段即表示服务正常运行。

方式二：Docker方式（适合已有Docker环境的VPS）

docker run -d \
  --name ollama \
  -p 11434:11434 \
  -v ollama_data:/root/.ollama \
  ollama/ollama:latest

注意Docker方式默认不以systemd服务运行，重启后需要手动docker start ollama。生产环境建议用方式一。

方式三：手动下载二进制

从 ollama.com/download 下载对应架构的二进制文件，适合无法运行安装脚本的最小化Linux环境。下载后：

chmod +x Ollama-linux-amd64
sudo mv Ollama-linux-amd64 /usr/local/bin/ollama

版本验证：

ollama --version

写作本文时最新版本为0.5.x系列（具体小版本号建议查看 github.com/ollama/ollama/releases）。

第二步：拉取并管理模型

Ollama安装好后，默认不包含任何模型。需要手动拉取：

拉取基础模型

ollama pull gemma3          # 拉取Gemma 3b（适合轻量任务）
ollama pull qwen3.5         # 拉取Qwen 3.5b（支持视觉）
ollama pull deepseek-v4-flash  # DeepSeek闪电版（性价比高）

查看已下载模型

ollama list

输出格式类似：

NAME                    SIZE      MODIFIED
deepseek-v4-flash       4.7GB     5 hours ago
gemma3                  4.9GB     2 days ago
qwen3.5                 7.2GB     3 days ago

**磁盘空间注意点：** 模型文件保存在~/.ollama/models。如果VPS硬盘紧张，用ollama pull --no-cache 可以避免重复下载。

GPU配置（如VPS有NVIDIA GPU）：

Ollama会自动检测NVIDIA GPU，不需要额外配置。如果有多个GPU，可以通过环境变量指定：

CUDA_VISIBLE_DEVICES=0 ollama serve

无GPU的VPS用CPU推理，响应速度会明显慢于GPU推理，实测qwen3.5b在2核CPU VPS上约3-5秒/token。

第三步：安装并启动OpenClaw

OpenClaw有两种安装方式：通过Ollama一键安装（最简单），或npm手动安装。

方式一：通过Ollama安装（推荐）

ollama launch openclaw

这条命令会依次：

1. 检测OpenClaw是否已安装，如未安装则通过npm安装

2. 启动安全配置向导（首次启动时）

3. 让你从已下载模型列表中选择一个作为默认模型

4. 自动启动Gateway daemon并打开TUI界面

方式二：npm手动安装

npm install -g openclaw
openclaw gateway start
openclaw configure  # 交互式配置

验证OpenClaw运行状态：

openclaw gateway status

正常输出应包含Gateway running字样和当前配置的模型名称。

OpenClaw配置文件位置：

Linux/macOS：`~/.openclaw/`
配置文件：`~/.openclaw/config.yml`
技能目录：`~/.openclaw/skills/`

第四步：接入消息渠道（微信/Telegram/QQ）

OpenClaw支持同时接入多个消息渠道。以Telegram和QQ为例：

接入Telegram：

1. 在 Telegram BotFather（@BotFather）创建一个机器人，获得 HTTP API Token

2. 运行配置命令：

openclaw configure --section channels

3. 选择Telegram，输入Token即完成

接入QQ（QQ频道）：

openclaw configure --section channels

选择QQ频道模式，需要配置QQ机器人Token和AppID，具体流程参考 QQ开放平台文档。

多渠道同时在线：

OpenClaw的Gateway设计为多渠道消息的统一入口，不同渠道的消息会汇聚到同一个AI后端处理，无需为每个渠道单独配置AI。

渠道接入的坑：

Telegram Bot的隐私模式默认为 restrictive，新成员无法查看历史消息。进入 @BotFather → /mybots → 你的机器人 → Group privacy → Turn off 才能让机器人看到群里的所有消息。
QQ频道机器人需要在 QQ 开放平台创建应用并申请对应的消息权限，否则消息接收不到。

第五步：配置云端API备胎（外出时自动切换）

本地模型毕竟受限于VPS算力，外出时可能需要切换到云端API。OpenClaw的模型配置支持多模型路由。

配置文件（~/.openclaw/config.yml）示例：

model: qwen3.5:local
fallback:
  - name: kimi-k2.5:cloud
    type: cloud
  - name: minimax-m2.7:cloud
    type: cloud

当本地模型响应超时（默认30秒）时，OpenClaw自动尝试fallback列表中的云端模型。云端API需要提前在OpenClaw中配置好相应的API Key。

使用云端API的场景：

VPS算力不足，跑不动大模型（7B以上模型在2核VPS上太慢）
需要多模态能力（视觉处理等），本地只有CPU
外出时手机接收消息，希望AI响应更快

我踩过的3个真实坑

坑1：Ollama服务重启后模型丢失

Ollama的模型存储在~/.ollama/models。如果VPS重启前执行了错误的清理脚本或Docker清理，可能把模型目录也清掉。

**解决：** 把~/.ollama目录重定向到数据盘（如果有的话），或者定期备份：

# 备份模型（按需）
tar -czf ollama_models_backup.tar.gz ~/.ollama/models

**坑2：OpenClaw的 --yes 参数在非交互环境下失效**

ollama launch openclaw --yes是官方推荐的自动化启动参数，理论上可以跳过交互式选择。但我在实测中发现，如果~/.openclaw/config.yml已经存在且包含完整的模型配置，--yes会跳过选择并使用已保存的配置；但如果配置文件不存在，--yes仍然会尝试交互式配置导致在cron脚本中卡住。

**解决：** 提前准备好config.yml配置文件，确保运行--yes前配置已完整：

# 检查配置文件是否存在
ls -la ~/.openclaw/config.yml

如果不存在，先运行一次完整的交互式配置生成配置文件，然后再在cron中使用--yes。

坑3：Telegram机器人消息延迟

OpenClaw的Gateway到Telegram之间如果网络链路不稳定，消息延迟可能达到10秒以上。这不是OpenClaw本身的问题，而是Telegram API的polling机制限制。

解决： 在VPS上配置一个反代，把Telegram的polling换成webhook模式，减少网络往返。具体需要在Telegram BotFather设置webhook URL指向你的反代服务器。

适合人群与不适合人群

适合：

有自托管需求，不想让聊天数据经过第三方服务器
有VPS，希望24小时运行AI助手
开发者，想用本地模型做测试和调试

不适合：

没有技术背景，无法维护VPS环境
预算极度紧张，本地GPU/VPS成本高于云端API订阅
需要实时性极强的对话响应（CPU推理延迟高）

工具	模型管理	消息渠道接入	本地优先	开源
Ollama + OpenClaw	✅ Ollama	✅ 多渠道	✅ 支持	✅ 全开源
OpenAI API + Telegram Bot	❌ 不支持	✅ 需要自建	❌ 纯云端	✅ Bot开源
Jan AI	✅ 内置	❌ 无	✅ 支持	✅ 开源
LM Studio	✅ 内置	❌ 无	✅ 支持	✅ 开源