手机控制 AI 编程?Paseo 让你随时随地跑 Claude Code / Codex
原来 AI 编程工具不一定要坐在电脑前才能用……
先说一个让我有点意外的场景
上个月地铁上突然想到一个 bug,以前只能记在备忘录里等回家。那天试了一下 Paseo,掏出手机连上家里的服务器,用语音说了一句话,Claude Code 就跑起来了。到家的时候 PR 已经在等我了。
我花了点时间才接受这件事:AI 在跑,我在坐地铁。
这就是今天要聊的工具,Paseo。
它是什么
官网:paseo.sh
一句话:Paseo 是一个统一的界面,让你同时管理 Claude Code、Codex、OpenCode 这几个 AI Agent,并且可以从手机、平板、任意设备远程控制它们。
架构很简单:
- 你的电脑或服务器上跑一个 Paseo Daemon(后台进程)
- 手机装 Paseo App
- 两端通过加密通道连接
- 手机发指令,电脑上的 Agent 跑,结果实时推回手机
完全免费,完全开源。代码不出你自己的机器。
它解决了什么问题
先说清楚这个,你才知道要不要继续看。
AI 编程工具只能在电脑前用。
Claude Code 很能干,但要打开终端才能用。出门、开会、躺着,想法有了但没法动。Paseo 解决的就是这个:算力留在服务器上,指令从手机发出去。
切换不同 Agent 的成本。
想用 Claude Code 跑一个,想试试 Codex 看看输出有没有区别,以前得开两个终端窗口分别管。Paseo 在一个界面里统一管,可以切换,可以对比,也可以让它们配合着干一件事(后面细说)。
语音输入基本不可用。
大多数语音转文字靠云端 API,你说的话要上传到别人服务器。在代码场景里这个感觉很别扭,尤其是还没开源的项目。Paseo 的语音识别完全跑在本地,数据不出局域网。
多 Agent 协作没有现成的编排工具。
写代码、审查、跑测试,如果想让三个 Agent 串联着干,以前得自己想办法。Paseo 有内置的 Skills 体系处理这个,后面会举例。
10 分钟装好
安装 Paseo
新手直接下桌面客户端,去 paseo.sh/download 下对应系统的包,自带 Daemon 管理,装完就能用。
服务器或者无界面环境用 CLI:
npm install -g @getpaseo/cli
paseo
# 如果需要重启镜像,使用:
paseo daemon restart
跑起来后终端会打一个二维码。
如果终端不小心关掉了,可以去软件中扫码
手机 App
App Store 或 Google Play 搜 Paseo 安装,扫二维码完成配对。
接上你的 AI Agent
Paseo 本身没有 AI 能力,它只是个壳。至少装一个 Agent:
- Claude Code:
npm install -g @anthropic-ai/claude-code - Codex:
npm install -g @openai/codex - OpenCode:
npm install -g opencode-ai
每个 Agent 的 API Key 自己配好,Paseo 不碰这些凭证。
配对成功后在手机 App 里选个 Agent 发条消息就能用了。
还有个体验真的惊艳到我了,就是可以查看文件内容或者文件diff。
用起来真正有意思的地方
安全问题怎么解决的
"手机远程控制服务器"——这是大多数人第一个疑问。
连接走端到端加密中继,ECDH 密钥交换加 AES-256-GCM 加密。中继服务器只能看到 IP 和流量大小,内容它看不到,消息也伪造不了。你的代码、API Key、对话内容都在本地。
觉得还不够放心的话,直接走 Tailscale VPN 或自建隧道,完全绕过中继,局域网直连。这条路也是支持的。
语音功能
这是我没想到会做得这么认真的部分。
默认跑两个本地模型:语音识别用 parakeet-tdt-0.6b-v3-int8,语音合成用 kokoro-en-v0_19。Daemon 第一次启动会自动下载到 $PASEO_HOME/models/local-speech,之后离线运行,不走任何网络。
如果想要更准的识别,配置里换成 OpenAI Whisper API 改一行就好。
实际用起来什么感觉?坦白说,一开始以为是噱头。用了一周发现:描述性的需求适合语音("帮我把这个组件改成暗色模式"),涉及变量名和具体代码还是手打。两者混着用比较顺手。中文识别目前不算完美,英文更流畅一些。
多 Agent 协作的 Skills
这是 Paseo 上限比较高的地方,新手可以先跳过,等用顺手了再来看。
内置了五个编排 Skill:
| Skill | 干什么 |
|---|---|
/paseo-handoff |
任务交接,把进度、已试方案、决策记录打包传给另一个 Agent |
/paseo-loop |
一个 Agent 执行,另一个验证,循环到成功为止 |
/paseo-orchestrator |
你描述任务,它分配角色、启动多个 Agent 并行跑 |
/paseo-chat |
Agent 之间异步通信,支持持久化消息室和 @mentions |
/paseo-committee |
Claude Opus + GPT 一起规划架构,只出方案不写代码 |
一个实际的用法:
# 功能需要先想清楚架构再动手
1. /paseo-committee → Claude Opus + GPT 讨论,出架构文档
2. /paseo-handoff → 文档和上下文传给 Claude Code
3. Claude Code → 开始实现
4. /paseo-loop → 另一个 Agent 持续验证,直到测试通过
装 Skills:
npx skills add getpaseo/paseo
或者桌面应用 Settings → Integrations 里安装。
终端拆分,和项目管理
对,没错,它还有终端拆分的功能,和cmux一样(截图中左侧是项目分类)。
command+\ 水平拆分
command+shift+\ 垂直拆分
用了一个月,说点真实的
改变最大的不是某个具体功能,而是用 AI 工具的节奏变了。
以前用 Claude Code 是"坐下来,专门搞一段时间"的模式。有了 Paseo 之后变成了:等车的时候交代一件事,AI 在后台跑,我去干别的,回来看结果。异步的、碎片化的。这个改变比"AI 变聪明了"对日常效率的影响更直接。
不足的地方也有:文档目前比较薄,边缘配置要自己摸索;中文语音识别没英文流畅;Skills 这套多 Agent 协作的概念对新手来说需要时间理解,文档也没有足够多的例子帮你上手。
适合谁用:有服务器或闲置电脑、重度使用 Claude Code 或 Codex、对代码数据出不出本地比较在意的开发者。
不太适合谁:偶尔才用一下 AI 的,或者不习惯命令行的。这类用户直接用 Claude Code 就够了,Paseo 给他们增加的是配置复杂度,不是价值。