# Computer Use — macOS / Windows / Linux 跨平台实施计划 更新时间:2026-04-03 参考项目:`E:\源码\claude-code-source-main\claude-code-source-main` ## 1. 现状 参考项目的 Computer Use **仅支持 macOS**——从入口到底层全部写死 darwin。我们的项目在 Phase 1-3 中已经完成了: - ✅ `@ant/computer-use-mcp` stub 替换为完整实现(12 文件) - ✅ `@ant/computer-use-input` 拆为 dispatcher + backends(darwin + win32) - ✅ `@ant/computer-use-swift` 拆为 dispatcher + backends(darwin + win32) - ✅ `CHICAGO_MCP` 编译开关已开 - ✅ `src/` 层 macOS 硬编码已移除(Phase 2 已完成) ## 2. 阻塞点全景 ### 2.1 入口层 | # | 文件:行号 | 阻塞代码 | 影响 | |---|----------|---------|------| | 1 | `src/main.tsx:2366` | `feature("CHICAGO_MCP")` 门控 | CU 初始化入口 | ### 2.2 加载层 | # | 文件:行号 | 阻塞代码 | 影响 | |---|----------|---------|------| | 2 | `src/utils/computerUse/swiftLoader.ts` | macOS-only loader(已改为仅 darwin 加载) | 非 darwin 使用 platforms/ 替代 | | 3 | `src/utils/computerUse/executor.ts:302` | `process.platform !== 'darwin'` → cross-platform executor | 非 darwin 走跨平台路径 | ### 2.3 macOS 特有依赖 | # | 文件:行号 | 依赖 | macOS 实现 | 需要替代方案 | |---|----------|------|-----------|------------| | 4 | `executor.ts:72-96` | 剪贴板 | `pbcopy`/`pbpaste` / PowerShell / xclip | Win: PowerShell `Get/Set-Clipboard`;Linux: `xclip`/`wl-copy` | | 5 | `drainRunLoop.ts` | CFRunLoop pump | `cu._drainMainRunLoop()` | 非 darwin:直接执行 fn(),不需要 pump | | 6 | `escHotkey.ts` | ESC 热键 | CGEventTap | 非 darwin:返回 false(已有 Ctrl+C fallback) | | 7 | `hostAdapter.ts` | 系统权限 | TCC accessibility + screenRecording | Win:直接 granted;Linux:检查 xdotool | | 8 | `common.ts:55-58` | 平台标识 | 动态获取 | 已改为 `process.platform` 分发 | | 9 | `executor.ts:232` | 粘贴快捷键 | `command`/`ctrl` 分发 | 已按平台分发粘贴快捷键 | ### 2.4 缺失的 Linux 后端 | 包 | macOS | Windows | Linux | |---|-------|---------|-------| | `computer-use-input/backends/` | ✅ darwin.ts | ✅ win32.ts | ❌ 需新建 linux.ts | | `computer-use-swift/backends/` | ✅ darwin.ts | ✅ win32.ts | ❌ 需新建 linux.ts | ## 3. 每个平台的能力依赖 ### 3.1 computer-use-input(键鼠) | 功能 | macOS | Windows | Linux | |------|-------|---------|-------| | 鼠标移动 | CGEvent JXA | SetCursorPos P/Invoke | xdotool mousemove | | 鼠标点击 | CGEvent JXA | SendInput P/Invoke | xdotool click | | 鼠标滚轮 | CGEvent JXA | SendInput MOUSEEVENTF_WHEEL | xdotool scroll | | 键盘按键 | System Events osascript | keybd_event P/Invoke | xdotool key | | 组合键 | System Events osascript | keybd_event 组合 | xdotool key combo | | 文本输入 | System Events keystroke | SendKeys.SendWait | xdotool type | | 前台应用 | System Events osascript | GetForegroundWindow P/Invoke | xdotool getactivewindow + /proc | | 工具依赖 | osascript(内置) | powershell(内置) | xdotool(需安装) | ### 3.2 computer-use-swift(截图 + 应用管理) | 功能 | macOS | Windows | Linux | |------|-------|---------|-------| | 全屏截图 | screencapture | CopyFromScreen | gnome-screenshot / scrot / grim | | 区域截图 | screencapture -R | CopyFromScreen(rect) | gnome-screenshot -a / scrot -a / grim -g | | 显示器列表 | CGGetActiveDisplayList JXA | Screen.AllScreens | xrandr --query | | 运行中应用 | System Events JXA | Get-Process | wmctrl -l / ps | | 打开应用 | osascript activate | Start-Process | xdg-open / gtk-launch | | 隐藏/显示 | System Events visibility | ShowWindow/SetForegroundWindow | wmctrl -c / xdotool | | 工具依赖 | screencapture + osascript | powershell | xdotool + scrot/grim + wmctrl | ### 3.3 executor 层 | 功能 | macOS | Windows | Linux | |------|-------|---------|-------| | drainRunLoop | CFRunLoop pump | 不需要 | 不需要 | | ESC 热键 | CGEventTap | 跳过(Ctrl+C fallback) | 跳过(Ctrl+C fallback) | | 剪贴板读 | pbpaste | `powershell Get-Clipboard` | xclip -o / wl-paste | | 剪贴板写 | pbcopy | `powershell Set-Clipboard` | xclip / wl-copy | | 粘贴快捷键 | command+v | ctrl+v | ctrl+v | | 终端检测 | __CFBundleIdentifier | WT_SESSION / TERM_PROGRAM | TERM_PROGRAM | | 系统权限 | TCC check | 直接 granted | 检查 xdotool 安装 | ## 4. 执行步骤 ### Phase 1:已完成 ✅ - [x] `@ant/computer-use-mcp` stub → 完整实现 - [x] `@ant/computer-use-input` dispatcher + darwin/win32 backends - [x] `@ant/computer-use-swift` dispatcher + darwin/win32 backends - [x] `CHICAGO_MCP` 编译开关 ### Phase 2:移除 6 处 macOS 硬编码(解锁 macOS + Windows) **改动原则:macOS 代码路径不变,只在每处 darwin 守卫后加 win32/linux 分支。** | 步骤 | 文件 | 改动 | |------|------|------| | 2.1 | `src/main.tsx:2366` | `feature("CHICAGO_MCP")` → 已为跨平台入口 | | 2.2 | `src/utils/computerUse/swiftLoader.ts` | 已改为仅 darwin 加载,非 darwin 使用 platforms/ | | 2.3 | `src/utils/computerUse/executor.ts:302-309` | 已改为 cross-platform dispatch(非 darwin → createCrossPlatformExecutor) | | 2.4 | `src/utils/computerUse/executor.ts:72-96` | 剪贴板已按平台分发:darwin→pbcopy/pbpaste,win32→PowerShell,linux→xclip | | 2.5 | `src/utils/computerUse/executor.ts:232` | 粘贴快捷键已按平台分发:darwin→command,其他→ctrl | | 2.6 | `src/utils/computerUse/executor.ts:302-309` | 非 darwin 已改为 `createCrossPlatformExecutor()` | | 2.7 | `src/utils/computerUse/drainRunLoop.ts` | 非 darwin 无需 pump(直接执行 fn) | | 2.8 | `src/utils/computerUse/escHotkey.ts` | 非 darwin 返回 false(已有 Ctrl+C fallback) | | 2.9 | `src/utils/computerUse/hostAdapter.ts` | 非 darwin 权限检查逻辑已实现 | | 2.10 | `src/utils/computerUse/common.ts:58` | 已改为动态 `process.platform` 分发 | | 2.11 | `src/utils/computerUse/common.ts:55` | 已改为 darwin→'native',其他→'none' | | 2.12 | `src/utils/computerUse/gates.ts:55` | 已更新(需验证 enabled 默认值) | | 2.13 | `src/utils/computerUse/gates.ts:39` | `hasRequiredSubscription()` 已更新 | ### Phase 3:新增 Linux 后端 | 步骤 | 文件 | 内容 | |------|------|------| | 3.1 | `packages/@ant/computer-use-input/src/backends/linux.ts` | xdotool 键鼠(mousemove/click/key/type/getactivewindow) | | 3.2 | `packages/@ant/computer-use-swift/src/backends/linux.ts` | scrot/grim 截图 + xrandr 显示器 + wmctrl 窗口管理 | | 3.3 | `packages/@ant/computer-use-input/src/index.ts` | dispatcher 加 `case 'linux'` | | 3.4 | `packages/@ant/computer-use-swift/src/index.ts` | dispatcher 加 `case 'linux'` | ### Phase 4:验证 | 测试项 | macOS | Windows | Linux | |--------|-------|---------|-------| | build 成功 | ✅ | 验证 | 验证 | | MCP 工具列表非空 | 验证 | 验证 | 验证 | | 鼠标移动 | 验证 | ✅ 已通过 | 验证 | | 截图 | 验证 | ✅ 已通过 | 验证 | | 键盘输入 | 验证 | 验证 | 验证 | | 前台窗口 | 验证 | ✅ 已通过 | 验证 | | 剪贴板 | 验证 | 验证 | 验证 | ## 5. 文件改动总览 ### 不动的文件(14 个) `cleanup.ts`、`computerUseLock.ts`、`wrapper.tsx`、`toolRendering.tsx`、`mcpServer.ts`、`setup.ts`、`appNames.ts`、`inputLoader.ts`、`src/services/mcp/client.ts`、`@ant/computer-use-mcp/src/*`(Phase 1 已完成)、`backends/darwin.ts`(两个包都不动) ### 改 src/ 的文件(8 个) | 文件 | 改动量 | 风险 | |------|--------|------| | `main.tsx` | 1 行 | 低 | | `swiftLoader.ts` | 2 行 | 低 | | `executor.ts` | ~40 行(剪贴板分发 + 平台守卫 + paste 快捷键) | **中** | | `drainRunLoop.ts` | 1 行 | 低 | | `escHotkey.ts` | 3 行 | 低 | | `hostAdapter.ts` | 5 行 | 低 | | `common.ts` | 3 行 | 低 | | `gates.ts` | 3 行 | 低 | ### 新增文件(2 个) | 文件 | 行数估算 | |------|---------| | `packages/@ant/computer-use-input/src/backends/linux.ts` | ~150 行 | | `packages/@ant/computer-use-swift/src/backends/linux.ts` | ~200 行 | ## 6. Linux 依赖工具 | 工具 | 用途 | 安装命令(Ubuntu) | |------|------|-------------------| | `xdotool` | 键鼠模拟 + 窗口管理 | `sudo apt install xdotool` | | `scrot` 或 `gnome-screenshot` | 截图 | `sudo apt install scrot` | | `xrandr` | 显示器信息 | 通常已预装 | | `xclip` | 剪贴板 | `sudo apt install xclip` | | `wmctrl` | 窗口列表/切换 | `sudo apt install wmctrl` | Wayland 环境需要替代工具:`ydotool`(替代 xdotool)、`grim`(替代 scrot)、`wl-clipboard`(替代 xclip)。初期可先只支持 X11,Wayland 标记为 todo。 ## 7. 执行顺序建议 ``` Phase 2(解锁 macOS + Windows) ├── 2.1-2.3 移除 3 处硬编码 throw/skip ├── 2.4-2.5 剪贴板 + 粘贴快捷键平台分发 ├── 2.6 swiftLoader → 直接实例化 ├── 2.7-2.9 drainRunLoop / escHotkey / permissions 平台分支 ├── 2.10-2.11 common.ts 平台标识动态化 ├── 2.12-2.13 gates.ts 默认值 └── 验证 Windows Phase 3(Linux 后端) ├── 3.1 input/backends/linux.ts ├── 3.2 swift/backends/linux.ts ├── 3.3-3.4 dispatcher 加 linux case └── 验证 Linux Phase 4(集成验证 + PR) ``` 每个 Phase 可独立验证、独立提交。Phase 2 完成后 macOS + Windows 可用,Phase 3 完成后三平台全部可用。