Files
claude-code/docs/superpowers/specs/2026-06-12-workflow-engine-design.md
claude-code-best 58ee6419b1 feat: dynamic-workflow 来了 (#1271)
* feat(workflow): add workflow engine, /workflows panel, /ultracode skill

将 feat/sdk-backend 分支中 workflow 相关的 20 个 commit 压缩为单 commit:

- 工作流引擎核心:phase / agent / parallel / pipeline 编排原语(packages/workflow-engine/)
- /workflows 面板:三区焦点布局(顶部 run tabs + 左侧 phase 侧栏 + 右侧 agent 列表)
- /ultracode skill:多 agent workflow 编排入口
- 进度存储 / journal / notification 系统
- WorkflowService 生命周期管理 + SentryErrorBoundary
- 脚本沙箱:禁用 dynamic import()、JSON args 防御性归一化
- journal 与 named-workflow 路径统一在 projectRoot
- 错误处理:parallel/pipeline hooks 错误日志、failure routing、semaphore abort
- workflow 工具升级为 core 工具 + PascalCase 命名

Co-Authored-By: glm-5.1 <zai-org@claude-code-best.win>

* feat(workflow): 复刻 ultracode 手册并修复 worktree/inline/opt-in 三处缺口

围绕 ultracode skill 审查 agent 系统一致性后:
- ultracode.ts: 用系统提示版完整 Workflow 编排手册替换中文精简版
- HIGH#1 isolation:'worktree': claudeCodeBackend.run() 用 createAgentWorktree +
  runWithCwdOverride 包裹 runAgent + finally 清理实现真正的 cwd 隔离;slug 用
  sha256(runId:agentId) 派生以匹配 cleanupStaleAgentWorktrees 清理正则
  (修 runId 为 w+base36 非 UUID 导致的泄漏盲区);worktree.ts 注释同步修正
- HIGH#2 inline 持久化: 新增 persistInlineScript,WorkflowTool + service 两条
  inline 路径对称持久化到 .claude/workflow-runs/<runId>/script.js,返回可复用
  scriptPath(闭环 inline→编辑→scriptPath 重提迭代循环)
- HIGH#3 opt-in 分工: ultracode/WorkflowTool/effort 注明 session reminder 由
  harness 注入,repo 内无 ultracode 信号,保持 feature('WORKFLOW_SCRIPTS') +
  isEnabled 两层 gate,不自造注入
- 测试: 新增 persistInline.test.ts;扩展 claudeCodeBackend(isolation 4 用例)/
  WorkflowTool(inline)/service(scriptPath)/ultracode(harness)

含配套 workflow engine/panel 完善与 run-state-persistence design doc。

Co-Authored-By: Claude <noreply@anthropic.com>

* feat(workflow): run 终态落盘 state.json 支持跨重启恢复

终态 RunProgress(含 returnValue/error)此前只在内存 ProgressStore,进程
重启即丢失。本次让其落盘到 .claude/workflow-runs/<runId>/state.json,使
(a) 重启后可按 runId 取 return、(b) /workflows 面板跨重启展示历史 run。
跨进程 resume 明确不在范围。

- persistence.ts: getRunsDir/writeRunState/readRunState/listPersistedRuns
  + attachRunStatePersistence;原子覆盖写(tmp+rename),读容错(缺文件/
  损坏/schemaVersion 不符 → null),写 best-effort(IO 失败只 log warn)
- progress/store.ts: 加 hydrate(run) 直接注入磁盘 run(已存在 runId 跳过,
  内存优先)
- service.ts: getWorkflowService() 接线 attachRunStatePersistence(bus,
  store) 订阅 run_done(completed/failed/killed 三态共用,shutdown-kill
  也走同路径,无需额外钩子);WorkflowService 加 getRunAsync(id) 内存
  miss→读盘 fallback(不注入内存)+ loadPersistedRuns() 扫盘 hydrate
  (persistedLoaded flag 守护幂等)
- panel/WorkflowsPanel.tsx: mount 时调一次 loadPersistedRuns(重 mount
  不重复)
- ports.ts: runsDir 改用 getRunsDir() 消除拼接重复
- 测试: persistence.test.ts(11)/runStatePersistence.test.ts(5)/
  progressStore(2)/service(5)/WorkflowsPanel(1) 共 24 个新测试;
  precheck 5629 pass / 0 fail

设计偏离: 计划原写 monkey-patch getRunsDir 指向 tmpdir,Bun ESM namespace
不可变不可行;改用可选 runsDirProvider 参数(默认 getRunsDir)DI 注入,
加到 attachRunStatePersistence 与 makeService(cwdOverride 之后第 4 参),
与现有 cwdOverride 模式一致。makeService 的 cwdOverride 保持不变,不破坏
inline 持久化特性。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(workflow): 默认并发降为 3 并支持 per-run maxConcurrency 注入

- DEFAULT_MAX_CONCURRENCY=3 替代旧的 min(16, cores-2);MAX_CONCURRENCY_CAP=16 保留为用户输入的绝对上限
- 新增 clampMaxConcurrency() 处理 undefined/<1/>CAP 边界
- WorkflowInput schema 新增 maxConcurrency: number.int().min(1).max(16).optional()
- 引擎层 context/runWorkflow 全链路透传:semaphore 容量来自 per-run 入参
- WorkflowTool prompt 增加指引:fan-out 场景先用 AskUserQuestion 与用户确认并发再启动
- 同步 ultracode skill + audit workflow spec 的并发文字(删 cpu-cores 公式)
- 同步 docs/features/workflow-scripts.md 旧公式

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* fix(workflow): 面板 UI 字符串英文化

WorkflowsPanel 中 4 处面向用户的中文(onDone 错误消息、键位提示行)
改为英文;其他面板组件(AgentList/TabsBar)原本已是英文。代码注释
保留中文,与 workflow 模块惯例一致。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(workflow): 中断系统(x 杀单 agent / K 杀整个 workflow,Dialog 二次确认)

- claudeCodeBackend 桥接 ctx.signal → runAgent.override.abortController(修 'x' 无效根因:abort 到不了内部 fetch)
- AbortError 识别为 throw WorkflowAbortedError(不再吞成 dead,workflow 能感知被 kill)
- ports.taskRegistrar 加 registerAgentAbort/unregisterAgentAbort/killAgent;service.killAgent(runId, agentId) 精确中断
- 面板键位:'x' 杀当前 agent(agents 列聚焦时) / 'K' 杀整个 workflow;Dialog 二次确认 + confirm 模式吞导航键防误触
- 新增测试 8 项(backend signal bridge / hooks inject / ports killAgent / service killAgent)

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* docs(workflow): ultracode skill 加 model tier 选择指引(haiku/sonnet/opus/best 场景匹配)

补足 agent() 已有 model 参数缺的判断依据:列出 4 个 tier 的成本/延迟量级和典型场景,
明确"无法 articulate 为什么换 tier 就 omit"的 rule of thumb。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(workflow): maxConcurrency≠3 必须先 AskUserQuestion(默认 3 推荐值)

把 fan-out 时才问改成任何 maxConcurrency≠3 都必须问。
唯一例外:用户在当前会话已明确说过并发数("use 6" / "maxConcurrency 9")。
prompt (WorkflowTool.ts) + skill (ultracode.ts) + audit spec 三处同步。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(workflow): agent 失败自动重试一次(dead 或非 abort throw)

- hooks.agent 包装 invokeBackend:第一次 dead 或非 abort throw → 重试一次
- WorkflowAbortedError(kill)不重试——是用户意图
- registry.resolve 配置错(AdapterNotFoundError 等)在 try 外直接上抛,不走重试——
  配置问题重试无意义且掩盖 bug
- 重试仍失败:dead 保持 dead;throw 降级 dead(不击穿 workflow,
  与 parallel/pipeline null-on-error 契约一致)
- budget 不重复扣:dead 不 addOutputTokens,重试 ok 才扣一次
- 新增 7 项 hooks 层重试测试 + 1 项 service 层降级测试

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* fix(workflow): 面板 label 截断保留 #数字 后缀(同 dim 多 finding 可区分)

audit workflow 用 verify:\${dim}#\${findingIdx} 命名 verify agent。
旧逻辑 slice(0, 18) 从右切把 #idx 全吃了——同 dimension 多 finding
肉眼无法区分。新逻辑:含 #数字 后缀时保留后缀,前缀截断 + … 省略号。

例:verify:correctness#0 → verify:correctn…#0
   verify:architecture#15 → verify:archite…#15

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(workflow): kill 整个 workflow 后立即回主 chat

run_done→store→notifications.ts 的通知路径已有,但 confirmYes 后面板继续
挂着挡住主 chat,用户看不到"已停止"反馈。kill 后调 onDone() 立即退出面板,
让主 chat 的 `Workflow "<name>" was stopped` 通知直接可见。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* fix(workflow): agent dead 带 reason/detail + prompt 加压 StructuredOutput

12 agent audit workflow 8 个 dead,journal 只记 {kind:"dead"} 无信息,
事后无法区分 "agent 没产 StructuredOutput" vs "runAgent 抛错"。
证据指向主因:sonnet 长 tool chain 后忘记调 StructuredOutput,
extractStructuredOutput 返回 null 即降级 dead。

- types.ts: AgentRunResult.dead 加可选 reason/detail 字段
  (no-structured-output / runagent-threw / worktree-failed / unknown)
  兼容旧 journal(均 optional)。
- claudeCodeBackend.ts: 三处 dead 填 reason + detail;
  no-structured-output 把 finalized 文本前 200 字符做 detail,
  让日志/面板能立刻看到 agent 最后说了什么。
- claudeCodeBackend.ts: schema 模式 prompt 首尾各放一次
  StructuredOutput 强制要求,针对 sonnet 长 tool chain 后忘记收尾。
- hooks.ts: retry 日志带 reason;retry 仍 throw 时降级 dead 也填
  reason=runagent-threw + detail。
- types.test.ts: 加 reason JSON 往返 + 旧 journal 兼容测试。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* fix(workflow): schema 模式弃用 StructuredOutput 工具契约,改鲁棒 JSON 文本解析

上一轮 70a2f76 把"agent 长 tool chain 后忘调 StructuredOutput"当作死因,
加 prompt 头尾双强制。但实测跑 5 个 review agent 4 个 dead,detail 全是
"StructuredOutput tool is not available as a deferred tool"——根因是
该工具从未注入 workflow sub-agent 的工具集(assembleToolPool 默认池不含,
只有 stop_hook 路径 execAgentHook.ts 显式 createStructuredOutputTool())。
prompt 反复要求调一个不可达的工具,agent 困扰、长篇辩解、最终没产 JSON。

- claudeCodeBackend.ts:
  - extractStructuredOutput 重写:括号栈扫描替代 indexOf/lastIndexOf,
    处理嵌套对象、字符串内的括号、转义符;新增 fenced code block
    优先路径(```json / ```),多 JSON 块取第一个 parse 成功的;
    只返回 plain object(拒 array/number/string/null)。不做语法修复
    (尾逗号/单引号/注释)——避免在字符串内误改(如 "http://" 被 // 注释正则吃)。
  - schema 模式 prompt 简化:删首尾双 STRUCTURED OUTPUT 强制(600+ token),
    改成指示 agent 在最后文本块 emit raw JSON;明确告知"StructuredOutput
    is not available in this environment",消除调用幻觉。
- hooks.ts: detail.slice 用 typeof === 'string' 守卫;catch 块用
  e instanceof Error ? e.message : String(e)(旧 journal / 第三方 adapter
  可能写非 string detail,直接 .slice 会抛 TypeError 击穿日志)。
- claudeCodeBackend.test.ts: +9 测试覆盖 fenced / 嵌套 / 字符串内括号 /
  转义引号 / 多块取首 / 类型守卫 / 损坏 JSON。

precheck: 5663 pass / 0 fail。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* docs(effort): 新增 /effort 交互面板设计 spec

设计要点:
- /effort 无参 → 横向 slider 面板(low/medium/high/xhigh/max/ultracode)
- ←/→ 移动光标,Enter 确认,Esc 取消
- ultracode 仅视觉占位,确认后提示走 /ultracode <context>
- env override 时双标记 + 顶部警告
- 模型不支持时面板禁用
- 两阶段交付:先基础面板 commit,再做 ultracode 波纹动画

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* docs(effort): 新增 EffortPanel 基础面板实施计划(第一阶段)

按 TDD 分 6 个 task:纯函数状态 → keybinding 注册 → 组件 → 命令挂载 → 分支测试 → precheck。
波纹动画在第二阶段单独 commit。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* docs(effort): plan 补 q/ctrl+c 取消绑定,对齐 spec §5 状态机

verifier 抓到的 gap:spec §5 写明 Esc / Ctrl+C / q 都是取消事件,
但 plan Task 2.3 只绑了 escape。补上 q 和 ctrl+c → effortPanel:cancel。
同时把 Step 2.2 直接写成 6 个 action 版本(home/end),删除迂回表达。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* docs(effort): plan 修订执行前 review 发现的 5 处 gap

- Task 3.3 EffortPanel.tsx 草稿:Faster/Smarter padEnd 语法错乱重写;
  useKeybindings import 路径从 @anthropic/ink 修正为 ../../keybindings/useKeybinding.js;
  移除冗余 renderSeparatorLine;保留 renderPaddedLine
- Task 5.2 computeConfirmOutcome 改为注入 ApplyFn 模式:
  避免 effortPanelState → effort.tsx → EffortPanel 循环依赖;
  测试可注入 mockApply,无需 mock settings
- Step 5.3 测试代码对齐注入版签名

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(effort): 新增 EffortPanel 纯函数状态模块(PanelPosition + 移动/初始光标)

仅含纯函数与类型,无 React/Ink 依赖,便于单测。
- PANEL_POSITIONS:low → medium → high → xhigh → max → ultracode
- moveLeft/moveRight:边界钳制(low 不再左移、ultracode 不再右移)
- getInitialCursor:env override > displayed level

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(keybindings): 注册 EffortPanel context 与 6 个 action

绑定 ←/→/h/l/home/end/enter/escape/q/ctrl+c 到 effortPanel:* action。
与 ModelPicker context 范式一致,避免左右键被全局 keybinding 拦截。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(effort): 实现 EffortPanel 组件主体(渲染 + 键盘交互 + 确认/取消分支)

- 横向 slider 布局:Faster ↔ Smarter 两极,6 档刻度
- useKeybindings 注册 EffortPanel context(←/→/h/l/home/end/enter/escape/q/ctrl+c)
- Enter 在 5 档之一 → 调 executeEffort 写 settings + AppState
- Enter 在 ultracode → 输出引导文案,不写状态
- Esc/q → "Effort unchanged."
- env override 时顶部黄色警告
- computeConfirmOutcome 注入 ApplyFn,便于测试(Task 5 补测试)

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(effort): /effort 无参时挂载 EffortPanel 交互面板

- 无参 → <EffortPanelWrapper> 透传 AppState.effortValue
- current/status → 仍显示文本(不变)
- 有参 → 直跳 executeEffort(不变)
- help/-h/--help → 不变

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* test(effort): 补 computeConfirmOutcome 分支测试(注入 mockApply)

- ultracode → kind=ultracode-hint,不调 applyFn
- low → kind=apply,message/effortUpdate 来自 applyFn
- applyFn 返回无 effortUpdate 时 outcome.effortUpdate 为 undefined
- CANCEL_MESSAGE / ULTRACODE_HINT 常量

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* fix(effort): 测试里 cursor cast 为 EffortValue,避免 PanelPosition 含 ultracode 触发 TS 错误

computeConfirmOutcome 的 ApplyFn 契约要求 EffortValue,但测试 mockApply 接收 PanelPosition。
实际运行时 computeConfirmOutcome 在 ultracode 档位走 hint 分支不会调 applyFn,
cast 安全。precheck 全量通过:5688 tests / 0 fail。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* fix(effort): 面板对齐与配色修复

- 对齐:用 Box width={SEGMENT} + justifyContent="center" 让 ▲ 与档位名严格居中对齐,
  替代之前 string padEnd(11) 与 SEGMENT=12 不一致导致的 1 列偏移
- 配色:所有面板文字改用 theme.claude(Claude Orange rgb(215,119,87)),
  替代终端默认紫;分隔线/副标签/底栏用 theme.subtle;env 警告用 theme.warning
- 光标档位的档位名也加粗,强化视觉焦点

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* fix(effort): 面板文字改紫色,ULTRACODE_HINT 英文化

- 颜色:theme.claude(橙)→ theme.purple_FOR_SUBAGENTS_ONLY(Purple 600, rgb(147,51,234)),
  覆盖标题、Faster/Smarter、▲、档位名
- ULTRACODE_HINT:中文 → 英文
  "ultracode is not an effort level. Use /ultracode <context> to start a multi-agent workflow."

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* fix(effort): 统一用色版——选中 suggestion(蓝),未选中 subtle(灰)

弃用 purple_FOR_SUBAGENTS_ONLY(subagent 专用)。改与项目其他面板一致:
- 选中档位 + ▲:color="suggestion"(Medium blue rgb(87,105,247))+ bold
- 未选中档位 + 空 ▲ 占位:color="subtle"(Light gray rgb(175,175,175))
- 标题 / Faster / Smarter:color="suggestion"
- 分隔线 / 副标签 / 底栏:color="subtle"

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* fix(workflow): 终态前补发 phase_done,面板自动退出 running→terminal 转换

runWorkflow:脚本结束时 hook.phase 不会触发最后一个 phase 的 phase_done,
UI 左栏会永远显示 running。三路径(completed/killed/failed)统一在 run_done
之前补发 emitTerminalPhaseDone。

WorkflowsPanel:抽 isRunTerminatedTransition 纯函数判定 running → terminal,
面板 useEffect 检测到转换后自动退出聚焦。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(effort): 波纹动画纯函数 pickChar/computeRippleLine/mergeLayers + 18 测试

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(effort): useRippleFrame hook 包装 useAnimationFrame,按需订阅时钟

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(effort): EffortPanel 集成波纹背景——cursor 停在 ultracode 时切换波纹模式

仅在 cursor === 'ultracode' 时启用 useRippleFrame,渲染 5 行波纹背景
+ overlay 文字(Faster/Smarter、分隔线、▲、档位名、副标签)。
其余档位保持原 PlainContent 渲染路径不动。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* refactor(effort): 波纹动画从字符密度改为颜色渐变

按原版风格把波纹背景从 INTENSITY_CHARS 密度字符('·∙░▒▓')改为
suggestion 系颜色渐变(transparent → 暗深紫蓝 → suggestion → 高光):

rippleAnimation.ts:
- 删除 pickChar / INTENSITY_CHARS / WAVE_PEAK_CHARS / mergeLayers
- 新增 intensityToColor(intensity) → 'transparent' | '#xxxxxx'
- 新增 computeRippleCells 返回 Cell[](每位置 char+color)
- 新增 applyOverlaysToCells(cells, overlays) 替代 mergeLayers
- 新增 cellsToSegments(cells) 合并相邻同色段(减少 Text 节点)

EffortPanel.tsx:
- RippleContent 用 cells→segments→tokens 渲染
- 空格段用 BaseText backgroundColor 染色块(纯色块视觉)
- 文字段用 Text color 染色(亮色突出)
- tokens 按空格/文字二次拆分,避免混合段渲染歧义

测试: 29 个 rippleAnimation 测试覆盖 intensityToColor 边界、
computeRippleCells 长度/震源/衰减、applyOverlaysToCells 覆盖/截断/
防御式拷贝、cellsToSegments 合并逻辑。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* fix(effort): 波纹参数调优——铺满左侧 + 速度调慢 + 全面板有底色

用户反馈三个问题:
1. "低峰部分没有颜色变化" → intensity ≤ 0.1 返回 transparent 导致波谷
   位置看不见。改为永不返回 transparent,最低档 #0a0d1a 作为面板
   底色(暗紫黑海洋),波峰在底色上流动。
2. "波浪速度太快" → time 系数 0.012 → 0.004(约 1/3 速)。波峰移动
   速度从 34 cell/s 降到 11 cell/s,每帧颜色变化从 45% 降到 36%。
3. "波浪只到中间部分,没覆盖左侧" → falloff 覆盖半径 40 → 90。
   震源 x=65,左侧 dist=65 < 90,波纹可达最左端(约 30-50% 覆盖)。

色阶调整:
- 删除 transparent 档,新增 #0a0d1a 作最暗档(底色)
- 最高档从 #8aa0ff(高光)改为 #5769F7(suggestion),避免与
  文字 overlay 同色互相吞噬
- 7 档颜色:#0a0d1a → #15182b → #1f2543 → #2a3360 →
  #3a4582 → #4a5bb0 → #5769F7

测试:删除 transparent 期望,改为期望具体颜色(#0a0d1a 等)。
新增"覆盖半径扩大"测试验证 dist=65 仍有非最暗颜色。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* fix(effort): 波纹 v3 — 去黑边 + 删中心高频涟漪 + y 轴覆盖快捷键行

用户反馈三个问题:
1. "黑色边感觉不太对" — 最暗档 #0a0d1a (rgb 10,13,26) 太接近纯黑,
   远端波谷看起来像硬黑边。改为 #1a1f3a (rgb 26,31,58),紫蓝感
   更强而非纯黑。
2. "中心的快速波纹有点奇怪" — 删除震源附近 dist<6 的高频涟漪叠加
   (time*0.02,5 倍主波纹频率)。原本想让震源附近"水波感"更强,
   实际效果像"快速闪烁"反而突兀。主波纹已经足够,无需叠加。
3. "y 方向覆盖快捷键" — RippleContent 新增 y=2 行渲染快捷键 overlay
   ("←/→ adjust · Enter confirm · Esc cancel")。PlainContent 路径
   保持原 Box marginTop=1 + Text 渲染。

色阶调整(紫蓝感更强):
- #1a1f3a (原 #0a0d1a) — 最暗档
- #1f2543 / #252c55 / #2e3870 / #3a4582 / #4a5bb0 / #5769F7
  (中间档略调亮度,保持平滑过渡)

测试:震源点测试更新为"time=0 时波谷最暗,time 推进后扫过波峰变亮",
反映删除高频涟漪后的纯主波纹行为。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* chore(workflow): 工作流相关代码中文文案全部英文化

源码(src/workflow/ + packages/workflow-engine/src/)的中文注释、
用户可见错误消息、字符串字面量;测试文件的标题与注释;同步 6 条
硬编码断言到英文化后的错误消息。

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* feat(effort): 波纹 v4 — 平滑波 + 全色环旋转 + 淡入淡出 + 宽度自适应

- 波函数改 (sin+1)/2:消除 max(0,sin) 平直暗带(约 6 行宽)
- 主色相连续旋转(0.03°/ms,12s/圈全色环):蓝→紫→品红→红→橙→黄→绿→青
- 文字 overlay 同步色相旋转(rotateHue 应用到 Faster/▲/档位名/分隔线/副标签)
- 淡入淡出动画:fadeColor/fadeCells + fade 状态机 ~300ms 进出过渡
- 副标签固定 ultracode 段下方,不跟随光标移动
- 顶部/底部各加一行纯波纹行,视觉一致
- 宽度自适应终端列数:窄则 72,宽则铺满(computeSegment/computeRippleSourceX)
- 快捷键改 plain Text,不参与波纹背景渲染
- 新增 18 测试(fadeColor/fadeCells/rotateHue/getHueShiftAtTime)

Co-Authored-By: glm-5.2 <zai-org@claude-code-best.win>

* refactor: remove CYBER_RISK_MITIGATION_REMINDER from FileReadTool

Co-Authored-By: deepseek-v4-pro <deepseek-ai@claude-code-best.win>

* fix: prevent ReDoS in extractMeta regex by anchoring to splice boundary

Co-Authored-By: deepseek-v4-pro <deepseek-ai@claude-code-best.win>

* chore: 更新脚本

---------

Co-authored-by: glm-5.1 <zai-org@claude-code-best.win>
Co-authored-by: Claude <noreply@anthropic.com>
Co-authored-by: deepseek-v4-pro <deepseek-ai@claude-code-best.win>
2026-06-14 18:13:49 +08:00

17 KiB
Raw Permalink Blame History

Workflow Engine — 重建设计

  • 日期2026-06-12
  • 状态:已通过 brainstorming待 writing-plans
  • 范围:把被掏空的「清单推进」版 WorkflowTool 重建为完整忠实的确定性 JS 脚本编排引擎,并独立成包,解除与核心层的深度依赖。

1. 背景与现状

当前 packages/builtin-tools/src/tools/WorkflowTool/WorkflowTool.ts 是个被阉割的版本:把 .claude/workflows/ 里的 .md/.yaml 解析成清单,靠模型手动调用 advance 推进,没有任何子 agent 编排能力

真正的 Workflow 能力是一个确定性 JS 脚本编排引擎:后台执行脚本,提供 agent()/parallel()/pipeline()/phase()/log() 钩子,真正 spawn 子 agent支持 schema 校验、并发上限、journaling/resume、token budget、进度流。

可复用的现有基础设施

  • src/tasks/LocalWorkflowTask/LocalWorkflowTask.ts完整的后台任务生命周期register/complete/fail/kill/skip/retry/orphan 清理)。完好,复用
  • packages/builtin-tools/src/tools/AgentTool/runAgent.ts:子 agent 执行核心async generator接收 agentDefinition+promptMessages+toolUseContext+canUseTool,运行完整 query 循环)。作为 agent() 钩子后端
  • assembleToolPoolsrc/tools.ts):构建子 agent 工具池。
  • finalizeAgentTool / extractTextContentagentToolUtils.ts):抽取 agent 最终消息 + usage。
  • WorkflowPermissionRequest.tsx:权限 UI核心侧 React复用
  • tools.ts 已用 WORKFLOW_SCRIPTS feature flag 接好注册位;constants/tools.tsCORE_TOOLS 在 flag 开启时含 workflow

2. 关键决策brainstorming 结论)

  1. 范围:完整忠实引擎——全部钩子 + schema 结构化输出 + 并发上限16/1000/4096+ journaling/resume + token budget + worktree 隔离 + named-workflow 加载 + 进度流到 /workflows
  2. 包边界严格端口适配(依赖倒置)packages/workflow-engine/src/* / builtin-tools 运行时导入;只声明端口接口;核心侧提供一个 adapter 模块实现这些接口;tools.ts 装配时注入。
  3. 文件模型.claude/workflows/<name>.ts|.js|.mjs 脚本文件 → 命名 workflowWorkflow 工具 name 参数解析到它)+ 生成 /<name> 斜杠命令;/workflows 变为实时进度查看器。删除 现有 .md/.yaml 清单逻辑。
  4. 执行路径async 函数包装 + 信号量 + 注入端口(方案 A。进程内 async 模型,与 runAgent 的 async generator 天然契合,端口可 mock 测试。不用 vm 沙箱或 worker 进程。

3. 架构与依赖方向

┌─────────────────────────────────────────────────────────────┐
│  packages/workflow-engine/   ← 新包,零 src/* 运行时导入     │
│  声明端口(接口),持有引擎/钩子/并发/journal/budget/schema │
│  + 自包含的 WorkflowTool 描述符zod schema/desc/prompt    │
└──────────────▲──────────────────────────▲───────────────────┘
               │ 实现implements        │ 注入DI
┌──────────────┴──────────────────────────┴───────────────────┐
│  src/workflow/  ← 核心侧薄层                                 │
│  adapter.ts: 用 runAgent/assembleToolPool/LocalWorkflowTask │
│              /AppState 实现端口                              │
│  wiring.ts:   createWorkflowTool(adapter) → 适配为 Tool      │
│              注册到 tools.tsWORKFLOW_SCRIPTS flag 之后)   │
└─────────────────────────────────────────────────────────────┘

不认识 buildTool / toolUseContext / runAgent / Message 类型。仅通过端口接口与不透明 host 句柄对话。

端口契约(包内 ports.ts

端口 职责 核心侧 adapter 实现
AgentRunner agent() 后端:runAgentToResult(params, hostHandle) → AgentRunResult 委托 runAgent + assembleToolPoolschema 时注入 StructuredOutput 工具;finalizeAgentTool 抽取最终消息 + usage
ProgressEmitter emit(event) 推进度事件 LocalWorkflowTaskState.progress + rootSetAppState
TaskRegistrar 后台任务生命周期 + 读 pendingAgentAction 复用 LocalWorkflowTask API
JournalStore journal 读写(按 runId 文件 fs.claude/workflow-runs/<runId>/journal.jsonl),走端口便于 mock
PermissionGate agent() 前置权限/取消检查 abort signal + pendingAgentAction
Logger 调试日志 + 遥测 logForDebugging / logEvent

不透明 host 句柄HostHandle = { readonly __workflowHost: unique symbol }。核心侧每次工具调用构造一个句柄(内含 toolUseContext/canUseTool/agentId 等),包内绝不检视,只透传给 AgentRunneradapter 把它 cast 回核心上下文。包对核心类型零依赖的唯一缝隙,且是不透明的。

包结构

packages/workflow-engine/
  package.json            @claude-code-best/workflow-engine (workspace:*)
  tsconfig.json
  src/
    index.ts              公共导出
    ports.ts              端口接口 + HostHandle
    types.ts              纯类型WorkflowInput/Run/JournalEntry/ProgressEvent/AgentRunParams…
    tool/
      WorkflowTool.ts     createWorkflowTool(ports) → 自包含描述符
      schema.ts           输入 schemascript/name/scriptPath/args/resumeFromRunId/desc/title
      constants.ts        WORKFLOW_TOOL_NAME 等
    engine/
      runWorkflow.ts      引擎入口:校验/包装/执行/journal/resume
      context.ts          执行上下文(端口/信号量/budget/journal/计数器/host
      hooks.ts            agent/parallel/pipeline/phase/log/workflow 实现
      script.ts           meta 字面量提取 + async 包装 + 沙箱 shim
      concurrency.ts      Semaphore + 上限16 / 1000 总 / 4096 每次调用)
      journal.ts          hash + 读/写 journal
      budget.ts           budget 累加器total/spent/remaining
      structuredOutput.ts JSON Schema → 结果校验(纯函数)
      namedWorkflows.ts   name → .claude/workflows/<name>.ts|js|mjs 解析(仅 fs
      constants.ts        目录/上限常量
    progress/events.ts    ProgressEvent 类型 + emit 委托
    __tests__/ …

核心侧薄层:src/workflow/adapter.ts + src/workflow/wiring.tspackages/builtin-tools 从新包 re-export 描述符。

4. 引擎内部

4.1 钩子语义

钩子 语义 失败行为
agent(prompt, opts?) 取信号量 → 查 journal命中即返回缓存→ 调 AgentRunner → 写 journal → 返回 终态 API 错耗尽重试 → null(不抛)
parallel(thunks) 屏障Promise.all 所有 thunk每个内部各自过信号量wall-clock = 最慢项 单项抛错/agent 错 → 该项 null;调用本身永不 reject
pipeline(items, …stages) 无屏障:每项跑 stage1→stage2→… 异步链多链并发stage 回调收 (prevResult, originalItem, index) 某 stage 抛错 → 该项 null、跳过后续 stage
phase(title) 开启新阶段,后续 agent/log 归入该组直到下次 phase()
log(message) 向用户发一行旁白进度
workflow(nameOrRef, args?) 内联跑子 workflow返回其返回值共享并发/计数/budget/workflows 显示为 ▸ name 子 workflow 内再嵌套 → 抛错(仅一层)

agentoptslabelphase(显式分组)、schemaJSON Schemamodelisolation:'worktree'agentType(自定义子 agent 类型)、allowedTools

  • 无 schema 返回 string;有 schema 返回校验对象;用户 skip / agent 终态死亡 → 返回 null

4.2 并发与上限(concurrency.ts

  • Semaphore 许可数 = min(16, cpuCores - 2)agent() 取 1。
  • 单个 workflow 生命周期总 agent 数 ≤ 1000 → 超出抛错。
  • 单次 parallel/pipeline 调用 items ≤ 4096 → 超出抛错(显式错误,不静默截断)。

4.3 Journal / Resumejournal.ts

  • journal = 按执行顺序{ key, result } 列表,存 .claude/workflow-runs/<runId>/journal.jsonl
  • key = hash(prompt + canonical(opts 去掉 label/phase 等纯展示字段))
  • 命中:agent() 先算 key与 journal 下一项 key 比对 → 匹配则返回缓存并前进,不匹配则丢弃后续 journal、现场重跑。
  • 因 JS 去掉 Date.now/random 后确定,执行顺序确定 → 自然得到「最长未变前缀命中、首个发散点之后全重跑」。
  • resumeFromRunId:载入该 run 的 journal 重放。脚本源码 hash 一致 → 100% 命中;脚本改动 → 全重跑。脚本 hash 存入 run 记录。

4.4 Budgetbudget.ts

  • budget.total:来自用户 +500k 式 turn 级 token 指令,由 host/turn 上下文注入adapter 从 turn 的 token 指令读取,经 HostHandle 传入),不是 工具 input 参数。无指令则 null
  • budget.spent():本 turn 所有 agent 输出 token 之和(AgentRunResult.usageadapter 从 subagent usage 填)。
  • budget.remaining()max(0, total - spent),无 total 则 Infinity
  • 硬上限spent()total 后,agent() 抛错。预算是主循环与 workflow 共享池。

4.7 AgentRunResult 类型(types.ts

AgentRunner.runAgentToResult 的返回,包内明确定义为联合类型:

type AgentRunResult =
  | { kind: 'ok'; output: string | object; usage: { outputTokens: number } }
  | { kind: 'skipped' }   // 用户 skip → agent() 返回 null
  | { kind: 'dead' }      // 终态 API 错耗尽重试 → agent() 返回 null

outputstring(无 schema或已校验对象有 schemaagent() 据此映射:ok→返回 outputskipped/dead→返回 null

4.5 脚本包装与沙箱(script.ts

  1. 提取 export const meta = { … }——必须是纯字面量(无变量/插值/展开),解析为对象;缺失或非字面量 → 抛错。
  2. 剥离 export const meta 语句。
  3. 剩余 body含顶层 return)包进 async function(agent, parallel, pipeline, phase, log, workflow, args, budget, Date, Math){ <body> }
  4. 抛异常的 shim 传入 Datenow()/无参 new Date() 抛)、Mathrandom() 抛)——靠函数参数 shadow 全局,使裸 Date.now() 命中 shim。这是确定性保障非密码学级沙箱与真实引擎意图一致阻断 resume 破坏性的非确定性)。
  5. meta 的 phases 可用于进度预声明(可选)。

4.6 进度事件(progress/events.ts

ProgressEmitter.emit(event) 类型:run_startedphase_started/doneagent_started/done{label,phase,result摘要}logrun_done{returnValue/status}。adapter 写入 task 进度结构 + AppState/workflows 视图消费。

5. 错误处理

场景 行为
脚本无 meta / meta 非字面量 / 语法错 引擎抛错 → task failed → 通知带错误信息
Date.now/Math.random/new Date() shim 抛 → 冒泡为脚本错误 → task failed
agent() 终态 API 错(重试耗尽) 返回 null不杀 workflow
parallel/pipeline 单项抛错 该项 nullworkflow 继续
budget 耗尽 agent() 抛错(脚本可 try/catch
并发/1000/4096 上限 抛错
killabort signal 传播;agent() 检查 signalworkflow 停task killed;通知 partial
工具调用层(call)脚本非法 直接返回错误给模型(不进后台)

6. 测试策略

包内全量单测,无需真实 LLMmock 端口——解耦的核心收益):

  • engine.test.tsmock AgentRunner(按 prompt 返回预设结果)端到端跑脚本,断言返回值 + 进度事件序列。
  • hooks.test.tsparallel 单项错→null、pipeline 无屏障顺序、agent schema 校验、skip/dead→null。
  • concurrency.test.ts信号量限并发、1000/4096 上限抛错。
  • journal.test.tshash 稳定、resume 命中前缀、脚本变更全重跑、中途发散重跑尾部。
  • budget.test.tsspent 累加、触顶抛错。
  • script.test.tsmeta 字面量提取、非字面量/语法错、shim 抛。
  • structuredOutput.test.tsnamedWorkflows.test.ts

核心侧最小冒烟adapter 用 runAgent 真接线的重 mock 测试wiring 注册测试。重量级逻辑都在包内。可选:tests/integration/ 加一个 workflow tool-chain 集成测试feature-gated

7. 核心侧实现

7.1 adaptersrc/workflow/adapter.ts

createWorkflowAdapter() 返回端口实现:

  • AgentRunner.runAgentToResult(params, hostHandle)cast 句柄→{toolUseContext, canUseTool, assistantMessage};按 params.agentType 从 registry 解析 agentDefinition缺省=通用 workflow 子 agentassembleToolPool;有 schema→注入 StructuredOutput 工具+系统指令;调 runAgent 收消息→finalizeAgentTool 抽 text+usageschema→解析校验返回对象处理 pendingAgentAction(skip)→null、终态死亡→null;返回 {kind:'ok', text/object, usage}
  • ProgressEmitter:写 LocalWorkflowTaskState.progress + rootSetAppState
  • TaskRegistrar:复用现有 registerLocalWorkflowTask/complete/fail/kill + 读 pendingAgentAction
  • JournalStore / Logger / PermissionGatefs / logForDebugging+logEvent / abort+pendingAction。

7.2 wiringsrc/workflow/wiring.ts

  • createWorkflowTool():建 adapter → 调包的 createWorkflowTool(adapter) 得描述符 → 包成 buildTool 兼容 Tool 返回。
  • tools.tsconst WorkflowTool = feature('WORKFLOW_SCRIPTS') ? require('./workflow/wiring.js').createWorkflowTool() : null(替换现有清单版)。

call 流程校验脚本inline/file/named 解析)→ meta 校验失败直接返错给模型 → 持久化脚本 + 算 hash → resume 则载入 run+journal → 注册后台 task → 立即返回 {runId, scriptPath} → 脱离执行引擎、流进度 → 完成时 complete + 通知(返回值/错误)。

8. 现有文件迁移

文件 处理
builtin-tools/.../WorkflowTool/WorkflowTool.ts(清单版) 删除,逻辑移入新包
constants.tsWORKFLOW_TOOL_NAME 移入包 tool/constants.tscore 侧 re-export
WorkflowPermissionRequest.tsxReact UI 移到 src/workflow/(依赖 src 权限组件,属核心侧)
createWorkflowCommand.ts.md/.yaml 扫描) 改为扫 .ts/.js/.mjs → 生成 /<name> 命令,调用时以脚本启动引擎
bundled/index.tsno-op 保留为包的 bundled-workflow 扩展点
src/utils/workflowRuns.ts(清单记录) 重写为 run+journal 模型(或并入包 JournalStore
src/commands/workflows/index.ts 改为实时进度查看器,复用 WorkflowDetailDialog.tsx
src/tasks.ts LocalWorkflowTask 门控 保持不变
constants/tools.ts CORE_TOOLS 含 workflow 保持

9. 工作分解writing-plans 将细化)

  1. 新建包 packages/workflow-engine/package.json/tsconfig/类型/端口/常量)。
  2. 引擎核心script 包装、concurrency、journal、budget、structuredOutput、namedWorkflows。
  3. 钩子实现 + runWorkflow 编排 + 进度事件。
  4. 自包含工具描述符schema/desc/prompt/result 映射)。
  5. 包内全量单测。
  6. 核心侧 adapter + wiring + 句柄构造。
  7. 迁移现有文件、改 /workflows 为进度查看器、改 named-workflow 命令。
  8. bun run precheck 零错误;手动 dev 冒烟。

10. 非目标 / 风险

  • 非密码学沙箱:函数参数 shadow 全局 Date/MathglobalThis.Date 仍可达。可接受——目标是阻断 resume 破坏性的非确定性,不是隔离恶意代码。若未来需强隔离再上 vm/worker方案 B/C
  • resume 正确性依赖确定性执行:用户脚本若绕过 shim 用 globalThis.Date 制造非确定性resume 可能命中错缓存。属可接受的边界,文档提示。
  • 预算共享语义budget.spent() 与主循环的 token 计数共享,需 adapter 正确上报 subagent usage若 provider 不报 usage 则 budget 降级为 Infinity
  • StructuredOutput 工具:核心侧需存在/实现一个按 JSON Schema 强制结构化输出的子 agent 工具(注入 + 解析。若当前无现成实现wiring 阶段补一个最小版本。