内部技术分享 / 2026-04-19
不是调 prompt,是把 AI 当成团队成员,
给它一个完整的工作环境。
agenda.toml
// background
早期:怎么让模型听我的话?
核心技能:写好提示词。
中期:怎么给模型最好的上下文?
核心技能:RAG、上下文压缩。
现在:怎么让 AI 靠谱地工作?
核心技能:软件工程 + AI 协同。
Harness 的本质:不是新技术,是软件工程全流程自动化
// what-is-harness
以前:人写代码 → 人跑测试 → 人 Review → 人部署
现在:AI 写代码 → Harness 兜底 → 人 Review → 流水线打包
// three-primitives
每个 Agent 有独立的工作空间。
Git submodule + 独立环境,
冲突在结构上不可能发生。
Agent 不擅长"帮我搞这个模块"。
擅长的是:你给我边界,
给我验收标准。
多 Agent 并行工作。
Supervisor 分配任务,
Worker 执行,Reviewer 审查。
隔离是前提 → 分解是基础 → 协调是最后一环
// feedback-loop
关键原则:反馈环路越短越精准,问题在第一层被拦住成本最低
// implementation · skill
SKILL 把运维经验封装成 AI 可调用的工具。
// implementation · openspec + mcp
每需求 → Proposal → Spec → Task List → 归档
AI 可以直接读生产数据、做 API 测试、执行部署 — 不需要人来回切换工具
// implementation · multi-agent
MiniMax 模型
Oh My ClaudeCode
20+ 专项 Agent
Qwen 模型
50+ SKILL
项目定制能力
GPT-5.4 模型
SuperPower 技能
全流程覆盖
AI Code Review 已实际运行:资源组模块 → 发现 4 个严重问题 + 3 个高/中问题
代码生成速度 >> 人 Review 速度 → 所以让 AI Review AI
// implementation · code-standards
AGENTS.md 定义了团队约定,让 AI 知道什么该做、什么不该做。
// results
需求分析 + 设计 + 开发 + 单测 + API 测试 + 部署预估:12 人天
AI 生成 + Harness 兜底 + 人 Review
预估:4 人天
// gaps
// limitations
AI 代码生成速度 >> 人 Review 速度。
所以业界有了 AI Review AI。
AI 是工具,不是大脑。
Harness 是让 AI 靠谱 的工程手段,
不是让 AI 自主 的自动驾驶。
// summary
欢迎提问,一起探讨 AI 辅助开发的实践