# 【工程管理】基于 Harness Engineering 的 AI 辅助敏捷研发实践
# 一、案例摘要
摘要: 运营商在重保监控平台研发中,首次引入 Harness Engineering(驾驭工程)理念,将 AI 辅助编程与 Scrum 敏捷框架深度融合。通过为 AI Agent 定义角色边界、状态机、产物契约、护栏规则与质量门禁,解决了 AI 行为不确定、多智能体协同冲突、代码产出质量不可控等痛点。项目以“自定义场景管理及重保项目监控大屏”为载体,3 个 Sprint 完成从场景模板库、项目全生命周期管理到多级监控大屏的交付,研发效率提升 40%,AI 生成代码验证通过率达 92%。本案例为运营商网络 IT 软件研发探索出一条“人机共驾”的工程化实践路径。
# 二、关键词
关键词: Harness Engineering;AI 辅助敏捷;Scrum;重保监控;角色边界
# 三、案例正文
# (一)案例背景
面对重大活动网络保障中场景配置重复、监控大屏搭建周期长、告警响应不及时等挑战,项目团队采用 Harness Engineering 方法,在 Scrum 框架中嵌入 AI Agent 行为约束体系。通过上下文工程注入网络优化领域知识,通过架构约束(角色边界/状态机/产物契约)规范 AI 产出,通过持续治理(护栏规则/质量门禁)保障交付可靠性。实践表明,该模式使场景配置效率提升 8 倍,大屏搭建从 2 天缩短至 1 小时,为 AI 时代的软件工程提供了可复用的组织范式。以“无线数字化运营突击队”为例,具体成员及分工如下:
| 角色 | 核心职责 | Harness 相关职责 |
|---|---|---|
| Scrum Master | 组织敏捷仪式、回顾改进 | 评估 Harness 规则有效性,协调人-AI 协作 |
| Product Owner | 管理 Product Backlog、定义用户故事 | 为 AI 辅助任务编写 Harness 约束条件 |
| 前端 | 大屏界面、GIS 地图组件开发 | 与前端 AI Agent 协作,实现产物契约 |
| 前端 | 场景编辑器、组件库开发 | 实现栅格渲染组件,验证 AI 生成代码 |
| 后端 | 场景管理 API、网元圈选算法 | 设计 AI Agent 调度服务与状态机 |
| 后端 | 项目管理 API、状态流转引擎 | 实现产物契约验证逻辑 |
| 后端 | 大屏数据服务、WebSocket 推送 | 配置护栏规则(OPA 策略) |
| 测试 | 质量门禁脚本、Agent 产出验证 | 编写自动化验证用例,统计通过率 |
| 测试 | 端到端测试、性能测试 | 设计护栏规则测试套件 |
| 运维 | CI/CD 流水线、环境部署 | 集成 Harness MCP,部署 OPA 引擎 |
| 运维 | 可观测性监控、日志审计 | 采集 Agent 执行轨迹,配置告警 |
本项目为无线数字化运营平台中的“自定义场景管理及重保项目监控大屏”,面向网络优化人员,提供场景模板化配置、重保项目全生命周期管理、多级实时监控大屏三大核心能力。项目采用 Vue2 + ECharts + DuGIS + Spring Boot 技术栈,需在 6 周内完成 MVP 交付。团队决定引入 AI 辅助编程(Claud Code),同时采用 Harness Engineering 对 AI Agent 进行工程化约束,确保产出可靠、可审计。
# (二)案例描述
# 1. 敏捷策划方案
(1)Scrum 框架与 Harness 融合设计
团队在标准 Scrum(Sprint 周期 2 周)基础上,增加 Harness 治理层:
| Scrum 事件 | 融入的 Harness 活动 |
|---|---|
| Sprint Planning | 为每个用户故事标注所需 AI Agent 及约束条件(角色边界、护栏规则) |
| Daily Scrum | 同步 AI Agent 产出验证通过率、护栏触发次数、异常介入情况 |
| Sprint Review | 展示功能同时发布 Harness 质量报告(验证通过率、越权拦截率) |
| Sprint Retrospective | 评估角色边界是否清晰、产物契约是否有缺陷、护栏规则过松/过紧 |
(2)Harness 三层约束模型
- 上下文工程:构建网络优化知识库(指标定义、阈值规则、场景分类、GIS 渲染规范),通过 RAG 注入 AI Agent。
- 架构约束:
- 角色边界:代码生成 Agent 只产出代码不执行,测试 Agent 只验证不修改,运维 Agent 只部署不决策。
- 状态机:AI 任务必须经过“规划 → 执行 → 验证 → 完成/人工介入”标准化流转。
- 产物契约:AI 输出的代码片段、配置文件、测试用例必须符合预设 JSON Schema。
- 持续治理:
- 护栏规则:禁止 AI 修改核心配置文件、禁止生成未经审批的数据库变更、限制单次生成代码行数 ≤200 行。
- 质量门禁:AI 产出需通过静态扫描、单元测试、契约校验三层自动化验证。
(3)迭代规划
| Sprint | 目标 | AI 辅助任务 | 人类主导任务 |
|---|---|---|---|
| Sprint 1 | 场景管理基础功能(列表、创建、模板库) | 生成 CRUD 代码、表单组件、单元测试 | 架构设计、GIS 圈选算法、契约定义 |
| Sprint 2 | 重保项目全生命周期(创建、状态流转、场景关联) | 生成状态机代码、API 接口、前端页面 | 状态流转引擎、WebSocket 推送、护栏规则调优 |
| Sprint 3 | 大屏监控(GIS 地图、栅格渲染、下钻联动) | 生成地图组件、图表配置、告警列表 | 栅格渲染性能优化、实时数据管道、OPA 集成 |
# 2. 迭代过程及成果
Sprint 1(场景管理模块)
- AI 参与:Claud Code生成场景列表页、创建表单、模板库卡片;AI 测试 Agent 自动生成边界值测试用例。
- Harness 应用:
- 角色边界:AI 只生成前端组件代码,不触碰后端 API。
- 产物契约:要求 AI 输出的场景 JSON 必须包含
name, category, boundary.coordinates等字段。 - 护栏规则:禁止 AI 修改
package.json和路由配置;单次生成代码 ≤150 行。 - 质量门禁:前端编写脚本校验 AI 生成代码是否符合 ESLint 规则、是否包含
console.log。
- 成果:完成场景列表、从模板创建、空白创建、场景详情页;AI 生成代码验证通过率 88%(32/36 处合规)。Sprint Review 中Product Owner确认场景配置时间从 4 小时降至 30 分钟。
Sprint 2(重保项目管理)
- AI 参与:AI 生成项目 CRUD、状态流转组件、场景关联弹窗;AI 生成 OPA 护栏规则初稿。
- Harness 应用:
- 状态机:AI 生成的状态流转代码必须包含
待启动→备战→执行→收尾→已结束五态及回退逻辑。 - 护栏规则:新增“项目执行期不可删除场景”规则,由运维部署到 OPA 引擎。
- 质量门禁:测试人员编写端到端测试,验证状态流转时 AI 生成的代码是否正确触发通知。
- 状态机:AI 生成的状态流转代码必须包含
- 成果:完成项目列表、创建(含场景关联)、详情页、状态手动流转;AI 生成代码验证通过率提升至 91%。后端发现 AI 生成的场景关联 API 未校验重复关联,通过产物契约补充
uniqueConstraint字段后修复。
Sprint 3(大屏监控界面)
- AI 参与:AI 生成 GIS 地图初始化代码、ECharts 图表配置、告警列表组件;AI 辅助生成栅格渲染算法初版。
- Harness 应用:
- 上下文工程:前端构建“GIS 渲染规范”知识库(坐标系统、缩放层级、线条粗细),AI 据此生成地图代码。
- 角色边界:AI 不得修改地图底图 API 密钥,不得直接操作 DOM。
- 护栏规则:栅格渲染单次数据量超过 5000 网格时 AI 需自动分页加载;禁止 AI 生成未处理的异步错误。
- 质量门禁:测试和前端对 AI 生成的地图组件进行视觉回归测试,比对缩放层级、标注位置。
- 成果:完成项目总览大屏、场景监控大屏、栅格渲染、下钻联动;AI 生成代码验证通过率 94%。后端集成 Harness MCP 后,AI 辅助的部署验证自动回滚了 2 次有性能瓶颈的栅格渲染代码。
整体成果量化
| 指标 | Sprint 1 | Sprint 2 | Sprint 3 | 行业基准 |
|---|---|---|---|---|
| AI 代码生成占比 | 35% | 50% | 55% | — |
| 验证通过率 | 88% | 91% | 94% | 70%~80% |
| 单场景配置时间 | 30 分钟 | — | — | 4 小时(手工) |
| 大屏搭建周期 | — | — | 1 小时 | 2 天 |
| 告警推送延迟 | — | — | 8 秒 | 30 秒 |
| 人工介入次数 | 7 次 | 3 次 | 1 次 | — |
# (三)分析总结
# 执行总结
1. Harness Engineering 是 AI 辅助敏捷的“操作系统”
传统 Scrum 无法约束 AI Agent 的概率性行为。本项目通过角色边界(谁负责生成、谁负责验证)、状态机(任务必须经过验证才能完成)、产物契约(标准化输入输出)、护栏规则(禁止越权操作)、质量门禁(自动拦截不合格产出),将 AI 从“随机协作者”转变为“可预测工程单元”。团队每天站会用 1 分钟同步 AI 产出验证通过率,使问题暴露时间从周末回看提前到每日。
2. 护栏规则需要“松紧适度”并持续迭代
初期护栏过严(禁止 AI 生成任何 SQL),导致 AI 辅助效率低下;后期适当放开(允许生成 SELECT 但禁止 DELETE/UPDATE),并通过 OPA 策略动态调整。Sprint Retrospective 中,Scrum Master组织团队评估每条护栏规则的误拦截率,将“代码行数限制”从 150 行调整为 250 行(经实测 AI 生成 200 行左右代码质量最佳)。
3. 测试与运维成为 AI 时代的核心保障角色
测试人员从“手动测试”转型为“质量门禁设计师”,编写了 32 个自动化校验脚本;运维人员从“环境维护”升级为“可观测性架构师”,搭建了 AI Agent 执行轨迹监控看板。团队能力向高层次工程活动迁移。
4. 上下文工程是 AI 辅助研发的“燃料”
后端构建的网络知识库(含 28 种场景模板、46 个指标阈值、12 类告警规则)使 AI 生成的代码更贴合业务。当 AI 生成场景健康度算法时,自动引用知识库中的权重配置,避免了“幻觉阈值”。
5. 下一步演进方向
- 探索 AI Agent 自主修复质量门禁发现的缺陷(Harness 闭环)。
- 将 Harness 约束模板化,形成公司级 AI 研发规范。
- 推广至其他网络 IT 项目(如智能运维工单系统)。
结论: Harness Engineering 与 Scrum 的融合,不仅解决了 AI 辅助研发的工程化难题,更重塑了团队角色与协作模式。本实践为网络 IT 软件研发从“人写代码”向“人机共驾”转型提供了可复制的范式。