# 【工程管理】基于 Harness Engineering 的 AI 辅助敏捷研发实践

# 一、案例摘要

摘要: 运营商在重保监控平台研发中,首次引入 Harness Engineering(驾驭工程)理念,将 AI 辅助编程与 Scrum 敏捷框架深度融合。通过为 AI Agent 定义角色边界、状态机、产物契约、护栏规则与质量门禁,解决了 AI 行为不确定、多智能体协同冲突、代码产出质量不可控等痛点。项目以“自定义场景管理及重保项目监控大屏”为载体,3 个 Sprint 完成从场景模板库、项目全生命周期管理到多级监控大屏的交付,研发效率提升 40%,AI 生成代码验证通过率达 92%。本案例为运营商网络 IT 软件研发探索出一条“人机共驾”的工程化实践路径。

# 二、关键词

关键词: Harness Engineering;AI 辅助敏捷;Scrum;重保监控;角色边界

# 三、案例正文

# (一)案例背景

面对重大活动网络保障中场景配置重复、监控大屏搭建周期长、告警响应不及时等挑战,项目团队采用 Harness Engineering 方法,在 Scrum 框架中嵌入 AI Agent 行为约束体系。通过上下文工程注入网络优化领域知识,通过架构约束(角色边界/状态机/产物契约)规范 AI 产出,通过持续治理(护栏规则/质量门禁)保障交付可靠性。实践表明,该模式使场景配置效率提升 8 倍,大屏搭建从 2 天缩短至 1 小时,为 AI 时代的软件工程提供了可复用的组织范式。以“无线数字化运营突击队”为例,具体成员及分工如下:

角色 核心职责 Harness 相关职责
Scrum Master 组织敏捷仪式、回顾改进 评估 Harness 规则有效性,协调人-AI 协作
Product Owner 管理 Product Backlog、定义用户故事 为 AI 辅助任务编写 Harness 约束条件
前端 大屏界面、GIS 地图组件开发 与前端 AI Agent 协作,实现产物契约
前端 场景编辑器、组件库开发 实现栅格渲染组件,验证 AI 生成代码
后端 场景管理 API、网元圈选算法 设计 AI Agent 调度服务与状态机
后端 项目管理 API、状态流转引擎 实现产物契约验证逻辑
后端 大屏数据服务、WebSocket 推送 配置护栏规则(OPA 策略)
测试 质量门禁脚本、Agent 产出验证 编写自动化验证用例,统计通过率
测试 端到端测试、性能测试 设计护栏规则测试套件
运维 CI/CD 流水线、环境部署 集成 Harness MCP,部署 OPA 引擎
运维 可观测性监控、日志审计 采集 Agent 执行轨迹,配置告警

本项目为无线数字化运营平台中的“自定义场景管理及重保项目监控大屏”,面向网络优化人员,提供场景模板化配置、重保项目全生命周期管理、多级实时监控大屏三大核心能力。项目采用 Vue2 + ECharts + DuGIS + Spring Boot 技术栈,需在 6 周内完成 MVP 交付。团队决定引入 AI 辅助编程(Claud Code),同时采用 Harness Engineering 对 AI Agent 进行工程化约束,确保产出可靠、可审计。

# (二)案例描述

# 1. 敏捷策划方案

(1)Scrum 框架与 Harness 融合设计

团队在标准 Scrum(Sprint 周期 2 周)基础上,增加 Harness 治理层:

Scrum 事件 融入的 Harness 活动
Sprint Planning 为每个用户故事标注所需 AI Agent 及约束条件(角色边界、护栏规则)
Daily Scrum 同步 AI Agent 产出验证通过率、护栏触发次数、异常介入情况
Sprint Review 展示功能同时发布 Harness 质量报告(验证通过率、越权拦截率)
Sprint Retrospective 评估角色边界是否清晰、产物契约是否有缺陷、护栏规则过松/过紧

(2)Harness 三层约束模型

  • 上下文工程:构建网络优化知识库(指标定义、阈值规则、场景分类、GIS 渲染规范),通过 RAG 注入 AI Agent。
  • 架构约束
    • 角色边界:代码生成 Agent 只产出代码不执行,测试 Agent 只验证不修改,运维 Agent 只部署不决策。
    • 状态机:AI 任务必须经过“规划 → 执行 → 验证 → 完成/人工介入”标准化流转。
    • 产物契约:AI 输出的代码片段、配置文件、测试用例必须符合预设 JSON Schema。
  • 持续治理
    • 护栏规则:禁止 AI 修改核心配置文件、禁止生成未经审批的数据库变更、限制单次生成代码行数 ≤200 行。
    • 质量门禁:AI 产出需通过静态扫描、单元测试、契约校验三层自动化验证。

(3)迭代规划

Sprint 目标 AI 辅助任务 人类主导任务
Sprint 1 场景管理基础功能(列表、创建、模板库) 生成 CRUD 代码、表单组件、单元测试 架构设计、GIS 圈选算法、契约定义
Sprint 2 重保项目全生命周期(创建、状态流转、场景关联) 生成状态机代码、API 接口、前端页面 状态流转引擎、WebSocket 推送、护栏规则调优
Sprint 3 大屏监控(GIS 地图、栅格渲染、下钻联动) 生成地图组件、图表配置、告警列表 栅格渲染性能优化、实时数据管道、OPA 集成

# 2. 迭代过程及成果

Sprint 1(场景管理模块)

  • AI 参与:Claud Code生成场景列表页、创建表单、模板库卡片;AI 测试 Agent 自动生成边界值测试用例。
  • Harness 应用
    • 角色边界:AI 只生成前端组件代码,不触碰后端 API。
    • 产物契约:要求 AI 输出的场景 JSON 必须包含name, category, boundary.coordinates等字段。
    • 护栏规则:禁止 AI 修改package.json和路由配置;单次生成代码 ≤150 行。
    • 质量门禁:前端编写脚本校验 AI 生成代码是否符合 ESLint 规则、是否包含console.log
  • 成果:完成场景列表、从模板创建、空白创建、场景详情页;AI 生成代码验证通过率 88%(32/36 处合规)。Sprint Review 中Product Owner确认场景配置时间从 4 小时降至 30 分钟。

Sprint 2(重保项目管理)

  • AI 参与:AI 生成项目 CRUD、状态流转组件、场景关联弹窗;AI 生成 OPA 护栏规则初稿。
  • Harness 应用
    • 状态机:AI 生成的状态流转代码必须包含待启动→备战→执行→收尾→已结束五态及回退逻辑。
    • 护栏规则:新增“项目执行期不可删除场景”规则,由运维部署到 OPA 引擎。
    • 质量门禁:测试人员编写端到端测试,验证状态流转时 AI 生成的代码是否正确触发通知。
  • 成果:完成项目列表、创建(含场景关联)、详情页、状态手动流转;AI 生成代码验证通过率提升至 91%。后端发现 AI 生成的场景关联 API 未校验重复关联,通过产物契约补充uniqueConstraint字段后修复。

Sprint 3(大屏监控界面)

  • AI 参与:AI 生成 GIS 地图初始化代码、ECharts 图表配置、告警列表组件;AI 辅助生成栅格渲染算法初版。
  • Harness 应用
    • 上下文工程:前端构建“GIS 渲染规范”知识库(坐标系统、缩放层级、线条粗细),AI 据此生成地图代码。
    • 角色边界:AI 不得修改地图底图 API 密钥,不得直接操作 DOM。
    • 护栏规则:栅格渲染单次数据量超过 5000 网格时 AI 需自动分页加载;禁止 AI 生成未处理的异步错误。
    • 质量门禁:测试和前端对 AI 生成的地图组件进行视觉回归测试,比对缩放层级、标注位置。
  • 成果:完成项目总览大屏、场景监控大屏、栅格渲染、下钻联动;AI 生成代码验证通过率 94%。后端集成 Harness MCP 后,AI 辅助的部署验证自动回滚了 2 次有性能瓶颈的栅格渲染代码。

整体成果量化

指标 Sprint 1 Sprint 2 Sprint 3 行业基准
AI 代码生成占比 35% 50% 55%
验证通过率 88% 91% 94% 70%~80%
单场景配置时间 30 分钟 4 小时(手工)
大屏搭建周期 1 小时 2 天
告警推送延迟 8 秒 30 秒
人工介入次数 7 次 3 次 1 次

# (三)分析总结

# 执行总结

1. Harness Engineering 是 AI 辅助敏捷的“操作系统”

传统 Scrum 无法约束 AI Agent 的概率性行为。本项目通过角色边界(谁负责生成、谁负责验证)、状态机(任务必须经过验证才能完成)、产物契约(标准化输入输出)、护栏规则(禁止越权操作)、质量门禁(自动拦截不合格产出),将 AI 从“随机协作者”转变为“可预测工程单元”。团队每天站会用 1 分钟同步 AI 产出验证通过率,使问题暴露时间从周末回看提前到每日。

2. 护栏规则需要“松紧适度”并持续迭代

初期护栏过严(禁止 AI 生成任何 SQL),导致 AI 辅助效率低下;后期适当放开(允许生成 SELECT 但禁止 DELETE/UPDATE),并通过 OPA 策略动态调整。Sprint Retrospective 中,Scrum Master组织团队评估每条护栏规则的误拦截率,将“代码行数限制”从 150 行调整为 250 行(经实测 AI 生成 200 行左右代码质量最佳)。

3. 测试与运维成为 AI 时代的核心保障角色

测试人员从“手动测试”转型为“质量门禁设计师”,编写了 32 个自动化校验脚本;运维人员从“环境维护”升级为“可观测性架构师”,搭建了 AI Agent 执行轨迹监控看板。团队能力向高层次工程活动迁移。

4. 上下文工程是 AI 辅助研发的“燃料”

后端构建的网络知识库(含 28 种场景模板、46 个指标阈值、12 类告警规则)使 AI 生成的代码更贴合业务。当 AI 生成场景健康度算法时,自动引用知识库中的权重配置,避免了“幻觉阈值”。

5. 下一步演进方向

  • 探索 AI Agent 自主修复质量门禁发现的缺陷(Harness 闭环)。
  • 将 Harness 约束模板化,形成公司级 AI 研发规范。
  • 推广至其他网络 IT 项目(如智能运维工单系统)。

结论: Harness Engineering 与 Scrum 的融合,不仅解决了 AI 辅助研发的工程化难题,更重塑了团队角色与协作模式。本实践为网络 IT 软件研发从“人写代码”向“人机共驾”转型提供了可复制的范式。