核心理念

Harness Engineering,
扎根于软件巨人的肩膀。

行业已经从 Prompt Engineering 演进到 Context Engineering,再到 Harness Engineering。OpenLogos 是面向软件开发的 Harness Engineering 最佳实践——建立在 40 多年久经沙场的理论之上,为 AI agent 写代码的时代重新编译。

Agent = 模型 + Harness

模型之外的一切——系统提示词、工具集成、文件系统、编排逻辑、约束——都是 Harness。优秀的 harness engineering 让 AI agent 变得可靠、可追溯、可控。

第 1 层

Prompt Engineering

如何把话说清楚——指令设计与表达。

第 2 层

Context Engineering

如何递交正确的信息——上下文的筛选与投递。

第 3 层

Harness Engineering

如何让 AI 可靠地执行——编排、护栏与持续运行。

OpenLogos 如何实现 Harness 的每一层

1. 信息边界
角色定义与职责范围
OpenLogos: AGENTS.md + logos-project.yaml —— AI 的 GPS,定义项目规则、当前阶段以及该读什么。
2. 工具系统
外部交互与能力
OpenLogos: 14 个 AI Skills(SKILL.md)—— 平台无关的 Markdown 文件,引导 AI 走过每个开发阶段。
3. 执行编排
多步骤排序与调度
OpenLogos: WHY → WHAT → HOW 三层推进 + 阶段之间的 Stage-Gate 质量门。
4. 记忆与状态
中间结果与持久化上下文
OpenLogos: logos/ 目录 —— 文档即上下文。每个阶段的产出都成为下一阶段的输入。
5. 评估与观测
验证与质量度量
OpenLogos: openlogos verify —— 三层可追溯性 + test-results.jsonl 自动化验收。
6. 约束与恢复
错误处理与变更控制
OpenLogos: Delta 变更管理 —— change proposalmergearchive。安全、可审计的迭代。

Harness 背后的工程理论

OpenLogos 的 Harness 建立在成熟的工程理论之上。每一根支柱都为 Harness 的某一层提供动力。没有任何一处是凭空设计的。

BDD 2006 · Dan North

行为驱动开发

GIVEN/WHEN/THEN 验收标准。以面向用户的场景作为唯一事实来源。

映射到: Phase 1 需求、场景结构
TDD 2003 · Kent Beck

测试驱动开发

先写测试,再写代码。Red → Green → Refactor。测试定义契约。

映射到: Phase 3 Step 3 测试先行、openlogos verify
DDD 2003 · Eric Evans

领域驱动设计

统一语言。限界上下文。领域模型驱动架构。

映射到: Phase 3 Step 0 架构、场景建模
Stage-Gate 1986 · Robert Cooper

Stage-Gate 流程

阶段之间设质量门。每道门在放行前都有明确的通过/不通过标准。

映射到: 三层推进的质量门、Gate 3.5 验收
Docs-as-Code 2014 · Write the Docs

文档即代码

纳入版本控制的文档。用对待源代码同样的严谨标准对待文档。

映射到: 文档即上下文、logos/ 目录
Skills AI 原生范式

可执行的方法论

把方法论编码成 Markdown 文件,让 AI agent 自动读取并执行。

映射到: AI Skills(SKILL.md)、AGENTS.md

理论不是负担——而是杠杆

01

可预测性

这些实践经过数十年、数百万个项目的验证。当你把它们用于 AI 辅助开发时,你得到的是可预测的结果——而不是随机游走。

02

可组合性

BDD + TDD + DDD + Stage-Gate 天然可以组合。BDD 定义场景,TDD 验证场景,DDD 为场景建模,Stage-Gate 保障阶段间的质量。OpenLogos 把它们串接在一起。

03

可教性

相比临时拼凑的指令,AI agent 能从成熟范式中学得更高效。当你说"用 GIVEN/WHEN/THEN"时,AI 立刻理解这个范式,因为它在数百万训练样本中反复出现过。

回应质疑者

"这不就是瀑布模型吗?"

不是。瀑布模型先把所有需求排完,再做任何设计,再写任何代码。OpenLogos 是按场景排序的。S01 可以已经进入 Phase 3,而 S04 还停留在 Phase 1。这些阶段是一个推进模型,不是时间表。

"AI 本应很快。这反而增加了流程。"

一个 5 分钟的提示词产出一堆垃圾、让你 debug 3 小时,那不叫快。一个 30 分钟的结构化流程一次性产出正确、经过测试、可追溯的代码,那才真的快。速度的衡量单位是交付的功能,而不是生成的 token。

"这对小项目来说是过度工程。"

OpenLogos 可以优雅地向下伸缩。个人项目可以跳过 HTML 原型阶段。一个周末小项目可以把 Phase 1 + 2 压缩进一份文档。方法论是一套工具箱——按需取用即可。

"为什么不直接用敏捷(Agile)?"

敏捷假设开发者是人类,能把上下文记在脑子里。AI 没有脑子——它需要把上下文写下来。OpenLogos 与敏捷兼容,但坚持上下文显式化,因为这正是 AI 所需要的。

"Harness Engineering 和 OpenLogos 有什么区别?"

Harness Engineering 是一门学科——它定义了一个工程良好的 AI agent 系统需要什么:边界、工具、编排、记忆、评估和约束。OpenLogos 是这门学科的一个最佳实践实现,专门面向软件开发。Harness Engineering 是理论,OpenLogos 是实践。

准备好亲自试试了吗?

两条命令。五分钟。从第一天起就用对的方式构建项目。