Harness Engineering Presentation

Presentación interactiva (14 slides, ~40-50 min) sobre harness engineering: la disciplina que reformula cómo construimos agentes de IA tras los papers de marzo 2026 (NLAH de Tsinghua y Meta-Harness de Stanford).

Live: codigosinsiesta.github.io/harness-engineering-presentation

Tesis

Mismo modelo. Mismo benchmark. 6× de diferencia en rendimiento. La diferencia ya no la marca el modelo, la marca el harness.

Stack

Astro 5 + Svelte 5 + TypeScript estricto
Tailwind CSS 4 + tokens propios del sistema V4 "dark blueprint" de Código Sin Siesta
GSAP 3 para animaciones de entrada/salida + animateLineDraw para SVG
Diagramas SVG propios animados (no se reutilizan capturas del vídeo de origen)

Slides (14)

Hero — título, autor, badges (NLAH · Meta-Harness · Tsinghua · Stanford · 2026).
El gap del 6× — la tesis en cifras.
Agent = Model + Harness — la ecuación + analogía sistema operativo.
5 patrones canónicos — diagramas SVG animados de prompt chaining, routing, parallelization, orch-workers, eval-optimizer.
Antes: el caos — System A vs B, dos modos de fallo (One-Shotting / Premature Completion).
NLAH (Tsinghua) — arquitectura en 3 capas: NLAH (SWAP) / Charter (FIXED) / Backend.
+16.8 puntos sin tocar lógica — el experimento de migración OS-Symphony → NLAH.
Ablation Surprise — disciplined narrowing > expensive broadening.
Meta-Harness (Stanford) — el loop de optimización automática (Proposer → Evaluator → Filesystem).
La transferibilidad — 1 harness optimizado → 5 modelos → todos mejoran.
Las tres eras — animación de cajas anidadas: Prompt → Context → Harness.
El oficio de sustracción — Vercel (−80% tools), Manus (5 reescrituras), Anthropic (eliminó context resets).
5 conclusiones — qué propone realmente el campo.
Cierre — recursos + autor.

Desarrollo

pnpm install
pnpm dev          # → http://localhost:4327/harness-engineering-presentation
pnpm build        # type-check + build estático en dist/

Notas de ponente

Cada slide tiene su guia/NN-slug.md con: tesis, mensajes clave, cross-refs al wiki, anécdotas, preguntas tipo, transiciones.

Fuentes

Pan et al. — Natural-Language Agent Harnesses — Tsinghua, marzo 2026.
Khattab et al. — Meta-Harness — Stanford, marzo 2026.
DeepMind — AutoHarness — 2025.
AgentSpec DSL — ICSE 2026.
PY (YouTube, abril 2026) — síntesis del campo.

Autor

Alejandro de la Fuente · Tech Lead · NTT Data · GDNE tellmealex.dev · GitHub · LinkedIn

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.github/workflows		.github/workflows
guia		guia
public		public
src		src
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
README.md		README.md
astro.config.mjs		astro.config.mjs
package.json		package.json
pnpm-lock.yaml		pnpm-lock.yaml
postcss.config.mjs		postcss.config.mjs
tailwind.config.mjs		tailwind.config.mjs
tsconfig.json		tsconfig.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Harness Engineering Presentation

Tesis

Stack

Slides (14)

Desarrollo

Notas de ponente

Fuentes

Autor

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Harness Engineering Presentation

Tesis

Stack

Slides (14)

Desarrollo

Notas de ponente

Fuentes

Autor

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages