Harness-Engineering: la arquitectura de sistemas que potencia la eficacia de los agentes de IA
No es el modelo de IA en sí mismo, sino más bien la arquitectura del sistema —que abarca el contexto, las reglas y los bucles de retroalimentación— lo que determina el éxito de los agentes de IA autónomos.
La ingeniería de harnesses define las reglas, el contexto y la retroalimentación para los agentes de IA, lo que la convierte en una tecnología clave de los sistemas modernos de IA.
El término «harness» proviene originalmente de la hípica. Se refiere al arnés que se coloca al caballo para poder guiarlo correctamente. En el mundo de la ingeniería, un «harness» es, por lo tanto, la infraestructura para los agentes de IA que proporciona un marco a los modelos mediante restricciones, directrices y ciclos de retroalimentación. El modelo en sí es comparable a un caballo. Potente, pero necesita ser guiado. En esta metáfora, el ingeniero es el jinete que marca la dirección, pero no corre él mismo. La ingeniería de arneses consiste en el diseño y la implementación de sistemas que establecen límites arquitectónicos y definen reglas de dependencia. Se informa a los agentes de IA cuáles son sus tareas. El Harness proporciona la documentación y el contexto necesarios, verifica si una tarea se ha ejecutado correctamente y corrige a los agentes mediante bucles de retroalimentación. Los modelos de IA y los agentes inundan actualmente el mercado y la comunidad. La diferencia decisiva radica en la arquitectura del sistema que los rodea, ya que incluso pequeños cambios en ella pueden tener un gran impacto en los resultados, y todo ello sin tener que modificar el modelo en sí.
Index
Todo depende del marco
Open AI abordó este tema en agosto de 2025 en un experimento propio y publicó a principios de año un artículo al respecto que merece la pena leer.
Durante cinco meses, un equipo trabajó en una versión beta interna de un software, la desarrolló y la puso a disposición, sin escribir ni una sola línea de código. Todo el código, la lógica de la aplicación, las pruebas, la documentación y la supervisión fueron escritos por una herramienta interna. Los desarrolladores estiman que solo necesitaron una décima parte del tiempo que les habría llevado escribir el software manualmente. Al final, se generaron de esta manera más de un millón de líneas de código. La pregunta central que se planteó el equipo de Open AI ya no era: «¿Cómo escribo código que funcione en poco tiempo? », sino: «¿Qué entorno se necesita para alcanzar este objetivo con agentes de IA?». Así pues, la tarea consistía en diseñar un entorno adecuado, especificar la intención y establecer bucles de retroalimentación claramente definidos. Lo que comenzó con un repositorio Git vacío contiene ahora un millón de líneas de código, distribuidas entre la infraestructura, la lógica de la aplicación, la documentación, las herramientas de desarrollo y las propias herramientas.
Este ejemplo ilustra de manera impresionante por qué la ingeniería de harnesses es tan poderosa. Al mismo tiempo, pone de manifiesto un cambio fundamental en el manejo de los sistemas de IA. Mientras que la ingeniería de prompts pura tiene como objetivo optimizar interacciones individuales con un modelo, la ingeniería de harnesses se ocupa de la orquestación de sistemas completos.
El reto principal ya no consiste únicamente en formular prompts lo más buenos y precisos posible, sino en crear un entorno en el que los agentes de IA puedan trabajar de forma controlada, reproducible y eficiente. El suministro de contexto, los bucles de retroalimentación, las reglas y la observabilidad cobran así más importancia que el modelo por sí solo.
Para que la ingeniería de harnesses sea aplicable a gran escala, OpenAI ofrece además un marco que se divide en tres categorías: ingeniería de contexto, restricciones arquitectónicas y gestión de la entropía.
En la práctica, un harness consta de varios componentes técnicos que, en conjunto, definen el entorno de trabajo de los agentes de IA. Entre ellos se incluyen:
- Sistemas para el suministro de contexto y documentación
- Herramientas para la recuperación, el almacenamiento y el acceso al conocimiento
- Soluciones de observabilidad para registros, métricas y trazas
- Pipelines de evaluación y pruebas
- Sistemas de directrices y permisos
- Mecanismos para la distribución de tareas y la orquestación de agentes
- Sistemas de retroalimentación y revisión
Solo la interacción de estos componentes permite utilizar los agentes de IA de forma controlada en sistemas de software productivos y aprovechar todo su potencial. Este marco básico permite el uso del marco mencionado anteriormente.
Ingeniería de contexto
La ingeniería de contexto es la palanca para garantizar que los agentes de IA dispongan de la información adecuada en el momento adecuado. En este sentido, se distingue entre «contexto estático» y «contexto dinámico». Un ejemplo de contexto estático puede ser la documentación local del repositorio, es decir, los contratos de API o las guías de estilo. Por el contrario, el contexto dinámico incluye la asignación de la estructura de directorios al inicio de los agentes, así como datos de observabilidad como registros, métricas y trazas.
Restricciones arquitectónicas
Las condiciones marco establecidas aquí, como las reglas definidas por el usuario, los agentes que a su vez supervisan a otros agentes, las comprobaciones automatizadas antes de que se fije el código o las pruebas de estructura, imponen básicamente cómo debe ser el código. Estas restricciones ayudan a los agentes a llegar a una solución de forma más específica y a consumir menos tokens.
Gestión de la entropía
Con el tiempo, en las bases de código generadas por IA se acumula inevitablemente basura de datos. Para tener en cuenta este hecho, aquí también se utilizan agentes. Algunos comprueban la coherencia de la documentación, otros imponen el uso de patrones predefinidos. Otros, a su vez, escanean el código que no fue marcado en comprobaciones anteriores y que no cumple con las especificaciones. Estos agentes trabajan periódicamente y se encargan de la «limpieza interna».
Con la creciente difusión de los agentes de IA autónomos, el papel del desarrollo de software también está cambiando de forma fundamental. El enfoque se desplaza gradualmente de la escritura manual de implementaciones individuales hacia la orquestación de sistemas inteligentes. Los desarrolladores definen cada vez menos cada solución concreta por sí mismos, sino que diseñan las condiciones marco dentro de las cuales pueden trabajar los agentes de IA.
En el futuro, la tarea del ingeniero consistirá en mayor medida en formular objetivos, reglas y restricciones. Los principios de arquitectura, las directrices de seguridad, los requisitos de calidad y los mecanismos de retroalimentación se convertirán en componentes centrales del trabajo de desarrollo. La escritura propiamente dicha de código se está convirtiendo cada vez más en un proceso de ejecución automatizado dentro de un sistema controlado.
La ingeniería de harnesses se convierte así en una competencia clave del desarrollo de software moderno. No es el modelo individual el que determina la calidad de un sistema, sino la capacidad de proporcionar contexto, coordinar agentes y evaluar continuamente sus resultados.
Cuanto más potentes se vuelven los modelos de IA y cuanto más se homogeneizan tecnológicamente, más importante se vuelve la arquitectura del sistema en torno a estos modelos. El harness pasa así de ser una herramienta de apoyo a convertirse en el propio sistema de producción para los agentes de IA. Por lo tanto, a medida que los modelos de IA se convierten cada vez más en un producto básico intercambiable, es el harness el que, en última instancia, determina la calidad, la seguridad y la escalabilidad de los sistemas autónomos, y la ingeniería de harnesses puede aportar una valiosa contribución como siguiente etapa de la evolución.

Los comentarios están cerrados.