Volver a Proyectos

Agente IA Autónomo

Generador de código con LLM local, validación multicapa y memoria de errores

Descripción General

Sistema agente que genera código Python de forma autónoma usando un modelo de lenguaje local (Ollama con qwen2.5-coder:7b), valida el resultado en múltiples capas y, si falla, aprende del error para evitar repetirlo en el siguiente intento.

La característica más avanzada es el bucle de feedback con memoria: el agente analiza el mensaje de error, lo convierte en una instrucción comprensible para el LLM y lo inyecta en el prompt del siguiente intento. Esto simula un ciclo de aprendizaje iterativo similar al Reinforcement Learning from Human Feedback, pero automatizado.

Tecnologías Utilizadas


Python 3

Ollama LLM

AST Module

subprocess

REST API

Sistema de Validación Multicapa

  • Capa 1 — Sintaxis: Parseo con ast.parse() — detecta errores de sintaxis Python antes de ejecutar
  • Capa 2 — Seguridad: Blacklist de funciones peligrosas (eval, exec, os.system, subprocess…) y whitelist de imports permitidos
  • Capa 3 — Ejecución: Ejecuta el código en un subprocess aislado con timeout de 5 segundos
  • Capa 4 — Semántica: Valida la salida del programa (palabras clave esperadas, código de retorno)

Sistema de Memoria de Errores

El agente acumula errores y los inyecta en el prompt de cada nuevo intento:

Intento 1 → genera código → falla (EOFError) → registra: "No uses input() sin controlar EOFError" Intento 2 → prompt incluye error anterior → genera nuevo código → falla (timeout) → registra: "El programa no debe quedarse esperando" Intento 3 → prompt incluye ambos errores → genera código correcto ✅

El análisis de errores traduce mensajes técnicos en instrucciones legibles para el LLM de forma automática.

Progresión del Proyecto

  • 002 — Agente mínimo: Genera código simple y lo guarda en archivo
  • 003 — Validador: Añade validación de sintaxis, seguridad y ejecución
  • 004 — Reto mayor: Genera CRUD completo con SQLite, whitelist de imports
  • 005 — Memoria de errores: Bucle de feedback con aprendizaje iterativo (versión final)
  • 009 — Agente de análisis: Recorre el sistema de archivos y resume código con IA

Mi Rol

Diseñador del Sistema y Desarrollador Python

Diseñé la arquitectura del agente, el sistema de validación multicapa, el mecanismo de memoria y el análisis semántico de errores. El mayor reto fue convertir mensajes de error técnicos en instrucciones útiles para un LLM, cerrando el bucle de feedback de forma completamente autónoma.

Estado

Estado: ⚡ Proyecto de Aprendizaje

Proyecto académico que explora sistemas agente autónomos con LLMs locales, validación de código generado por IA y bucles de feedback iterativos.