Multi-agente IA local: LangGraph, CrewAI y AutoGen

multiagente ia-local ollama

Un modelo de lenguaje puede resumir un documento, redactar un correo o clasificar consultas de soporte. Pero la mayoría de los procesos empresariales reales implican varios pasos encadenados: leer un contrato, extraer las obligaciones clave, contrastar con una base de datos interna y generar un informe estructurado. Para estos flujos de trabajo de múltiples etapas, una única llamada a un LLM rara vez es suficiente.

Aquí es donde entran en juego los frameworks de orquestación multi-agente. En los últimos meses, tres herramientas de código abierto han alcanzado la madurez necesaria para su uso en producción: LangGraph, CrewAI y AutoGen. Las tres funcionan completamente en local, las tres se conectan a Ollama con modelos abiertos, y ninguna requiere suscripción a una API de nube ni costes por token.

Esta semana, un post de @PythonDv en X que generó amplia discusión en la comunidad lo resumía así: "You don't need to spend a single dollar to build a production AI system in 2026" — con LangGraph o CrewAI como capa de orquestación (fuente). Para las PYMEs europeas, la pregunta práctica no es si estos frameworks funcionan, sino cuál se adapta mejor a cada caso de uso.

LangGraph: Control preciso para flujos de trabajo en producción

LangGraph, desarrollado por el equipo de LangChain, modela los flujos de agentes como un grafo dirigido. Cada nodo es un paso de procesamiento o una llamada a un agente; las aristas definen las transiciones, ramificaciones y bucles. Esta estructura proporciona un control granular sobre lo que ocurre en cada paso del proceso.

Fortalezas:

  • Control total sobre procesos complejos y ramificados — sin comportamientos ocultos
  • Gestión explícita del estado: cada paso puede registrarse, inspeccionarse y repetirse para depuración
  • Amplia comunidad y documentación madura
  • Ideal para procesos donde la trazabilidad es un requisito (cumplimiento, finanzas, legal)

Limitaciones:

  • Curva de aprendizaje más pronunciada que CrewAI; más código de configuración para tareas simples
  • Acoplamiento estrecho con el ecosistema LangChain

Integración con Ollama: LangGraph conecta con Ollama a través de la clase ChatOllama. Basta con configurar base_url: http://localhost:11434 para enrutar todas las llamadas al LLM local. Según mediciones reportadas por la comunidad, Llama 3.3 70B en un Mac Studio M3 Ultra (192 GB de memoria unificada) entrega aproximadamente 18–28 tokens/s, suficiente para flujos de trabajo empresariales interactivos.

CrewAI: Agentes por roles para prototipos rápidos

CrewAI organiza los agentes en torno a una metáfora intuitiva: una "tripulación" de agentes con roles, objetivos y herramientas definidos. Un agente de investigación, un agente de redacción, un agente de revisión de calidad — cada uno tiene su misión, y CrewAI gestiona la coordinación. Esta abstracción facilita que personas sin conocimientos profundos de infraestructura IA puedan diseñar y comprender los flujos.

Fortalezas:

  • La API más sencilla de los tres frameworks — primeros prototipos en horas
  • La metáfora de roles se corresponde de forma natural con estructuras de equipo existentes
  • Ejecución paralela de agentes fácil de configurar
  • Ideal para equipos sin experiencia previa en LangChain

Limitaciones:

  • Menos control sobre el flujo de ejecución que LangGraph en procesos complejos
  • La lógica condicional muy anidada puede volverse difícil de gestionar

Integración con Ollama: CrewAI soporta Ollama de forma nativa mediante el prefijo de modelo ollama/. No se requiere configuración adicional de LangChain, lo que simplifica el setup inicial.

AutoGen (Microsoft Research): Colaboración conversacional entre agentes

AutoGen modela los flujos multi-agente como una conversación entre agentes especializados que intercambian mensajes hasta llegar a un resultado — similar a una discusión estructurada entre expertos. Desde la versión 0.4, AutoGen admite endpoints compatibles con OpenAI, por lo que Ollama funciona como backend local sin modificaciones en el código.

Fortalezas:

  • Ideal para tareas que requieren iteración: revisión de código, síntesis de investigación, análisis con múltiples perspectivas
  • Soporte nativo para "human-in-the-loop" — un humano puede intervenir en la conversación entre agentes en cualquier momento
  • Buena integración con VS Code y el entorno de desarrollo de Microsoft

Limitaciones:

  • El enfoque conversacional consume más tokens por tarea que los frameworks basados en grafo en flujos largos
  • La depuración de conversaciones entre agentes complejas requiere más esfuerzo

Integración con Ollama: AutoGen acepta cualquier endpoint compatible con OpenAI. Ollama se configura como proxy local en la sección model_client — sin cambios de código más allá de la URL del endpoint.

¿Qué framework elegir para cada caso de uso en una PYME?

Caso de uso Recomendación Motivo
Procesamiento de documentos multietapa LangGraph Control preciso, logging confiable
Producción de contenido, pipelines de investigación CrewAI Metáfora de roles, desarrollo más rápido
Análisis iterativo, revisión de código AutoGen Lógica conversacional, human-in-the-loop
Primer piloto (equipo sin perfil técnico) CrewAI Menor barrera de entrada
Flujos críticos en producción LangGraph Reproducibilidad, inspección del estado

Para la mayoría de las PYMEs que comienzan con IA multi-agente, CrewAI es la mejor opción para un primer piloto: produce resultados visibles rápidamente y la estructura de roles encaja bien con cómo los equipos piensan sus procesos. Una vez que el flujo avanza hacia producción y la fiabilidad es un requisito, el esfuerzo adicional de configuración de LangGraph se compensa con la predictibilidad y la capacidad de depuración.

Soberanía de datos: sin nube, sin transferencia de datos, sin riesgo de cumplimiento

Con un stack multi-agente completamente local, ningún dato abandona la red de la empresa: ni los documentos que procesan los agentes, ni las consultas al modelo de lenguaje, ni los resultados intermedios que se pasan entre agentes. Esta es la diferencia arquitectónica fundamental respecto a servicios de agentes en la nube.

Para empresas sujetas al RGPD, esto tiene implicaciones concretas:

  • No es necesario un contrato de encargo de tratamiento con un proveedor de modelos en la nube
  • Sin exposición a incidentes de seguridad en la infraestructura de terceros
  • Sin riesgo de que datos empresariales sensibles acaben en pipelines de entrenamiento de modelos externos

Según nuestra interpretación del Reglamento General de Protección de Datos y del Reglamento de IA de la UE, las empresas que operan exclusivamente con modelos open-weight locales sin llamadas a APIs de terceros se encuentran en una posición regulatoria notablemente favorable — especialmente de cara a las obligaciones de los operadores que entran en vigor en agosto de 2026. Más información en nuestra sección sobre soberanía de datos.

Kit Digital: IA local como inversión subvencionable

Para PYMEs españolas, vale la pena mencionar el programa Kit Digital: según nuestra interpretación de las bases actuales, la implantación de soluciones de IA que mejoren procesos internos puede encuadrarse en categorías como "Gestión de procesos" o "Comercio electrónico inteligente". La asesoría especializada para valorar la elegibilidad de una solución de IA local bajo el marco Kit Digital es parte de lo que ofrecemos en Freshlab.

Hardware recomendado y modelos

Según mediciones reportadas por la comunidad practitioner:

  • Nivel de entrada (Llama 3.2 11B, Gemma 3 12B, Mistral Small 4 22B): MacBook Pro M3/M4 con 32–36 GB de memoria unificada; 20–45 tokens/s reportados
  • Nivel medio (Llama 3.3 70B, Qwen 2.5 72B): Mac Studio M3/M4 con 64–192 GB; 18–30 tokens/s reportados
  • Cargas intensivas (modelos 70B en Q8 o modelos MoE grandes): Mac Studio M3/M4 Ultra 192 GB o NVIDIA RTX 6000 Ada (48 GB VRAM)

Para los flujos de trabajo típicos de una PYME — análisis de documentos, búsqueda en base de conocimiento interna, generación de informes — un modelo en el rango 14B–32B es suficiente y se puede desplegar en un único Mac Studio.

Primeros pasos

El camino de la experimentación a la producción es directo:

  1. Instalar Ollama (ollama.ai) y descargar el modelo elegido: ollama pull llama3.3 o ollama pull mistral-small
  2. Instalar el framework: pip install langgraph / pip install crewai / pip install pyautogen
  3. Definir un primer caso de uso concreto — búsqueda interna de documentos, análisis de contratos, clasificación de correos — en lugar de una prueba de concepto abstracta
  4. Medir e iterar: documentar calidad, latencia y consumo de recursos desde el primer despliegue

En nuestra sección de IA local para empresas encontrará patrones de despliegue habituales y configuraciones de hardware para PYMEs europeas. Si necesita acompañamiento para seleccionar el framework adecuado y desplegar un primer flujo en producción sobre su propia infraestructura, nuestro programa de proyecto piloto cubre exactamente eso — desde la selección del framework hasta el despliegue en vivo, con sus datos permaneciendo en sus instalaciones en todo momento.