Multi-agente IA local: LangGraph, CrewAI y AutoGen

23. may 2026 Español 7 min de lectura

multiagente ia-local ollama

Un modelo de lenguaje puede resumir un documento, redactar un correo o clasificar consultas de soporte. Pero la mayoría de los procesos empresariales reales implican varios pasos encadenados: leer un contrato, extraer las obligaciones clave, contrastar con una base de datos interna y generar un informe estructurado. Para estos flujos de trabajo de múltiples etapas, una única llamada a un LLM rara vez es suficiente.

Aquí es donde entran en juego los frameworks de orquestación multi-agente. En los últimos meses, tres herramientas de código abierto han alcanzado la madurez necesaria para su uso en producción: LangGraph, CrewAI y AutoGen. Las tres funcionan completamente en local, las tres se conectan a Ollama con modelos abiertos, y ninguna requiere suscripción a una API de nube ni costes por token.

Esta semana, un post de @PythonDv en X que generó amplia discusión en la comunidad lo resumía así: "You don't need to spend a single dollar to build a production AI system in 2026" — con LangGraph o CrewAI como capa de orquestación (fuente). Para las PYMEs europeas, la pregunta práctica no es si estos frameworks funcionan, sino cuál se adapta mejor a cada caso de uso.

LangGraph: Control preciso para flujos de trabajo en producción

LangGraph, desarrollado por el equipo de LangChain, modela los flujos de agentes como un grafo dirigido. Cada nodo es un paso de procesamiento o una llamada a un agente; las aristas definen las transiciones, ramificaciones y bucles. Esta estructura proporciona un control granular sobre lo que ocurre en cada paso del proceso.

Fortalezas:

Control total sobre procesos complejos y ramificados — sin comportamientos ocultos

Gestión explícita del estado: cada paso puede registrarse, inspeccionarse y repetirse para depuración

Amplia comunidad y documentación madura

Ideal para procesos donde la trazabilidad es un requisito (cumplimiento, finanzas, legal)

Limitaciones:

Curva de aprendizaje más pronunciada que CrewAI; más código de configuración para tareas simples

Acoplamiento estrecho con el ecosistema LangChain

Integración con Ollama: LangGraph conecta con Ollama a través de la clase ChatOllama. Basta con configurar base_url: http://localhost:11434 para enrutar todas las llamadas al LLM local. Según mediciones reportadas por la comunidad, Llama 3.3 70B en un Mac Studio M3 Ultra (192 GB de memoria unificada) entrega aproximadamente 18–28 tokens/s, suficiente para flujos de trabajo empresariales interactivos.

CrewAI: Agentes por roles para prototipos rápidos

CrewAI organiza los agentes en torno a una metáfora intuitiva: una "tripulación" de agentes con roles, objetivos y herramientas definidos. Un agente de investigación, un agente de redacción, un agente de revisión de calidad — cada uno tiene su misión, y CrewAI gestiona la coordinación. Esta abstracción facilita que personas sin conocimientos profundos de infraestructura IA puedan diseñar y comprender los flujos.

Fortalezas:

La API más sencilla de los tres frameworks — primeros prototipos en horas

La metáfora de roles se corresponde de forma natural con estructuras de equipo existentes

Ejecución paralela de agentes fácil de configurar

Ideal para equipos sin experiencia previa en LangChain

Limitaciones:

Menos control sobre el flujo de ejecución que LangGraph en procesos complejos

La lógica condicional muy anidada puede volverse difícil de gestionar

Integración con Ollama: CrewAI soporta Ollama de forma nativa mediante el prefijo de modelo ollama/. No se requiere configuración adicional de LangChain, lo que simplifica el setup inicial.

AutoGen (Microsoft Research): Colaboración conversacional entre agentes

AutoGen modela los flujos multi-agente como una conversación entre agentes especializados que intercambian mensajes hasta llegar a un resultado — similar a una discusión estructurada entre expertos. Desde la versión 0.4, AutoGen admite endpoints compatibles con OpenAI, por lo que Ollama funciona como backend local sin modificaciones en el código.

Fortalezas:

Ideal para tareas que requieren iteración: revisión de código, síntesis de investigación, análisis con múltiples perspectivas

Soporte nativo para "human-in-the-loop" — un humano puede intervenir en la conversación entre agentes en cualquier momento

Buena integración con VS Code y el entorno de desarrollo de Microsoft

Limitaciones:

El enfoque conversacional consume más tokens por tarea que los frameworks basados en grafo en flujos largos

La depuración de conversaciones entre agentes complejas requiere más esfuerzo

Integración con Ollama: AutoGen acepta cualquier endpoint compatible con OpenAI. Ollama se configura como proxy local en la sección model_client — sin cambios de código más allá de la URL del endpoint.

¿Qué framework elegir para cada caso de uso en una PYME?

Caso de uso Recomendación Motivo

Procesamiento de documentos multietapa LangGraph Control preciso, logging confiable

Producción de contenido, pipelines de investigación CrewAI Metáfora de roles, desarrollo más rápido

Análisis iterativo, revisión de código AutoGen Lógica conversacional, human-in-the-loop

Primer piloto (equipo sin perfil técnico) CrewAI Menor barrera de entrada

Flujos críticos en producción LangGraph Reproducibilidad, inspección del estado

Para la mayoría de las PYMEs que comienzan con IA multi-agente, CrewAI es la mejor opción para un primer piloto: produce resultados visibles rápidamente y la estructura de roles encaja bien con cómo los equipos piensan sus procesos. Una vez que el flujo avanza hacia producción y la fiabilidad es un requisito, el esfuerzo adicional de configuración de LangGraph se compensa con la predictibilidad y la capacidad de depuración.

Soberanía de datos: sin nube, sin transferencia de datos, sin riesgo de cumplimiento

Con un stack multi-agente completamente local, ningún dato abandona la red de la empresa: ni los documentos que procesan los agentes, ni las consultas al modelo de lenguaje, ni los resultados intermedios que se pasan entre agentes. Esta es la diferencia arquitectónica fundamental respecto a servicios de agentes en la nube.

Para empresas sujetas al RGPD, esto tiene implicaciones concretas:

No es necesario un contrato de encargo de tratamiento con un proveedor de modelos en la nube

Sin exposición a incidentes de seguridad en la infraestructura de terceros

Sin riesgo de que datos empresariales sensibles acaben en pipelines de entrenamiento de modelos externos

Según nuestra interpretación del Reglamento General de Protección de Datos y del Reglamento de IA de la UE, las empresas que operan exclusivamente con modelos open-weight locales sin llamadas a APIs de terceros se encuentran en una posición regulatoria notablemente favorable — especialmente de cara a las obligaciones de los operadores que entran en vigor en agosto de 2026. Más información en nuestra sección sobre soberanía de datos.

Kit Digital: IA local como inversión subvencionable

Para PYMEs españolas, vale la pena mencionar el programa Kit Digital: según nuestra interpretación de las bases actuales, la implantación de soluciones de IA que mejoren procesos internos puede encuadrarse en categorías como "Gestión de procesos" o "Comercio electrónico inteligente". La asesoría especializada para valorar la elegibilidad de una solución de IA local bajo el marco Kit Digital es parte de lo que ofrecemos en Freshlab.

Hardware recomendado y modelos

Según mediciones reportadas por la comunidad practitioner:

Nivel de entrada (Llama 3.2 11B, Gemma 3 12B, Mistral Small 4 22B): MacBook Pro M3/M4 con 32–36 GB de memoria unificada; 20–45 tokens/s reportados

Nivel medio (Llama 3.3 70B, Qwen 2.5 72B): Mac Studio M3/M4 con 64–192 GB; 18–30 tokens/s reportados

Cargas intensivas (modelos 70B en Q8 o modelos MoE grandes): Mac Studio M3/M4 Ultra 192 GB o NVIDIA RTX 6000 Ada (48 GB VRAM)

Para los flujos de trabajo típicos de una PYME — análisis de documentos, búsqueda en base de conocimiento interna, generación de informes — un modelo en el rango 14B–32B es suficiente y se puede desplegar en un único Mac Studio.

Primeros pasos

El camino de la experimentación a la producción es directo:

Instalar Ollama (ollama.ai) y descargar el modelo elegido: ollama pull llama3.3 o ollama pull mistral-small

Instalar el framework: pip install langgraph / pip install crewai / pip install pyautogen

Definir un primer caso de uso concreto — búsqueda interna de documentos, análisis de contratos, clasificación de correos — en lugar de una prueba de concepto abstracta

Medir e iterar: documentar calidad, latencia y consumo de recursos desde el primer despliegue

En nuestra sección de IA local para empresas encontrará patrones de despliegue habituales y configuraciones de hardware para PYMEs europeas. Si necesita acompañamiento para seleccionar el framework adecuado y desplegar un primer flujo en producción sobre su propia infraestructura, nuestro programa de proyecto piloto cubre exactamente eso — desde la selección del framework hasta el despliegue en vivo, con sus datos permaneciendo en sus instalaciones en todo momento.

Caso de uso	Recomendación	Motivo
Procesamiento de documentos multietapa	LangGraph	Control preciso, logging confiable
Producción de contenido, pipelines de investigación	CrewAI	Metáfora de roles, desarrollo más rápido
Análisis iterativo, revisión de código	AutoGen	Lógica conversacional, human-in-the-loop
Primer piloto (equipo sin perfil técnico)	CrewAI	Menor barrera de entrada
Flujos críticos en producción	LangGraph	Reproducibilidad, inspección del estado

¿IA local en lugar de nube?

Instalamos su infraestructura de IA on-premise conforme al RGPD: LLMs open source en su propio hardware, con formación.
Reservar llamada

Más artículos
Lucebox: 5× schnellere LLM-Inferenz auf Consumer-GPU
Lucebox: 5× Faster Local LLM Inference on Consumer GPUs
Lucebox: IA local 5 veces más rápida en GPU de consumidor

Aviso: Este artículo describe el contexto técnico y regulatorio según nuestro mejor conocimiento y no constituye asesoramiento legal, fiscal o de cumplimiento individualizado. Las fuentes externas están enlazadas; los contenidos y marcas son propiedad de sus respectivos titulares. Los benchmarks, salvo indicación contraria, proceden de mediciones reportadas públicamente por la comunidad.