Agentes IA local con Ollama 0.21 y Hermes: sin datos en nube

24. abr 2026 Español 7 min de lectura

ollama local-ai-agents privacy

Tener un agente de inteligencia artificial que aprende tus flujos de trabajo, recuerda sesiones anteriores y mejora solo, sin enviar ningún dato a servidores externos, dejó de ser una promesa con la llegada de Ollama 0.21. Según publicó la cuenta oficial de Ollama en X: "Ollama 0.21 includes support for Hermes Agent, the self-improving AI agent built by @NousResearch."

Para las PYMES españolas, esto tiene una implicación directa: por primera vez existe una pila completa de agentes IA locales — inferencia, memoria, automatización de tareas — que puede funcionar en hardware estándar, sin cuotas mensuales de SaaS y con pleno control sobre los datos.

Qué es Hermes Agent y cómo funciona

Hermes Agent es un asistente IA de código abierto desarrollado por Nous Research que funciona según un ciclo de aprendizaje cerrado. El principio clave: después de cada tarea completada, el agente genera automáticamente habilidades reutilizables — scripts de Python que guarda y mejora con cada uso siguiente.

Las funciones principales según la documentación del proyecto:

Memoria gestionada por el agente: Hermes almacena y busca en conversaciones pasadas mediante búsqueda de texto completo con resumen asistido por LLM. No es necesario volver a explicar el contexto en cada sesión.
Creación autónoma de habilidades: Tras tareas complejas, Hermes crea scripts reutilizables automáticamente — una plantilla para el formato de tus facturas, un extractor para tus informes de proyecto, un procesador para tus exportaciones de datos.
Subagentes en paralelo: Para tareas extensas, Hermes puede lanzar subagentes aislados que trabajan simultáneamente en partes distintas del problema.
Integración con mensajería: Hermes se conecta con Telegram, Slack, WhatsApp, Discord, Signal y correo electrónico. Tu equipo interactúa con el agente a través de los canales que ya usa a diario.
Entornos de ejecución flexibles: Local, Docker, SSH o servicios serverless (Daytona, Modal) — la misma instancia de Hermes funciona en un Mac Studio de oficina o en un servidor virtual.

Todos los llamadas a la API van exclusivamente al proveedor de LLM que configures. Con Ollama como backend local, ningún token sale de tu infraestructura.

La integración con Ollama 0.21 en detalle

El funcionamiento técnico es directo: Hermes apunta al endpoint local de Ollama (http://127.0.0.1:11434/v1), que expone una API compatible con el estándar OpenAI. Para Hermes, el servidor local de Ollama es indistinguible de cualquier proveedor externo — con la diferencia de que todos los datos permanecen en local.

Ollama 0.21 estandariza esta conexión. La selección del modelo, la gestión del contexto y el streaming se controlan directamente desde la CLI de Ollama, sin configuraciones manuales de API. Un solo comando activa la integración:

ollama launch hermes

Requisitos técnicos: Hermes necesita un modelo con al menos 64.000 tokens de ventana de contexto para mantener flujos de trabajo multietapa en memoria. Modelos disponibles a través de Ollama que cumplen este requisito:

Gemma 4 27B — nuestra recomendación actual; aproximadamente 60 tok/s en Mac Studio Ultra, buen rendimiento multilingüe y tool-calling fiable
DeepSeek-V3 (cuantizado) — según mediciones reportadas por la comunidad, destaca en generación de código y salida estructurada

En un Mac Studio M3 Ultra con 64–192 GB de memoria unificada, Gemma 4 27B funciona con velocidad adecuada para uso productivo. Para equipos con presupuesto más ajustado, Gemma 4 12B en un Mac Mini M4 Pro (24 GB) cubre la mayoría de los flujos de automatización de oficina habituales.

RGPD y privacidad: por qué la IA local cambia las reglas

Las PYMES europeas que usan servicios IA en la nube se enfrentan a un problema estructural: cada documento enviado a un proveedor de LLM externo puede activar obligaciones sobre acuerdos de tratamiento de datos, transferencias internacionales y gestión de consentimientos.

Una pila de agentes completamente local resuelve esto a nivel arquitectónico. Según nuestra interpretación de los requisitos del RGPD:

Ningún dato personal sale de tu servidor — sin entrenamiento sobre tus datos, sin registro de entradas o salidas por parte de terceros.
Simplificación de los acuerdos de encargo de tratamiento: cuando no hay un procesador externo, las obligaciones del artículo 28 RGPD frente al proveedor de IA no se aplican.
Auditabilidad completa: todas las entradas y salidas pueden registrarse localmente y aportarse en caso de inspección o auditoría.

Los casos de uso que resultan problemáticos en la nube son precisamente los más valiosos para una PYME:

Análisis de consultas de clientes con datos personales
Gestión de documentación de RRHH (nóminas, incorporaciones, gestión de vacaciones)
Revisión de contratos y documentación jurídica confidencial
Bases de conocimiento internas con datos de proyectos y clientes

Para sectores con requisitos de privacidad exigentes — asesorías, despachos jurídicos, clínicas, empresas con datos de clientes sensibles — el procesamiento local no es una preferencia: es una necesidad práctica.

Kit Digital: una vía de financiación para PYMES españolas

La implementación de una pila de IA local como Ollama + Hermes puede encajar en la categoría de IA y analítica del programa Kit Digital, según nuestra interpretación de las bases publicadas. Esta categoría contempla soluciones de inteligencia artificial para la automatización de procesos empresariales.

Puntos relevantes a considerar:

El bono Kit Digital para el segmento de 3 a 9 empleados asciende a hasta 6.000 €; para 10 a 49 empleados, hasta 12.000 €.
La solución debe estar implantada y en producción para justificar el gasto ante el agente digitalizador.
Los proyectos que combinan hardware (servidor local) con servicios de configuración e integración pueden ser elegibles si el agente digitalizador los valida correctamente.

Freshlab está acreditado como agente digitalizador del programa Kit Digital. Si quieres explorar esta vía, visita nuestra página de Kit Digital o contáctanos para evaluar tu caso.

Qué puede automatizar Hermes hoy mismo

Procesamiento de documentos: Hermes extrae datos estructurados de facturas, albaranes y pedidos, y los transfiere automáticamente a los sistemas existentes — exportación a CSV, integración con CRM vía API o volcado directo a ERP.

Base de conocimiento interna: Tras cada sesión de investigación, Hermes almacena un resumen consultable. Ideal para equipos que buscan repetidamente la misma información interna — fichas de producto, tarifas, historiales de proyecto.

Informes periódicos automatizados: Mediante tareas programadas, Hermes genera resúmenes regulares — resúmenes diarios del correo entrante, informes semanales de estado de proyectos, cierres mensuales de KPIs desde datos en bruto.

Asistencia al desarrollo de software: Para equipos técnicos, Hermes actúa como agente de código local: revisa pull requests, genera documentación, guía flujos de depuración — todo sin costes de API en la nube.

Limitaciones actuales: Los flujos complejos requieren hardware con capacidad suficiente — mínimo 32–64 GB de memoria unificada para modelos de clase 70B. La función de creación autónoma de habilidades está en etapa inicial; los scripts generados automáticamente deben revisarse antes de usarlos en producción.

Comparativa de costes: agente local frente a SaaS en la nube

Las plataformas de agentes IA en la nube (OpenAI Assistants API, Anthropic Claude Teams, Microsoft Azure AI Studio) cuestan a un equipo de 10 personas entre 200 y 600 € al mes a un volumen de uso moderado. Con un volumen alto, los costes escalan con cada token adicional.

Una pila local — Mac Studio M3 Ultra 64 GB (~4.500 € nuevo, ~3.500 € de segunda mano), más electricidad (~40–60 €/mes) — alcanza el punto de equilibrio frente a una suscripción de agente en la nube en aproximadamente 9 a 15 meses según esta comparativa. Los equipos que construyen sobre hardware Mac ya disponible llegan antes al break-even.

Además, los agentes locales no tienen coste incremental. Más consultas, nuevos miembros del equipo, mayor volumen de automatización — nada de eso modifica la factura mensual.

Para ampliar información sobre la decisión entre nube y on-premise, visita nuestra página sobre IA local para empresas.

Da el primer paso con un proyecto piloto

Ollama 0.21 y Hermes representan el punto de entrada más accesible que hemos visto hasta ahora para una automatización IA local real. Pero el camino desde la instalación hasta el uso productivo implica decisiones: qué modelo se ajusta a tus tareas, qué hardware tiene sentido para tu volumen, qué proceso es el mejor candidato para el primer piloto.

Freshlab acompaña a PYMES en España y el resto de Europa en ese proceso — desde la definición del piloto hasta la integración en producción. Solicita una primera consulta gratuita o conoce cómo hemos estructurado proyectos piloto de IA local para otras empresas.