NemoClaw: Agentes IA Local con Ollama para Empresas

local-ai ai-agents nvidia

Los agentes de IA que trabajan de forma autónoma —respondiendo emails, buscando en documentos internos o ejecutando tareas de código— llevan meses siendo el gran tema de conversación en el ecosistema tech. El problema real no es si funcionan, sino dónde procesan los datos. NemoClaw, el stack de referencia open-source de NVIDIA presentado en GTC 2026 en marzo, resuelve esa ecuación: agentes siempre activos, completamente locales, sin contacto con la nube.

Para pymes europeas que trabajan con datos personales, contratos o información sensible de negocio, esa diferencia arquitectónica tiene implicaciones directas en RGPD y en la Ley de IA de la UE.

Qué es NemoClaw y cómo funciona

NemoClaw no es un modelo de lenguaje. Es una capa de composición que une tres piezas:

  1. OpenClaw — el asistente always-on que gestiona conversaciones, llamadas a herramientas y flujos de trabajo en múltiples pasos.
  2. OpenShell — el runtime en sandbox de NVIDIA que aplica aislamiento de red y sistema de archivos a nivel de sistema operativo.
  3. Ollama — el motor de inferencia local que mantiene todo el procesamiento en el propio hardware.

La capa OpenShell es lo que distingue NemoClaw de una simple integración con Ollama: el acceso a la red está bloqueado por defecto, el sistema de archivos está delimitado, y las credenciales están separadas del runtime. No son opciones avanzadas de configuración — son los valores por defecto del sistema.

Instalación: un script, un asistente de configuración

Un único script de instalación (nemoclaw.sh) gestiona todas las dependencias: Node.js, OpenShell y la CLI de NemoClaw. El asistente post-instalación guía a través de cuatro decisiones:

  • Selección de modelo: lista los modelos de Ollama instalados o sugiere opciones de inicio si no hay ninguno
  • Búsqueda web: activa opcionalmente Brave Search para consultas con información en tiempo real
  • Canal de mensajería: Telegram, Discord o Slack
  • Política de red: desde modo completamente offline hasta acceso saliente selectivo

Toda la configuración se almacena en un JSON local — versionable, auditable, sin dependencia de ninguna plataforma de gestión en la nube.

Nemotron 3 Super: el modelo de referencia

El modelo que NVIDIA recomienda para NemoClaw es Nemotron 3 Super: 120.000 millones de parámetros en total, pero con arquitectura Mixture-of-Experts que activa solo unos 12.000 millones por token. Según datos publicados por NVIDIA, el modelo obtiene un 85,6 % en PinchBench —un benchmark específico para tool-calling, planificación multi-paso y ejecución de tareas de agentes— posicionándose primero entre los modelos de código abierto en el momento de su lanzamiento.

Los requisitos de hardware son exigentes: el modelo necesita aproximadamente 76–80 GB de VRAM o memoria unificada en cuantización Q4KM, y unos 87 GB de espacio en disco. Esto lo sitúa en el rango de workstations o servidores GPU bien equipados. La optimización NVFP4 requiere CUDA; los usuarios de Mac deberán usar cuantizaciones de la comunidad, ya que la documentación oficial no recoge soporte nativo para Apple Silicon en este momento.

Para equipos con Mac Studio M3 o M4 Ultra (64–192 GB de memoria unificada), alternativas más ligeras como Qwen3:35b admiten tool-calling y funcionan correctamente con NemoClaw, tal como sugiere el propio asistente de configuración.

Casos de uso para pymes

Gestión documental sin exposición en la nube

Un agente NemoClaw con acceso de lectura a una carpeta local de contratos, procedimientos internos o registros de clientes puede responder preguntas, redactar resúmenes y señalar inconsistencias. Ningún documento sale del servidor. Especialmente relevante para asesorías, despachos legales o cualquier empresa que trabaje con datos sujetos a secreto profesional.

Asistente de equipo por mensajería

Con integración en Slack o Telegram, cualquier miembro del equipo puede consultar al agente sobre procesos internos, estado de proyectos o especificaciones técnicas. El agente responde a través del canal de mensajería; todo el procesamiento permanece en el servidor local.

Soporte para desarrollo y DevOps

Con un modelo orientado a código —Llama 3.3, Qwen3-Coder o DeepSeek-V3 en cuantización adecuada— NemoClaw ofrece un asistente de código persistente y accesible para todo el equipo, sin API keys, sin suscripciones cloud y sin facturación por uso.

Implicaciones en RGPD y Ley de IA

El RGPD obliga a documentar y justificar los flujos de datos hacia terceros cuando se procesan datos personales con herramientas de IA en la nube. Un stack completamente local elimina esos flujos en origen, reduciendo significativamente la superficie de cumplimiento normativo.

La Ley de IA de la UE añade obligaciones adicionales para los desplegadores de sistemas de IA en categorías de alto riesgo (contratación laboral, procesos legales, evaluación crediticia). El artículo 26 exige transparencia y supervisión efectiva del sistema. Un agente local en sandbox con configuración auditable en JSON es considerablemente más fácil de documentar y supervisar que una dependencia de API cloud de terceros.

Según nuestra interpretación de la normativa vigente, arquitecturas local-first como NemoClaw ofrecen una base de cumplimiento estructuralmente más sólida — aunque los detalles de cada implementación siempre requieren revisión jurídica independiente.

Kit Digital y otras vías de financiación

Invertir en infraestructura de IA local puede ser elegible para el programa Kit Digital, dependiendo de la tipología del proyecto y del segmento de la empresa. Las categorías de "Gestión de Procesos" e "Inteligencia Artificial y Automatización" del catálogo digitalización han cubierto previamente soluciones de procesamiento documental y automatización basadas en IA. Según nuestra interpretación de las bases actuales, un proyecto NemoClaw bien documentado podría encajar — aunque la resolución final depende siempre del agente digitalizador y de la convocatoria vigente.

Estado actual del stack

NemoClaw se encuentra en early preview en el momento de esta publicación. La integración con Ollama está marcada como experimental en la documentación oficial. Para flujos de trabajo críticos de negocio, es recomendable esperar a una versión estable o contar con desarrolladores especializados durante la implantación.

Para proyectos piloto, toolchains internas o evaluaciones de arquitectura, el stack es funcional hoy mismo. Los componentes base —Ollama, modelo local, sandbox OpenShell, integración de mensajería— son individualmente estables.

Cómo puede ayudarte Freshlab

Freshlab acompaña a pymes en la evaluación e implantación de stacks de IA local adaptados a sus requisitos de privacidad y soberanía de datos. Nuestro programa de proyectos piloto ofrece un recorrido estructurado desde la evaluación inicial hasta la producción, con dimensionamiento de hardware, selección de modelos y configuración de políticas de privacidad.

El kAIra Toolkit se integra de forma nativa con despliegues locales de Ollama, añadiendo componentes de agente preconstruidos para procesamiento documental, búsqueda interna y comunicación de equipo — complementando lo que NemoClaw aporta en la capa de infraestructura.

¿Quieres saber si NemoClaw o un stack similar tiene sentido para tu empresa? Escríbenos.