Asistente IA Local con Mensajería: Privacidad Total sin Nube

1. may 2026 Español 8 min de lectura

local-ai privacy ollama

Un nuevo estándar para los asistentes empresariales

Esta semana se está difundiendo en X.com un stack técnico que merece atención especial por parte de cualquier pyme europea que maneje datos sensibles: un asistente de IA completamente autoalojado que se conecta a WhatsApp y Telegram, transcribe mensajes de voz en local y no envía el contenido de los mensajes a proveedores externos de IA como OpenAI. El proyecto que protagoniza esta conversación se llama Clawspark, y se construye sobre Ollama y el framework OpenClaw.

Saiyam Pathak, conocido en la comunidad cloud-native, lo describió en X como "your private AI assistant that never phones home" — un asistente de IA privado que nunca llama a casa. Esa frase define exactamente la diferencia respecto a los servicios de IA en la nube.

Para las pymes sujetas al RGPD, esta diferencia es determinante. Cada vez que un empleado introduce datos de clientes o documentos internos en un servicio de IA en la nube, esos datos llegan a servidores sujetos a legislación extranjera. Un stack local elimina esa exposición desde la arquitectura.

Cómo funciona el stack

Clawspark ensambla tres componentes que por separado son maduros, pero que rara vez se combinan en una unidad desplegable con un solo comando:

Ollama como servidor de inferencia local

Ollama ejecuta el modelo de lenguaje en el hardware propio y expone una API REST compatible con OpenAI. Su herramienta de detección de hardware, llmfit, analiza la memoria disponible y recomienda automáticamente el modelo más adecuado. En sistemas con 128 GB de memoria unificada (como el Nvidia DGX Spark), Clawspark usa por defecto Qwen 3.5. En hardware Apple Silicon — por ejemplo, un Mac Studio M3 Ultra con 192 GB — los modelos de 70B rinden entre 20 y 35 tokens por segundo según mediciones reportadas por la comunidad, velocidad suficiente para conversación en tiempo real.

WhatsApp y Telegram mediante APIs de bot

Clawspark conecta Ollama con WhatsApp Business y Telegram a través de sus respectivas APIs de bot. Los mensajes entrantes se enrutan hacia un webhook local, el modelo los procesa y la respuesta se envía por la misma API. El paso de procesamiento por IA no abandona la infraestructura propia. Los mensajes de WhatsApp siguen siendo enrutados a través de la infraestructura de Meta — la diferencia respecto a los sistemas de IA en la nube es que el contenido de los mensajes no se envía adicionalmente a OpenAI u otros proveedores de IA.

Nota importante sobre el cifrado: La API de WhatsApp Business — a diferencia del WhatsApp personal entre particulares — no está cifrada de extremo a extremo. Los mensajes enviados a través de la API Business se procesan en texto claro en los servidores de Meta; Meta tiene acceso técnico al contenido de los mensajes. Para sectores con datos especialmente sensibles (sanidad, jurídico, asesoría fiscal), este es un punto crítico en cualquier evaluación de privacidad. Telegram ofrece más flexibilidad en este sentido, ya que los Secret Chats admiten cifrado E2E opcional.

Whisper local para transcripción de voz

Los mensajes de voz — un formato dominante en la comunicación empresarial por WhatsApp — se transcriben mediante una instancia local de Whisper antes de llegar al modelo de lenguaje. Según la documentación del proyecto, la transcripción se ejecuta en la GPU local y el audio no abandona la máquina en ningún momento. Esta diferencia es relevante frente a los servicios de transcripción en la nube, que procesan el audio en servidores remotos.

Lo que viene incluido

Cada instalación de Clawspark incluye 26 herramientas de agente, 10 habilidades preconfiguradas y una CLI de gestión completa. El código generado por los agentes se ejecuta en contenedores aislados sin acceso a red, con sistema de archivos raíz de solo lectura y un perfil seccomp personalizado — un modelo de seguridad adecuado para entornos de producción.

El soporte de hardware está organizado por niveles:

Nivel	Memoria unificada	Ejemplo
DGX Spark	128 GB	Nvidia DGX Spark
Jetson AGX	64 GB	Jetson AGX Orin
RTX High-End	24+ GB VRAM	RTX 4090 / 5090
RTX Standard	8–24 GB VRAM	RTX 4060–4080

Para Apple Silicon, la comunidad reporta rendimientos equivalentes: un Mac Studio M3 Ultra (192 GB) cubre el nivel DGX y un Mac Mini M4 Pro (96 GB) el nivel Jetson.

Pi agent y Gemma 4: la extensión para tareas de código

Paralelamente al debate sobre Clawspark, Patrick Loeber — educador Python con una gran audiencia — publicó una guía paso a paso para ejecutar Pi agent con Gemma 4 26B A4B en local. Gemma 4 es la última familia de modelos open-weight de Google, publicada bajo licencia Apache 2.0, y aporta tres capacidades clave para flujos de trabajo con agentes: function calling nativo, soporte de system prompts y modos de razonamiento (thinking modes).

Pi agent se conecta a cualquier endpoint local compatible con OpenAI, por lo que funciona indistintamente con Ollama, LM Studio o llama.cpp. El modelo soporta contextos de hasta 256.000 tokens, prácticamente ilimitado para la mayoría de los casos de uso empresariales.

Ambos stacks comparten Ollama como capa de inferencia y pueden coexistir en el mismo hardware, ampliando el stack de mensajería con capacidades de automatización de código.

RGPD: lo que cambia realmente

Los servicios de IA en la nube requieren Acuerdos de Tratamiento de Datos y Cláusulas Contractuales Tipo, con el riesgo residual de que leyes como el CLOUD Act o FISA 702 puedan prevalecer sobre esas garantías contractuales.

Según nuestra interpretación del RGPD, un stack de IA completamente local modifica el perfil de riesgo en tres aspectos:

Sin transferencia de contenido a proveedores de IA en terceros países. Cuando el contenido de los mensajes no se envía a OpenAI, Anthropic u otros proveedores de IA externos, no son aplicables los riesgos asociados al CLOUD Act y FISA 702 para el procesamiento por IA. Los mensajes de WhatsApp siguen transitando por la infraestructura de Meta como siempre — este stack elimina la capa adicional de proveedor de IA, no la infraestructura de mensajería subyacente.

Sin necesidad de ATD con el proveedor de IA. Si OpenAI, Anthropic o Google nunca tratan los datos de la empresa, no se requiere un Acuerdo de Tratamiento de Datos con ellos. Eso reduce la superficie de cumplimiento.

Control total sobre la retención y la supresión. Las solicitudes y respuestas quedan en los servidores propios, gobernadas por las políticas de retención internas en lugar de las condiciones del servicio de un proveedor externo.

Limitación pendiente con la API de WhatsApp Business. Meta, como operador de la plataforma, mantiene acceso al contenido de los mensajes — esta es una característica estructural de la API Business que ningún stack de IA local puede cambiar. Para casos de uso donde eso sea inaceptable, Telegram o un canal de mensajería autoalojado son las alternativas adecuadas.

Estas ventajas son reales, pero no son una solución de cumplimiento total. Para clínicas, despachos de abogados y asesorías fiscales, un stack de IA local puede simplificar considerablemente el cumplimiento en la capa de IA — pero la evaluación de privacidad del canal de mensajería en sí sigue siendo una cuestión independiente que debe analizarse por separado.

Kit Digital: financiación para la implantación

Según nuestra interpretación de la convocatoria vigente de Kit Digital, la implantación de soluciones de IA local puede encajar en varias categorías subvencionables, en particular en Gestión de procesos y Comunicaciones seguras. Los importes por segmento oscilan entre 2.000 y 6.000 € para empresas de entre 0 y 49 empleados.

La elegibilidad requiere demostrar que la solución mejora un proceso concreto — atención al cliente por WhatsApp, transcripción de llamadas o consulta de documentos internos. Los detalles varían según la convocatoria activa; recomendamos contrastar con el agente digitalizador correspondiente.

Cómo empezar: pasos clave

Definir el caso de uso. FAQ interno, resumen de mensajes de voz o triaje de clientes — el uso determina el tamaño de modelo y el hardware necesario.
Elegir el hardware. Un Mac Mini M4 (32 GB) cubre modelos de 8B; un Mac Studio M4 Max (128 GB) gestiona cómodamente modelos de 30B–70B (rendimientos reportados por la comunidad).
Empezar con Telegram. Su API de bots es más sencilla que la de WhatsApp Business — el punto de partida ideal para una prueba de concepto.
Valorar si se requiere EIPD. Los sistemas de IA local también pueden requerir Evaluación de Impacto cuando tratan datos personales a escala.
Planificar actualizaciones. Ollama y los modelos necesitan mantenimiento regular — como cualquier dependencia de software.

Freshlab acompaña todo el proceso. Más sobre IA local para empresas y soberanía del dato.

El momento de actuar es ahora

Las herramientas que se están mostrando esta semana no son prototipos de investigación. Clawspark tiene un instalador listo para producción, soporte de hardware por niveles y ejecución de contenedores endurecida para seguridad. Pi agent con Gemma 4 tiene una configuración documentada y reproducible que múltiples profesionales han validado. La comunidad que prueba estos stacks no está experimentando — está desplegando.

Para las pymes europeas que han estado observando el espacio de IA local, este es el momento en que el nivel de madurez ha cruzado claramente el umbral de lo utilizable. Las ventajas de privacidad siempre fueron teóricamente convincentes. Ahora son prácticamente accesibles.

¿Lista para desplegar tu asistente de IA privado? Inicia un proyecto piloto o contáctanos para una valoración sin compromiso.