Osaurus: Agente IA Local para macOS completamente offline

apple-silicon ai-agents local-llm

La mayoría de las herramientas de IA local para Mac resuelven un problema concreto: sustituyen la inferencia en la nube por inferencia local. El modelo se ejecuta en su hardware en lugar de en un servidor remoto. Eso importa, y es un primer paso necesario. Pero un modelo de lenguaje sin memoria, sin acceso a sus herramientas de trabajo y sin capacidad de actuar de forma autónoma no es un asistente. Es un autocompletado muy caro.

Lo que falta en la mayoría de las implementaciones locales es continuidad y autonomía. Tras cada sesión, el modelo olvida quién es usted, a qué se dedica su empresa y de qué hablaron ayer. Para una pyme que quiere integrar la IA de forma real en sus procesos diarios, esa limitación es difícil de sortear manualmente.

Osaurus aborda exactamente este punto. El proyecto de código abierto se describe en su documentación oficial de GitHub como "the native macOS harness for AI agents — any model, persistent memory, autonomous execution, cryptographic identity". El profesional de IA Rohan Paul lo destacó en X como una solución "native, Apple Silicon–only". Está escrito en Swift, funciona exclusivamente en Apple Silicon y opera completamente offline en condiciones normales de uso.

Cómo funciona Osaurus

Osaurus no es un modelo de lenguaje ni un servidor de inferencia básico. Es una capa de orquestación: el proyecto conecta un LLM local de su elección, un sistema de memoria estructurado, un entorno de ejecución con sandbox y una biblioteca de plugins nativos de macOS para crear un agente autónomo y operativo.

La instalación es sencilla:

brew install --cask osaurus

Tras la instalación, Osaurus puede lanzarse como interfaz nativa de macOS (osaurus ui) o como servidor de API local (osaurus serve). El servidor utiliza el formato de la API de OpenAI, lo que significa que las integraciones existentes pueden redirigirse al endpoint local de Osaurus sin cambios en el código.

En cuanto al modelo, la elección es suya: modelos locales optimizados para MLX (recomendados para máxima privacidad), proveedores cloud como OpenAI o Anthropic, o los propios Foundation Models de Apple. Para un uso empresarial respetuoso con la privacidad, solo los modelos locales garantizan que ningún dato abandone el dispositivo.

Osaurus también es compatible con el Model Context Protocol (MCP), tanto como servidor MCP como cliente MCP. Los toolkits MCP ya existentes pueden integrarse de inmediato, sin trabajo adicional de integración.

Tres capas de memoria

El sistema de memoria estructurado es el componente central de Osaurus. Según la documentación oficial de GitHub, el sistema gestiona tres capas:

  • Identity layer: El perfil permanente del agente — se mantiene en todas las sesiones
  • Pinned facts: Hechos almacenados de forma duradera a los que el agente puede acceder en cualquier momento
  • Per-session episodes: Contexto específico de cada sesión que documenta el progreso de una tarea

En la práctica, esto significa que el agente sabe quién es usted. Se configura una sola vez — nombre de la empresa, productos, contactos clave, estilo de comunicación, políticas internas — y esa configuración persiste indefinidamente. Sin reconstrucción manual del contexto en cada sesión. Sin explicar desde cero a qué se dedica su negocio.

Esta es la diferencia fundamental entre Osaurus y una simple interfaz de chat sobre un modelo local: el agente opera con el conocimiento institucional de su organización y lo actualiza con el tiempo.

Más de 20 plugins nativos de macOS

Lo que distingue a Osaurus de otros proyectos de IA local es la capa de integración nativa con macOS. Según la documentación de GitHub, hay más de 20 plugins disponibles, entre ellos:

  • Mail: Leer, resumir y priorizar correos entrantes — localmente, sin que ningún contenido abandone el dispositivo
  • Calendar: Analizar entradas del calendario, detectar conflictos de agenda y proponer horarios
  • Vision: Procesar y analizar imágenes y documentos directamente en el dispositivo
  • Git: Análisis de commits, revisiones de código automatizadas, evaluación de diffs
  • Browser: Acceso web para el agente, activable opcionalmente según necesidad

Osaurus también ofrece entrada de voz con transcripción en el dispositivo: el audio se convierte en texto localmente, sin ningún servicio externo de transcripción.

La combinación de memoria persistente y acceso nativo a herramientas permite flujos de trabajo que no son posibles con una interfaz de chat básica: el agente lee los correos de la mañana, los ordena por urgencia, redacta respuestas basadas en plantillas guardadas e introduce las citas confirmadas en el plugin de Calendar — de forma autónoma, sin enviar ningún dato a la nube.

Sandbox y identidad criptográfica

El código que genera y ejecuta el agente corre en máquinas virtuales Linux aisladas, a través del propio framework de contenedores de Apple. Incluso si el agente genera código inesperado o defectuoso, el entorno de ejecución está completamente separado del sistema operativo anfitrión. El alcance de cualquier error queda estructuralmente limitado.

Cada agente también recibe una identidad criptográfica, implementada mediante direcciones secp256k1 almacenadas en iCloud Keychain. Esto va más allá de una función de seguridad: permite rastros de auditoría a prueba de manipulaciones que documentan qué agente realizó qué acción y cuándo. Para sectores regulados — asesorías jurídicas, servicios financieros, sanidad — ese nivel de trazabilidad es directamente útil para la documentación de cumplimiento.

Relevancia para pymes españolas y Kit Digital

Para empresas que operan bajo el Reglamento General de Protección de Datos, la arquitectura offline de Osaurus no es una comodidad opcional — es una respuesta estructural a las obligaciones de protección de datos. Datos de clientes, contratos, correspondencia interna: según nuestra interpretación del RGPD, el tratamiento de este tipo de información a través de servicios cloud de terceros requiere una base jurídica válida y, normalmente, un contrato de encargado del tratamiento. Ejecutar los mismos flujos de trabajo localmente elimina por completo esta capa de complejidad.

Casos de uso concretos en pymes españolas:

  • Despachos y asesorías: Los correos de clientes se resumen y priorizan localmente; el agente marca los asuntos urgentes sin que ningún contenido salga de la red de la empresa
  • Empresas de servicios: Un agente local gestiona consultas entrantes, genera borradores de propuestas comerciales basados en tarifas almacenadas y actualiza el calendario de reuniones — en un Mac Studio M2, sin conexión a internet necesaria
  • Equipos de desarrollo de software: El plugin Git permite un agente de revisión de código completamente local que comenta pull requests, identifica patrones de error habituales y verifica el cumplimiento de los estándares internos de código

Los requisitos del sistema son macOS 15.5 o superior en Apple Silicon. Un Mac Studio M2 Ultra o M3 Ultra soporta bien las cargas de trabajo de un servidor de agentes en funcionamiento continuo; según mediciones reportadas por la comunidad, los modelos optimizados para MLX de tamaño mediano logran entre 20 y 60 tok/s en estos chips, según el modelo y la longitud del contexto.

En cuanto a la financiación, Kit Digital puede ser una vía interesante para pymes que quieran incorporar esta infraestructura: según nuestra interpretación de la convocatoria, las soluciones de inteligencia artificial y automatización de procesos pueden encajar en varias de las categorías elegibles del programa, con ayudas que pueden alcanzar varios miles de euros según el tamaño de la empresa. Para conocer los importes actualizados y requisitos de la convocatoria vigente, consulte los detalles en nuestra página de Kit Digital.

Primeros pasos

Quienes ya usan Ollama tienen el camino más sencillo: Osaurus es compatible con Ollama y se sitúa como una capa sobre la pila existente. Los modelos ya descargados no necesitan reinstalarse.

Un primer agente práctico: un agente de triaje de correo que se ejecuta cada mañana, lee los mensajes entrantes, los ordena por urgencia y genera un resumen priorizado con notas de acción breves. La configuración lleva unos 30 minutos; el valor es inmediatamente visible — y genera confianza en el sistema antes de añadir flujos de trabajo más complejos.

Más información sobre infraestructura de IA local para empresas en nuestra página de IA local y en el Kaira Toolkit. Si desea una consulta sobre dimensionamiento de hardware, selección de modelos y configuración conforme al RGPD para su empresa, contáctenos en /contact.html.