La mayoría de las pymes que prueban un asistente de IA en la nube llegan al mismo punto de conflicto: el servicio es cómodo, pero cada consulta, cada documento cargado y cada intercambio de conversación viaja a servidores externos. Para empresas que manejan datos de clientes, contratos internos o cualquier información sujeta al RGPD, eso no es un detalle menor.
Open WebUI resuelve exactamente ese problema. La plataforma ofrece la misma experiencia de chat que los servicios comerciales —historial de conversaciones, carga de documentos, varios modelos disponibles— pero funcionando al cien por cien en su propio hardware, sin enviar nada fuera de la red de la empresa.
El 10 de mayo de 2026 se publicó la versión 0.9.5. Con más de 138.000 estrellas en GitHub, Open WebUI es la interfaz de IA de código abierto más utilizada para instalaciones locales. Según datos reportados por la comunidad, Ollama —el entorno de ejecución de modelos más utilizado junto con Open WebUI— alcanzó 52 millones de descargas mensuales en el primer trimestre de 2026.
Qué es Open WebUI y cómo funciona
Open WebUI es una interfaz de chat basada en navegador diseñada para funcionar completamente sin conexión a internet. No ejecuta modelos de lenguaje por sí misma: actúa como capa visual que se conecta a un entorno de ejecución local —habitualmente Ollama— instalado en el mismo servidor o equipo.
Desde el punto de vista del usuario final, la experiencia es prácticamente idéntica a la de ChatGPT: una ventana de chat, historial de conversaciones, posibilidad de cargar ficheros y cambio de modelo con un clic. La diferencia fundamental es que cada token generado, cada fragmento de documento analizado y cada respuesta se produce en infraestructura que controla la propia empresa. Ninguna petición llega a APIs externas salvo que el administrador configure explícitamente un backend en la nube.
Para empresas que actúan como operadores bajo el Reglamento de IA de la UE (EU AI Act, artículo 26), este control técnico completo facilita el cumplimiento de las obligaciones de supervisión humana, registro de usos y trazabilidad de salidas.
Instalación en cinco minutos
Con Docker ya instalado, Open WebUI se pone en marcha con un único comando:
docker run -d -p 3000:8080 \
-v open-webui:/app/backend/data \
--name open-webui \
--restart always \
ghcr.io/open-webui/open-webui:main
A continuación, basta con abrir http://localhost:3000 en el navegador y crear la primera cuenta, que recibe automáticamente privilegios de administrador. Si Ollama ya está funcionando en el mismo equipo, se indica la dirección http://host.docker.internal:11434 en la configuración de conexión y todos los modelos instalados localmente aparecen de inmediato en el selector.
Para entornos de producción, la comunidad recomienda sustituir la base de datos SQLite predeterminada por PostgreSQL y configurar almacenamiento de objetos compatible con S3 para los documentos subidos por los usuarios. Los despliegues en Kubernetes mediante Helm están también documentados oficialmente.
Selección de modelos: qué LLM usar en cada caso
Open WebUI es compatible con cualquier endpoint OpenAI-compatible, además de Ollama, vLLM, LocalAI y LM Studio. Esto permite cambiar de modelo sin modificar la interfaz, y comparar resultados entre modelos distintos para el mismo tipo de tarea.
Según mediciones reportadas por la comunidad, las siguientes configuraciones son operativas en producción:
- Llama 3.3 (70B, cuantizado): Calidad general alta para redacción, resúmenes y consultas internas. Requiere un Mac Studio M3 Ultra (192 GB de memoria unificada) o un servidor con GPU de 80 GB o más. Velocidades de inferencia reportadas: 20–40 tok/s según el nivel de cuantización.
- Qwen 2.5 (32B): Especialmente eficaz en tareas estructuradas, código y textos multilingües. Compatible con Mac Studio M2 Ultra o servidor con 64 GB de RAM.
- Gemma 4 (12B): Opción práctica para equipos con hardware más modesto —portátiles M3 Pro con 18–36 GB o servidores con 32 GB de RAM. Adecuado para redacción de correos, resúmenes de reuniones y consultas documentales sencillas.
- DeepSeek-V3 (MoE): Reportado como modelo sólido para programación y razonamiento estructurado, con un footprint de memoria similar al de un modelo denso de 30B gracias a su arquitectura Mixture-of-Experts.
Todos estos modelos pueden descargarse directamente desde el panel de administración de Open WebUI sin necesidad de usar la línea de comandos.
RAG: consultar documentos de empresa en lenguaje natural
El motor de RAG integrado —Retrieval Augmented Generation— es una de las funciones que más diferencia a Open WebUI de las interfaces de chat básicas. Los usuarios pueden subir documentos (PDF, Word, hojas de cálculo, presentaciones) directamente a una conversación o a una base de conocimiento compartida accesible por todo el equipo.
La plataforma divide automáticamente los documentos en fragmentos, genera embeddings y los almacena en una base de datos vectorial local. Se admiten nueve bases vectoriales distintas, entre ellas ChromaDB, Qdrant, PGVector, Milvus y Elasticsearch. La extracción de contenido de documentos escaneados se realiza mediante Tika, Docling o backends OCR opcionales, todo ello en local.
El resultado práctico es inmediato: un equipo jurídico puede preguntar "¿qué cláusulas de limitación de responsabilidad aparecen en estos cinco contratos?" y recibir una respuesta con referencias precisas en segundos, sin que el contenido de los documentos salga de la red de la empresa. Lo mismo aplica a equipos de RRHH analizando currículums, a contabilidad consultando balances o a producción accediendo a manuales técnicos.
Este enfoque es especialmente relevante para pymes españolas que utilicen la subvención Kit Digital para digitalizar procesos internos: la categoría de gestión del conocimiento puede contemplar infraestructuras de búsqueda documental basadas en IA local. Recomendamos verificar la elegibilidad de cada proyecto con un agente digitalizador homologado.
Más información sobre arquitecturas de IA local en nuestra página de soluciones de IA local.
Gestión de usuarios y control de acceso
Open WebUI implementa un modelo de permisos de tres niveles: administradores gestionan modelos, configuración del sistema y cuentas de usuario; usuarios estándar trabajan dentro de los límites establecidos por el administrador; cuentas pendientes esperan aprobación antes de activarse.
Para organizaciones con infraestructura de identidad existente, la versión 0.9 incorpora integración completa con LDAP y Active Directory, aprovisionamiento automatizado mediante SCIM 2.0 —compatible con Okta, Azure AD y Google Workspace— y SSO mediante proveedores OAuth. Los nuevos empleados obtienen acceso con los permisos correctos desde el primer día; las bajas pierden el acceso en el momento en que se desactivan en el proveedor de identidad.
El historial de conversaciones de cada usuario está aislado por defecto. Los prompts compartidos, las bases de conocimiento colectivas y las configuraciones de modelo son opcionales y quedan bajo el control del administrador. Este nivel de gobernanza de acceso cumple con los principios de minimización de datos del RGPD y facilita la rendición de cuentas ante la AEPD en caso de auditoría.
Costes y financiación
La versión de código abierto de Open WebUI es gratuita. Los costes se limitan a la inversión en hardware (única), electricidad y, opcionalmente, un plan Enterprise que incluye personalización de marca, soporte con SLA y versiones LTS.
Para equipos de cinco o más personas, el coste total de propiedad de una instalación propia resulta, según nuestra interpretación de los análisis de la comunidad, competitivo frente a las suscripciones comerciales de IA en un horizonte de 12–18 meses. El plazo exacto depende del hardware elegido, el volumen de uso y si se requiere soporte Enterprise.
Las pymes españolas pueden explorar la financiación de la infraestructura de IA local a través de Kit Digital, cuya convocatoria para digitalización empresarial contempla soluciones de gestión de procesos y del conocimiento. La elegibilidad concreta de cada proyecto debe verificarse con un agente digitalizador acreditado.
Puede consultar cómo estructuramos un proyecto piloto de IA local en nuestra página de proyectos piloto.
¿Para quién tiene sentido Open WebUI?
Open WebUI encaja especialmente bien en:
- Equipos de tres o más personas que necesitan un espacio de trabajo de IA compartido y gobernado, sin cuentas en servicios externos
- Sectores regulados —asesorías, despachos de abogados, clínicas, gestorías, industria— donde la residencia de los datos es innegociable
- Empresas con políticas de seguridad que restringen o prohíben el uso de IA en la nube
- Organizaciones que quieren escalar el uso interno de IA sin que los costes crezcan proporcionalmente con el número de consultas
Conviene ser precisos sobre las limitaciones: Open WebUI no mejora la calidad del modelo de base. Los equipos que necesiten conocimiento de dominio muy específico —terminología propia, procesos internos no documentados— deberían combinar Open WebUI con pipelines de RAG sobre documentación interna curada o, para una adaptación más profunda, considerar fine-tuning con LoRA.
Si quiere evaluar Open WebUI para su empresa pero no tiene claro qué hardware, qué modelo o qué arquitectura de despliegue se adapta mejor a su caso, contáctenos. Acompañamos a pymes desde la primera prueba local hasta el despliegue en producción que cumple con los requisitos técnicos y normativos.