Lokaler KI-Assistent mit WhatsApp: DSGVO-Stack on-premise

1. Mai 2026 Deutsch 6 Min. Lesezeit

local-ai privacy ollama

Von der Cloud in die eigene Infrastruktur

Diese Woche macht auf X.com ein Stack die Runde, der für datenschutzbewusste Unternehmen relevant ist: Entwickler zeigen, wie sich ein vollständig selbst gehosteter KI-Assistent mit WhatsApp und Telegram betreiben lässt – ohne dass Nachrichteninhalte zusätzlich an Cloud-KI-Anbieter wie OpenAI übermittelt werden. Das Projekt dahinter heißt Clawspark und kombiniert Ollama, das OpenClaw-Rahmenwerk und lokales Whisper für Sprachtranskription zu einem einsatzfertigen Assistenten-Stack.

Saiyam Pathak, bekannt aus der Cloud-Native-Community, fasste das Prinzip treffend zusammen: Clawspark sei "your private AI assistant that never phones home" – ein Satz, der das Kernversprechen auf den Punkt bringt.

Für Unternehmen in Deutschland und der EU ist genau dieses Versprechen entscheidend. Cloud-basierte KI-Dienste stellen unter der DSGVO ein latentes Compliance-Risiko dar, sobald personenbezogene oder geschäftskritische Daten in Anfragen fließen. Der lokale Stack löst dieses Problem strukturell, nicht durch Vertragsklauseln.

Die Architektur: Drei Schichten, eine Installation

Clawspark baut auf einem dreischichtigen Modell auf:

Ollama als lokaler Inferenz-Server

Ollama übernimmt das Laden und Betreiben des Sprachmodells. Es stellt eine OpenAI-kompatible REST-API bereit, die mit praktisch jedem KI-Client zusammenarbeitet. Das Tool erkennt die verfügbare Hardware automatisch und empfiehlt via llmfit ein passendes Modell – bei einem System mit 128 GB Unified Memory (wie dem Nvidia DGX Spark) zum Beispiel Qwen 3.5, bei einem Mac Studio M3 Ultra (192 GB) laufen 70B-Modelle laut Community-Messungen mit 20–35 Token pro Sekunde.

WhatsApp und Telegram als Eingabekanal

Clawspark verbindet den lokalen LLM-Server über Bot-APIs mit WhatsApp Business und Telegram. Nachrichten eines Unternehmens-Accounts werden an einen lokalen Webhook weitergeleitet, dort durch das Modell verarbeitet und über dieselbe API beantwortet. Der KI-Verarbeitungsschritt verlässt das interne Netz nicht. WhatsApp-Nachrichten werden weiterhin über Metas Infrastruktur geroutet — der Unterschied zu Cloud-AI-Setups ist, dass der Nachrichteninhalt nicht zusätzlich an OpenAI oder andere KI-Anbieter übermittelt wird.

Wichtig zur Verschlüsselung: Die WhatsApp Business API – anders als persönliches WhatsApp zwischen Privatpersonen – ist nicht Ende-zu-Ende-verschlüsselt. Nachrichten, die über die Business API laufen, werden auf Metas Servern im Klartext verarbeitet; Meta hat technisch Zugriff auf den Inhalt. Für Branchen mit besonders sensiblen Daten (Arztpraxen, Rechtsanwälte, Steuerberater) ist das ein zentraler Punkt der Datenschutzprüfung. Telegram bietet in diesem Kontext mehr Flexibilität, da Secret Chats optional E2E-verschlüsselt sind.

Whisper für Sprachtranskription ohne Cloud

Sprachnachrichten – ein zentraler Kanal in WhatsApp-Geschäftskommunikation – werden durch eine lokale Whisper-Instanz transkribiert, bevor sie den LLM erreichen. Laut Projektdokumentation läuft die Transkription auf der lokalen GPU; Audiodaten verlassen die Maschine nicht. Das ist ein wesentlicher Unterschied zu Cloud-Transkriptionsdiensten wie Google Speech-to-Text oder Amazon Transcribe.

26 Tools, 10 Skills – agentenbereit ab Installation

Clawspark liefert mit jeder Installation 26 vorgefertigte Agenten-Tools und 10 Skills mit. Dazu gehört eine vollständige Management-CLI für lokale Modelle und Integrationen. Agenten-generierter Code läuft in isolierten Containern ohne Netzwerkzugang, mit Read-only-Root und einem benutzerdefinierten Seccomp-Profil – ein durchdachtes Sicherheitsmodell für produktive Umgebungen.

Der Stack unterstützt vier Hardware-Tiers:

Hardware-Tier	Unified Memory	Beispiel
DGX Spark	128 GB	Nvidia DGX Spark
Jetson AGX	64 GB	Jetson AGX Orin
RTX High-End	24+ GB VRAM	RTX 4090 / 5090
RTX Standard	8–24 GB VRAM	RTX 4060–4080

Für Apple-Silicon-Hardware mit Unified Memory empfehlen Community-Berichte ähnliche Einstufungen: Mac Studio M3 Ultra (192 GB) entspricht in der Praxis dem DGX-Tier für kleinere Modelle, Mac Mini M4 Pro (96 GB) dem Jetson-Tier.

Pi-Agent und Gemma 4: Die Coding-Erweiterung

Parallel zu Clawspark gewinnt eine Kombination an Aufmerksamkeit, die lokale Coding-Agenten betrifft: Patrick Loeber, bekannter Python-Educator, veröffentlichte eine Schritt-für-Schritt-Anleitung für das Setup von Pi-Agent mit Gemma 4 26B A4B. Gemma 4 ist Googles neueste Open-Weight-Modellfamilie (Apache-2.0-Lizenz) und unterstützt natives Function-Calling, System-Prompts und Thinking-Modi – Voraussetzungen für stabile Agenten-Workflows.

Das Setup funktioniert mit Ollama, LM Studio oder llama.cpp als Inferenz-Backend. Pi-Agent spricht dabei eine OpenAI-kompatible API an und ist damit austauschbar gegenüber dem lokalen Server. Das Modell unterstützt bis zu 256.000 Token Kontext – für umfangreiche Codebasen ein entscheidender Vorteil.

Diese Kombination ergänzt Clawspark sinnvoll: Während Clawspark einen Messaging-Assistenten für Kundenkommunikation und interne Anfragen liefert, erweitert Pi-Agent + Gemma 4 den Stack um automatisierte Code-Aufgaben innerhalb des lokalen Netzes.

DSGVO-Konformität: Was der Stack konkret ermöglicht

Aus rechtlicher Perspektive – gemäß unserem Verständnis der DSGVO-Anforderungen – schafft ein vollständig lokaler Assistenten-Stack folgende Voraussetzungen:

Keine Übermittlung an KI-Anbieter in Drittländern. Cloud-KI-Dienste US-amerikanischer Anbieter erfordern Standardvertragsklauseln (SCCs) und unterliegen weiterhin Rechtsunsicherheiten durch US-Gesetze wie CLOUD Act und FISA 702. WhatsApp-Nachrichten werden weiterhin über Metas Infrastruktur geroutet — der lokale KI-Stack eliminiert jedoch die zusätzliche Verarbeitung durch OpenAI oder andere KI-Anbieter.

Kein Auftragsverarbeitungsvertrag mit KI-Anbietern erforderlich. Wenn keine Daten an OpenAI, Anthropic oder Google übermittelt werden, entfällt die Notwendigkeit eines AVV mit diesen Unternehmen. Der Datenschutzbeauftragte hat weniger zu prüfen.

Protokollierung und Datenlöschung unter voller Kontrolle. Anfragen und Antworten landen auf eigenen Servern und lassen sich nach den eigenen Löschfristen behandeln – nicht nach den Aufbewahrungsfristen eines externen Dienstleisters.

Verbleibende Einschränkung bei WhatsApp Business API. Meta hat als Plattformbetreiber weiterhin Zugriff auf Nachrichteninhalte — das ist eine strukturelle Eigenschaft der Business API, die kein lokaler KI-Stack ändern kann. Für Anwendungsfälle, in denen das inakzeptabel ist, empfehlen wir Telegram oder einen eigenen Messaging-Kanal als Alternative.

Diese Vorteile sind real, aber kein Rundum-Freifahrtschein. Für Arztpraxen, Rechtsanwaltskanzleien und Steuerberater kann der lokale KI-Stack die KI-seitige Compliance erheblich vereinfachen — die datenschutzrechtliche Bewertung des Messaging-Kanals selbst bleibt davon unberührt und sollte separat erfolgen.

Förderung: BAFA und KfW

Gemäß unserem Verständnis der aktuellen Förderprogramme können Investitionen in lokale KI-Infrastruktur unter bestimmten Voraussetzungen über verschiedene Wege bezuschusst werden:

BAFA-Förderung Unternehmensberatung: Externe Beratungsleistungen für die Einrichtung eines DSGVO-konformen KI-Stacks können im Rahmen des BAFA-Programms „Förderung unternehmerischen Know-hows" bezuschusst werden – bis zu 50 % der Beratungskosten, je nach Unternehmensgröße und Region.

KfW-Digitalisierungskredit: Die KfW fördert Digitalisierungsinvestitionen für KMU mit zinsgünstigen Darlehen. Hardware (Mac Studio, Workstations), Software-Lizenzen und Implementierungskosten können potenziell in einem Kreditantrag gebündelt werden.

Steuerliche Abschreibung: Hardware ist als Betriebsmittel abschreibungsfähig. Individuelle Voraussetzungen sind mit einem Steuerberater zu klären.

Praxiseinstieg: Die ersten Schritte

Für Unternehmen, die diesen Stack evaluieren möchten, empfehlen wir folgende Vorgehensweise:

Hardware-Assessment: Welche Modellgröße ist erforderlich? Für einfache FAQ-Beantwortung reicht ein 8B-Modell auf einem Mac Mini M4 (32 GB). Für komplexe Agenten-Aufgaben sind 96–192 GB Unified Memory sinnvoll.
Pilotprojekt mit begrenztem Scope: Einen Telegram-Bot für interne Anfragen einrichten, bevor WhatsApp Business integriert wird.
Datenschutz-Folgenabschätzung (DPIA): Auch lokale KI-Systeme können eine DPIA erfordern, wenn sie für Entscheidungen mit Auswirkungen auf Personen genutzt werden.
Monitoring und Updates: Ollama und das Modell müssen regelmäßig aktualisiert werden. Ein Updateprozess gehört zur Betriebsplanung.

Freshlab begleitet Unternehmen durch jeden dieser Schritte – von der Hardware-Auswahl über die Datenschutzprüfung bis zur produktiven Integration. Mehr über unsere Lösungen für lokale KI und Datensouveränität.

Der Trend ist klar

Was diese Woche auf X sichtbar wird, ist kein Nischen-Experiment mehr. Lokale KI-Assistenten mit Messaging-Integration sind einsatzreif, praxiserprobt und datenschutzkonform. Die Tools existieren, die Hardware ist verfügbar, die Community wächst.

Für Unternehmen, die Cloud-Abhängigkeit als strategisches Risiko betrachten – sei es aus DSGVO-Gründen, aus Kostengründen oder aus Überlegungen zur Resilienz – ist jetzt ein guter Zeitpunkt für den Einstieg.

Bereit für Ihren datenschutzkonformen KI-Assistenten? Starten Sie mit einem Pilotprojekt oder kontaktieren Sie uns für eine kostenfreie Ersteinschätzung.