NemoClaw: Lokale KI-Agenten datenschutzkonform mit Ollama

local-ai ai-agents nvidia

KI-Agenten, die autonom Aufgaben erledigen, E-Mails beantworten oder Code schreiben — das klingt verlockend. Das Problem bisher: Entweder laufen die Agenten in der Cloud und senden Firmendaten nach außen, oder der lokale Betrieb ist zu komplex einzurichten. NemoClaw, NVIDIAs Open-Source-Referenzstack für lokale KI-Agenten, adressiert genau diesen Konflikt.

Seit seiner Vorstellung auf der GTC 2026 im März kombiniert NemoClaw den OpenClaw-Assistenten mit einem isolierten, lokal betriebenen Sprachmodell via Ollama — ohne dass ein Byte das Firmennetzwerk verlässt.

Was NemoClaw anders macht

NemoClaw ist kein Sprachmodell und kein Chatbot. Es ist eine Kompositionsschicht: OpenClaw (der Always-On-KI-Assistent) läuft in einer OpenShell-Sandbox, die OS-Ebenen-Isolation bereitstellt. Netzwerkzugriffe müssen aktiv über eine Policy-Tier genehmigt werden, das Dateisystem ist abgeschirmt, und alle Inferenzanfragen gehen ausschließlich an ein lokal laufendes Modell via Ollama.

Das Ergebnis ist ein KI-Agent, der kontinuierlich erreichbar ist, mehrstufige Tool-Calls ausführen kann und dabei keinerlei Daten nach außen sendet — vorausgesetzt, kein Cloud-Endpoint ist konfiguriert. Für Betriebe mit Verschwiegenheitspflicht, für Hersteller mit Betriebsgeheimnissen oder für jeden, der echte Datensouveränität benötigt, ist das architektonisch sauberer als jede datenschutzrechtliche Vereinbarung mit einem Cloud-Anbieter.

Einstieg in wenigen Minuten

Die Installation ist bewusst einfach gehalten. Ein einziges Shellskript (nemoclaw.sh) erledigt die Einrichtung von Node.js, der OpenShell-Laufzeit und der NemoClaw-CLI in einem Schritt. Der anschließende Setup-Wizard führt durch vier Entscheidungen:

  • Modellauswahl: NemoClaw listet alle installierten Ollama-Modelle auf oder schlägt Starter-Modelle vor, wenn noch keines vorhanden ist.
  • Websuche: Optional kann Brave Search aktiviert werden, damit der Agent auch aktuelle Informationen aus dem Web einbeziehen kann.
  • Messaging-Kanal: Telegram, Discord oder Slack — der Agent antwortet über den gewählten Kanal.
  • Netzwerkrichtlinie: Von vollständig offline bis zu selektivem Internetzugriff lässt sich das Verhalten granular steuern.

Die gesamte Konfiguration liegt als JSON lokal vor — versionierbar, auditierbar, ohne Abhängigkeit von einer proprietären Cloud-Verwaltungsoberfläche.

Das Referenzmodell: Nemotron 3 Super

NVIDIAs eigene Empfehlung für NemoClaw ist Nemotron 3 Super: 120 Milliarden Parameter gesamt, aber dank Mixture-of-Experts-Architektur nur rund 12 Milliarden aktiv pro Token. Laut NVIDIA-Angaben erzielt das Modell 85,6 % auf PinchBench — einem Benchmark, der speziell Tool-Calling, mehrstufige Planung und Agenten-Aufgaben testet. Unter den offenen Modellen stand Nemotron 3 Super damit zum Zeitpunkt der Veröffentlichung auf Platz eins.

Der Ressourcenbedarf ist erheblich: Das Modell beansprucht rund 87 GB Festplattenspeicher und benötigt bei 4-Bit-Quantisierung (Q4KM) etwa 76–80 GB VRAM oder Unified Memory. Eine entsprechend ausgestattete NVIDIA-GPU-Workstation oder ein dedizierter Server sind Voraussetzung. Mac-Nutzer sind auf Community-Portierungen angewiesen, da die NVFP4-Optimierung CUDA erfordert — eine offizielle Apple-Silicon-Optimierung liegt gemäß aktueller Dokumentation nicht vor.

Wer auf Mac Studio oder MacBook Pro mit 64 GB Unified Memory arbeitet, kann stattdessen auf kleinere Modelle wie Qwen3:35b zurückgreifen, die laut NemoClaw-Wizard als Starter-Option vorgeschlagen werden und Tool-Calling ebenfalls unterstützen. Die Leistung ist geringer, der Einstieg aber deutlich niedrigschwelliger.

Praxisbeispiele für den Mittelstand

Vertragsanalyse und Dokumentensuche ohne Cloud

Ein dauerhaft laufender NemoClaw-Agent mit Zugriff auf einen lokalen Ordner mit SOPs, Verträgen oder Lieferanteninformationen kann Standardanfragen beantworten und Zusammenfassungen erstellen. Kein Dokument verlässt das Unternehmen. Das ist besonders relevant für Rechtsanwaltskanzleien, Steuerberatungen oder Betriebe, die unter branchenspezifische Geheimhaltungspflichten fallen.

Team-Assistent über Messaging

Über die Slack- oder Telegram-Integration können alle Teammitglieder dem Agenten direkt Fragen stellen — nach Urlaubsregelungen, Projektstatusen oder technischen Spezifikationen. Der Agent antwortet über den Messaging-Kanal, die Verarbeitung läuft vollständig lokal.

Coding- und DevOps-Unterstützung

Mit einem auf Code spezialisierten Modell — etwa Qwen3-Coder oder Llama 3.3 — kann NemoClaw als dauerhafter Coding-Assistent fungieren: Änderungen vorschlagen, Fehler erklären, Dokumentation erstellen. Kein API-Key, keine Cloud-Abhängigkeit, keine nutzungsabhängigen Kosten.

Stand und Einschränkungen

Wichtig für die Einordnung: NemoClaw befindet sich gemäß NVIDIA-Ankündigung noch in der Early Preview. Die Ollama-Integration ist explizit als experimentell markiert. Für produktionskritische Geschäftsprozesse empfiehlt es sich, auf eine stabile Release-Version zu warten oder die Einführung durch erfahrene Entwickler begleiten zu lassen.

Für Pilotprojekte, interne Toolchains oder Evaluierungsvorhaben ist der Stack heute bereits einsetzbar. Die Grundarchitektur — Ollama, lokales Modell, Sandbox-Laufzeit, Messaging-Kanal — ist technisch stabil.

Förderung durch BAFA und KfW

Wer in lokale KI-Infrastruktur investiert, kann gemäß unserer Einschätzung BAFA- oder KfW-Förderprogramme in Betracht ziehen. Das BAFA-Programm zur Digitalisierung von KMU sowie KfW-Digitalisierungskredite haben in der Vergangenheit Investitionen in datenschutzkonforme IT-Infrastruktur gefördert. Ob ein konkretes NemoClaw-Projekt förderfähig ist, hängt von der Ausgestaltung und der jeweils gültigen Förderrichtlinie ab — eine Prüfung durch einen akkreditierten Förderberater ist vor Antragstellung empfehlenswert.

NemoClaw als Compliance-Argument

Mit dem EU AI Act 2026 wächst der regulatorische Druck auf Unternehmen, die KI-Systeme einsetzen. Eine Architektur wie NemoClaw — vollständig lokal, auditierbar, ohne Cloud-Abhängigkeit — reduziert den Compliance-Aufwand strukturell: Es gibt schlicht weniger externe Datenflüsse, die dokumentiert und gerechtfertigt werden müssen.

Lokale KI bedeutet nicht mehr zwingend Verzicht auf Agentenlogik, Tool-Calling oder Team-Integration. NemoClaw zeigt, wie das alles unter einem DSGVO-konformen Dach zusammenkommen kann.

Freshlab begleitet KMU bei der Evaluation und Einführung lokaler KI-Stacks. Das kAIra Toolkit integriert sich in lokale Ollama-Deployments und ergänzt NemoClaw um sofort einsetzbare Agenten-Bausteine für Büro, Kundenservice und Produktion.

Wenn Sie prüfen möchten, ob eine lokale Agenten-Infrastruktur für Ihr Unternehmen sinnvoll ist, starten Sie mit einem kostenlosen Erstgespräch.