Was ist DSGVO-konforme KI? On-Premise & souveräne Sprachmodelle für Unternehmen (2026)

Definition: DSGVO-konforme KI ist kein fertiges Produkt, sondern ein Zustand: Ein KI-System ist DSGVO-konform, wenn Auftragsverarbeitung (AVV), Datenresidenz, Zweckbindung und Datenminimierung erfüllt sind und kein unbefugter Drittland-Zugriff möglich ist. Kein US-Cloud-Tool ist „automatisch" konform – am sichersten ist eine On-Premise- oder EU-souveräne Verarbeitung. *(snippet-ready, ~50 Wörter)*
Der Fable-Ban vom Juni 2026 hat es jedem Entscheider vor Augen geführt: Wer seine Daten in US-Modelle gibt, gibt die Kontrolle ab. Dieser Leitfaden beantwortet die zwei Fragen, die deutsche Unternehmen jetzt stellen: Welche KI ist DSGVO-konform? – und wie verhindere ich Datenabfluss technisch, durch On-Premise- und souveräne Sprachmodelle.
Was ist DSGVO-konforme KI? Die 4 Stufen der Konformität
„DSGVO-konform" ist eine Leiter, kein Schalter. Von schwächster zu stärkster Datenhoheit:
- US-Cloud, konfiguriert (ChatGPT Enterprise/Copilot/Azure OpenAI mit EU-Residency + AVV + Zero Data Retention) – nur bedingt konform, CLOUD-Act-Restrisiko bleibt.
- EU-Cloud (EU-gehostete Modelle, EU-Anbieter) – besser, aber bei US-Mutterkonzern weiter CLOUD-Act-exponiert.
- Sovereign Cloud (EU-Betreiber, EU-Recht, kein US-Zugriff) – hohe Konformität.
- On-Premise / lokales LLM – Daten verlassen das Haus nie; konform by design.
Ist ChatGPT DSGVO-konform? (und Copilot, Gemini, DeepSeek)
- ChatGPT: nur in der Enterprise-/API-Variante mit AVV, EU Data Residency (Opt-in, seit 16.01.2026 verfügbar) und Zero Data Retention – die kostenlose/Plus-Version ist es nicht.
- Microsoft Copilot: im EWR-Tenant mit entsprechenden Verträgen möglich; Konfiguration entscheidet.
- Google Gemini: über Workspace/Vertex mit EU-Optionen bedingt möglich.
- DeepSeek: speichert IP, Eingaben und Dokumente ohne Transparenz, kein belastbarer AVV – als nicht DSGVO-konform einzustufen.
Die Kernregel: Konformität entsteht aus Vertrag + Konfiguration + Standort, nicht aus dem Markennamen.
Warum US-KI-Anbieter ein DSGVO-Risiko sind
Der CLOUD Act (2018)
Der US *Clarifying Lawful Overseas Use of Data Act* verpflichtet US-Unternehmen, Daten herauszugeben – unabhängig vom Speicherort, auch aus EU-Rechenzentren. Das kollidiert mit der DSGVO (Transparenz, Zweckbindung) und mit Art. 48 DSGVO (Anordnungen von Drittstaaten sind keine zulässige Übermittlungsgrundlage).
30-Tage-Speicherung & Drittlandtransfer
US-APIs speichern Ein-/Ausgaben typischerweise rund 30 Tage zum Missbrauchs-Monitoring; der Transfer in die USA fällt unter Art. 44–50 DSGVO und das Schrems-II-Urteil (C-311/18), das Drittlandtransfers stark einschränkt.
Training auf Nutzerdaten
Mehrere US-Anbieter nutzen Eingaben standardmäßig zum Training (siehe Stanford-HAI-Studie 10/2025), sofern nicht aktiv widersprochen wird – ein Zweckbindungs-Problem (Art. 5 DSGVO).
Was macht eine KI DSGVO-konform? (Checkliste)
- AVV (Art. 28 DSGVO) mit dem Anbieter abgeschlossen.
- EU-Hosting / Datenresidenz (Inferenz *und* Speicherung in der EU, kein externer Zugriff).
- Zero Data Retention oder dokumentierte, kurze Speicherfristen.
- Zweckbindung & Datenminimierung (Art. 5) – keine Weiterverwendung zum Training.
- DSFA (Datenschutz-Folgenabschätzung) bei hohem Risiko.
On-Premise vs. EU-Cloud vs. Sovereign Cloud
Kriterium · On-Premise · EU-Cloud · Sovereign Cloud
- Datenhoheit — höchste · mittel · hoch
- CLOUD-Act-Risiko — keines · bei US-Mutter ja · keines
- Anschaffungskosten — hoch (Hardware) · niedrig · mittel
- Setup-Zeit — länger · sofort · mittel
- Skalierung — begrenzt · hoch · hoch
Was ist On-Premise-KI / ein lokales LLM?
On-Premise-KI bedeutet: Modell und Infrastruktur laufen vollständig auf eigener Hardware oder im eigenen Rechenzentrum – keine Daten verlassen das Unternehmen. Vorteile: maximale Datenhoheit, DSGVO-Konformität by design, niedrige Latenz, Unabhängigkeit von Anbieter-Sperren (wie dem Fable-Ban). Nachteile: Anschaffungskosten, Einrichtungszeit, eigener Betrieb/Wartung.
Welche LLMs kann man on-premise betreiben?
- International (Open-Weight): Mistral / Mixtral, Llama 3 (bis 70B), Qwen3, Gemma 3 – frei herunterladbar und lokal betreibbar.
- Souverän aus Deutschland/EU: Teuken-7B (Projekt OpenGPT-X, Fraunhofer IAIS u. a., trainiert auf allen 24 EU-Amtssprachen, Open Source, on-prem einsetzbar) und Aleph Alpha (Pharia) als deutscher Souverän-Anbieter.
Was kostet ein lokales LLM? (Hardware-Realität)
- Kleine Modelle (CPU): ab €7–14/Monat gehostet; GPU-Server (RTX 4000 Ada, DE-Rechenzentrum) ca. €184/Monat; dediziert 48 GB VRAM €400–700/Monat.
- VRAM-Faustregel: 7B-Modell ~16 GB; 30B ~16–24 GB (RTX 5080/5090-Klasse); 70B+ unified-memory-Systeme (z. B. 128 GB) €2.500–3.500 einmalig.
- *Hinweis:* ROI-Versprechen mancher Anbieter („80–90 % günstiger") sind Marketingwerte – im Einzelfall prüfen.
Lohnt sich On-Premise-KI für den Mittelstand? (Entscheidungs-Framework)
- Sensible/personenbezogene Daten + regulierte Branche → On-Premise oder Sovereign.
- Sensibel, aber moderates Volumen → EU-/Sovereign-Cloud.
- Unkritische Aufgaben → günstigstes geeignetes (auch Cloud-)Modell.
- Gemischt → schutzklassen-basiertes Routing (siehe LLM-Router).
Souverän ohne eigene Hardware: ADVISORI × Yorizon
Sie wollen die On-Premise-Vorteile ohne eigenen GPU-Betrieb? Mit unserem Partner Yorizon betreiben wir leistungsstarke Modelle auf europäischen AI-Gigafactories – EU-Inferenz, EU-Recht, kein CLOUD Act. Der Synthara LLM-Broker routet sensible Daten ausschließlich an diese souveränen Modelle. Den strategischen Rahmen liefert unser Pillar-Beitrag: Digitale Souveränität bei KI.
Schrems II, das Data Privacy Framework und Art. 48 DSGVO: der rechtliche Kern
Der Konflikt zwischen US-Recht und DSGVO ist kein theoretisches Risiko. Das Schrems-II-Urteil (EuGH, C-311/18, Juli 2020) kippte das „Privacy Shield", weil US-Überwachungsgesetze (FISA 702) und fehlende Rechtsbehelfe für EU-Bürger kein angemessenes Schutzniveau garantieren. Der Nachfolger – das EU-US Data Privacy Framework (DPF) vom Juli 2023 – ist derzeit gültig: Das EU-Gericht wies die Klage Latombe am 3. September 2025 ab. Aber: Die Berufung liegt seit Ende 2025 beim EuGH, und zwei Vorgänger-Rahmenwerke (Safe Harbor, Privacy Shield) sind bereits gefallen. Die belastbare Einordnung lautet daher: *heute gültig, in der Haltbarkeit unsicher – planen Sie für Souveränität, nicht für den Fortbestand des DPF.*
Hinzu kommt Art. 48 DSGVO: Anordnungen von Drittstaaten-Behörden (wie unter dem CLOUD Act) sind nur über ein internationales Abkommen (z. B. ein MLAT) eine zulässige Übermittlungsgrundlage. Der CLOUD Act umgeht das – ein direkter Normkonflikt, bei dem Bußgelder bis 4 % des weltweiten Jahresumsatzes drohen.
Welche On-Premise-LLMs eignen sich? (Vergleich)
Nicht jedes Modell passt zu jedem Schutzbedarf. Die wichtigsten on-premise einsetzbaren Modelle im Überblick:
Modell · Herkunft · Lizenz · Besonderheit
- **Teuken-7B** — OpenGPT-X / Fraunhofer (DE) · Open Source · Auf allen 24 EU-Amtssprachen trainiert; souveräne Option, kein GPT-Ersatz
- **Aleph Alpha (Pharia)** — Heidelberg (DE) · kommerziell/souverän · Deutscher Anbieter, On-Prem-/Sovereign-Fokus
- **Mistral / Mixtral** — Frankreich (EU) · Open Weight · Starke Leistung, gut dokumentiert
- **Llama 3 (bis 70B)** — Meta (US) · Open Weight · Verbreitet, großes Ökosystem
- **Qwen3 / Gemma 3** — Alibaba / Google · Open Weight · Effizient, gute Mehrsprachigkeit
Faustregel: Für maximale Souveränität EU-Modelle (Teuken, Aleph Alpha, Mistral); für maximale Leistung ein Open-Weight-Modell wie Llama/Qwen – jeweils on-premise oder EU-souverän betrieben.
DSGVO-KI-Checkliste: 12 Punkte vor dem Go-live
- AVV (Art. 28) mit jedem Verarbeiter abgeschlossen.
- Rechtsgrundlage (Art. 6) dokumentiert.
- EU-Datenresidenz für Inferenz *und* Speicherung.
- Zero Data Retention oder kurze, dokumentierte Fristen.
- Kein Training auf Ihren Daten (Opt-out/vertraglich).
- Zweckbindung & Datenminimierung (Art. 5).
- DSFA (Art. 35) bei hohem Risiko durchgeführt.
- Betroffenenrechte (Auskunft, Löschung) technisch umsetzbar.
- Drittlandtransfer geprüft (Art. 44–49, Schrems II).
- CLOUD-Act-Exposition des Anbieters bewertet.
- Schutzbedarfsklassen definiert (welches Modell sieht welche Daten?).
- Audit-Trail & Protokollierung für Nachweisbarkeit.
Was ein lokales LLM nicht kann (die Grenzen)
On-Premise ist kein Allheilmittel. Drei ehrliche Einschränkungen:
- Leistungslücke: Ein 7B-Souverän-Modell wie Teuken ersetzt kein Frontier-Modell für komplexe Aufgaben – für viele Standardaufgaben (Zusammenfassung, Extraktion, RAG) reicht es aber aus.
- Betriebsaufwand: Hardware, Updates, Monitoring und Skalierung liegen bei Ihnen – das verlangt MLOps-Kompetenz.
- On-Prem ≠ automatisch DSGVO-konform: Der Datenabfluss entfällt, aber Rechtsgrundlage, DSFA, Betroffenenrechte und technische Sicherheit (Art. 32) müssen Sie weiterhin erfüllen.
Genau hier setzt ein schutzklassen-basiertes Routing an: sensible Daten an lokale/EU-Modelle, unkritische an die günstigste Cloud – das Beste aus beiden Welten.
Häufige Fragen (FAQ)
Welche KI ist DSGVO-konform?
Keine KI ist „automatisch" DSGVO-konform. Konformität entsteht durch AVV (Art. 28), EU-Datenresidenz, Zero Data Retention und Zweckbindung. Am sichersten sind On-Premise- oder EU-souveräne Sprachmodelle, da hier kein Drittland-Zugriff möglich ist.
Ist ChatGPT DSGVO-konform?
Nur in der Enterprise-/API-Variante mit AVV, EU Data Residency und Zero Data Retention. Die kostenlose und die Plus-Version erfüllen diese Anforderungen nicht.
Was ist On-Premise-KI?
On-Premise-KI bezeichnet KI-Modelle, die vollständig auf eigener Hardware oder im eigenen Rechenzentrum laufen, sodass keine Daten das Unternehmen verlassen. Das macht sie DSGVO-konform by design.
Warum sind US-KI-Anbieter ein DSGVO-Problem?
Über den US CLOUD Act können US-Behörden auf Daten zugreifen, selbst wenn diese in EU-Rechenzentren liegen. Das kollidiert mit Art. 44–50 und Art. 48 DSGVO sowie dem Schrems-II-Urteil.
Welche LLMs kann man on-premise betreiben?
Open-Weight-Modelle wie Mistral/Mixtral, Llama 3, Qwen3 und Gemma 3 sowie souveräne EU-Modelle wie Teuken-7B (OpenGPT-X) und Aleph Alpha Pharia.
Was kostet ein lokales LLM?
Je nach Modellgröße: kleine Modelle ab wenigen Euro pro Monat (CPU), GPU-Server ab ca. 184 €/Monat, dedizierte 48-GB-Systeme 400–700 €/Monat; große 70B-Systeme 2.500–3.500 € einmalig für die Hardware.
Reicht EU-Hosting allein für DSGVO-Konformität?
Nein. EU-Hosting hilft, genügt aber nicht, wenn der Anbieter einem US-Mutterkonzern und damit dem CLOUD Act unterliegt. Erst Sovereign- oder On-Premise-Betrieb schließt den Drittland-Zugriff aus.
Quellen
CLOUD Act (2018) – otris.de / idgard.com · DSGVO Art. 5/28/44–50/48 · Schrems II (C-311/18, EUR-Lex – vor Publikation prüfen) · OpenAI EU Data Residency (16.01.2026), ZDR – openai.com / compound.law · Stanford HAI (10/2025) Privacy-Studie · Teuken-7B – Fraunhofer IAIS / OpenGPT-X · Hardware/Kosten – pronetwork-media.de, redorbit.ai (ROI-Werte als Anbieterangaben). Fact-Check-Status: `data/page-analyses/fable-ban-pillar-research.md`.
Weiterführende Artikel
KI in regulierten Branchen — von Strategie bis Produktion
EU AI Act, DSGVO, MLOps und produktive KI in einem 30-minütigen Strategiegespräch klären — herstellerunabhängig und ISO 27001-zertifiziert.
30 Minuten • Unverbindlich • Sofort verfügbar
Weitere relevante Beiträge
Vertiefen Sie Ihr Wissen mit ausgewählten Artikeln aus der gleichen Themenwelt.

Warum KI-Kosten explodieren — und wie Unternehmen sie wieder unter Kontrolle bringen
KI-Kosten 2026 außer Kontrolle? Token, Reasoning & Agenten treiben die Rechnung. So senken Sie Kosten mit LLM-Routing, Caching & On-Premise – mit Benchmarks.

LLM-Router herstellerunabhängig: Wie intelligentes Multi-LLM-Routing Kosten senkt und Souveränität sichert
Was ist ein LLM-Router? Wie herstellerunabhängiges Multi-LLM-Routing Kosten senkt, Vendor Lock-in vermeidet und DSGVO-konform in der EU läuft.

AI Vendor Lock-in vermeiden: Multi-Modell-Strategie & KI-Exit-Playbook für 2026
Vendor Lock-in bei KI vermeiden: die 4 Arten, Cost of Exit, Multi-Modell-Strategie & Exit-Playbook. So sichern Sie herstellerunabhängige, souveräne KI.
