DSGVO-konforme KI & On-Premise LLM: Guide für Unternehmen

Definition: DSGVO-konforme KI ist kein fertiges Produkt, sondern ein Zustand: Ein KI-System ist DSGVO-konform, wenn Auftragsverarbeitung (AVV), Datenresidenz, Zweckbindung und Datenminimierung erfüllt sind und kein unbefugter Drittland-Zugriff möglich ist. Kein US-Cloud-Tool ist „automatisch" konform – am sichersten ist eine On-Premise- oder EU-souveräne Verarbeitung. *(snippet-ready, ~50 Wörter)*

Der Fable-Ban vom Juni 2026 hat es jedem Entscheider vor Augen geführt: Wer seine Daten in US-Modelle gibt, gibt die Kontrolle ab. Dieser Leitfaden beantwortet die zwei Fragen, die deutsche Unternehmen jetzt stellen: Welche KI ist DSGVO-konform? – und wie verhindere ich Datenabfluss technisch, durch On-Premise- und souveräne Sprachmodelle.

Was ist DSGVO-konforme KI? Die 4 Stufen der Konformität

„DSGVO-konform" ist eine Leiter, kein Schalter. Von schwächster zu stärkster Datenhoheit:

US-Cloud, konfiguriert (ChatGPT Enterprise/Copilot/Azure OpenAI mit EU-Residency + AVV + Zero Data Retention) – nur bedingt konform, CLOUD-Act-Restrisiko bleibt.
EU-Cloud (EU-gehostete Modelle, EU-Anbieter) – besser, aber bei US-Mutterkonzern weiter CLOUD-Act-exponiert.
Sovereign Cloud (EU-Betreiber, EU-Recht, kein US-Zugriff) – hohe Konformität.

Nicht jedes Modell passt zu jedem Schutzbedarf. Die wichtigsten on-premise einsetzbaren Modelle im Überblick:

Genau diesen Weg gibt es als betriebsfertige Lösung: lokale KI für Unternehmen von ADVISORI — offene Spitzenmodelle on-premise oder in eigenen europäischen Rechenzentren, DSGVO- und EU-AI-Act-konform, sofort per API nutzbar.

Ist ChatGPT DSGVO-konform? (und Copilot, Gemini, DeepSeek)

ChatGPT: nur in der Enterprise-/API-Variante mit AVV, EU Data Residency (Opt-in, seit 16.01.2026 verfügbar) und Zero Data Retention – die kostenlose/Plus-Version ist es nicht.
Microsoft Copilot: im EWR-Tenant mit entsprechenden Verträgen möglich; Konfiguration entscheidet.
Google Gemini: über Workspace/Vertex mit EU-Optionen bedingt möglich.
DeepSeek: speichert IP, Eingaben und Dokumente ohne Transparenz, kein belastbarer AVV – als nicht DSGVO-konform einzustufen.

Die Kernregel: Konformität entsteht aus Vertrag + Konfiguration + Standort, nicht aus dem Markennamen.

Warum US-KI-Anbieter ein DSGVO-Risiko sind

Der CLOUD Act (2018)

Der US *Clarifying Lawful Overseas Use of Data Act* verpflichtet US-Unternehmen, Daten herauszugeben – unabhängig vom Speicherort, auch aus EU-Rechenzentren. Das kollidiert mit der DSGVO (Transparenz, Zweckbindung) und mit Art. 48 DSGVO (Anordnungen von Drittstaaten sind keine zulässige Übermittlungsgrundlage).

30-Tage-Speicherung & Drittlandtransfer

US-APIs speichern Ein-/Ausgaben typischerweise rund 30 Tage zum Missbrauchs-Monitoring; der Transfer in die USA fällt unter Art. 44–50 DSGVO und das Schrems-II-Urteil (C-311/18), das Drittlandtransfers stark einschränkt.

Training auf Nutzerdaten

Mehrere US-Anbieter nutzen Eingaben standardmäßig zum Training (siehe Stanford-HAI-Studie 10/2025), sofern nicht aktiv widersprochen wird – ein Zweckbindungs-Problem (Art. 5 DSGVO).

Was macht eine KI DSGVO-konform? (Checkliste)

AVV (Art. 28 DSGVO) mit dem Anbieter abgeschlossen.
EU-Hosting / Datenresidenz (Inferenz *und* Speicherung in der EU, kein externer Zugriff).
Zero Data Retention oder dokumentierte, kurze Speicherfristen.
Zweckbindung & Datenminimierung (Art. 5) – keine Weiterverwendung zum Training.
DSFA (Datenschutz-Folgenabschätzung) bei hohem Risiko.

On-Premise vs. EU-Cloud vs. Sovereign Cloud

Kriterium · On-Premise · EU-Cloud · Sovereign Cloud

Datenhoheit — höchste · mittel · hoch
CLOUD-Act-Risiko — keines · bei US-Mutter ja · keines
Anschaffungskosten — hoch (Hardware) · niedrig · mittel
Setup-Zeit — länger · sofort · mittel
Skalierung — begrenzt · hoch · hoch

Was ist On-Premise-KI / ein lokales LLM?

On-Premise-KI bedeutet: Modell und Infrastruktur laufen vollständig auf eigener Hardware oder im eigenen Rechenzentrum – keine Daten verlassen das Unternehmen. Vorteile: maximale Datenhoheit, DSGVO-Konformität by design, niedrige Latenz, Unabhängigkeit von Anbieter-Sperren (wie dem Fable-Ban). Nachteile: Anschaffungskosten, Einrichtungszeit, eigener Betrieb/Wartung.

Welche LLMs kann man on-premise betreiben?

International (Open-Weight): Mistral / Mixtral, Llama 3 (bis 70B), Qwen3, Gemma 3 – frei herunterladbar und lokal betreibbar.
Souverän aus Deutschland/EU: Teuken-7B (Projekt OpenGPT-X, Fraunhofer IAIS u. a., trainiert auf allen 24 EU-Amtssprachen, Open Source, on-prem einsetzbar) und Aleph Alpha (Pharia) als deutscher Souverän-Anbieter.

Was kostet ein lokales LLM? (Hardware-Realität)

Kleine Modelle (CPU): ab €7–14/Monat gehostet; GPU-Server (RTX 4000 Ada, DE-Rechenzentrum) ca. €184/Monat; dediziert 48 GB VRAM €400–700/Monat.
VRAM-Faustregel: 7B-Modell ~16 GB; 30B ~16–24 GB (RTX 5080/5090-Klasse); 70B+ unified-memory-Systeme (z. B. 128 GB) €2.500–3.500 einmalig.
*Hinweis:* ROI-Versprechen mancher Anbieter („80–90 % günstiger") sind Marketingwerte – im Einzelfall prüfen.

Lohnt sich On-Premise-KI für den Mittelstand? (Entscheidungs-Framework)

Sensible/personenbezogene Daten + regulierte Branche → On-Premise oder Sovereign.
Sensibel, aber moderates Volumen → EU-/Sovereign-Cloud.
Unkritische Aufgaben → günstigstes geeignetes (auch Cloud-)Modell.
Gemischt → schutzklassen-basiertes Routing (siehe LLM-Router).

Souverän ohne eigene Hardware: ADVISORI × Yorizon

Sie wollen die On-Premise-Vorteile ohne eigenen GPU-Betrieb? Mit unserem Partner Yorizon betreiben wir leistungsstarke Modelle auf europäischer KI-Infrastruktur – EU-Inferenz, EU-Recht, kein CLOUD Act. Der Synthara LLM-Broker routet sensible Daten ausschließlich an diese souveränen Modelle. Den strategischen Rahmen liefert unser Pillar-Beitrag: Digitale Souveränität bei KI.

Schrems II, das Data Privacy Framework und Art. 48 DSGVO: der rechtliche Kern

Der Konflikt zwischen US-Recht und DSGVO ist kein theoretisches Risiko. Das Schrems-II-Urteil (EuGH, C-311/18, Juli 2020) kippte das „Privacy Shield", weil US-Überwachungsgesetze (FISA 702) und fehlende Rechtsbehelfe für EU-Bürger kein angemessenes Schutzniveau garantieren. Der Nachfolger – das EU-US Data Privacy Framework (DPF) vom Juli 2023 – ist derzeit gültig: Das EU-Gericht wies die Klage Latombe am 3. September 2025 ab. Aber: Die Berufung liegt seit Ende 2025 beim EuGH, und zwei Vorgänger-Rahmenwerke (Safe Harbor, Privacy Shield) sind bereits gefallen. Die belastbare Einordnung lautet daher: *heute gültig, in der Haltbarkeit unsicher – planen Sie für Souveränität, nicht für den Fortbestand des DPF.*

Hinzu kommt Art. 48 DSGVO: Anordnungen von Drittstaaten-Behörden (wie unter dem CLOUD Act) sind nur über ein internationales Abkommen (z. B. ein MLAT) eine zulässige Übermittlungsgrundlage. Der CLOUD Act umgeht das – ein direkter Normkonflikt, bei dem Bußgelder bis 4 % des weltweiten Jahresumsatzes drohen.

Welche On-Premise-LLMs eignen sich? (Vergleich)

Nicht jedes Modell passt zu jedem Schutzbedarf. Die wichtigsten on-premise einsetzbaren Modelle im Überblick:

Modell · Herkunft · Lizenz · Besonderheit

**Teuken-7B** — OpenGPT-X / Fraunhofer (DE) · Open Source · Auf allen 24 EU-Amtssprachen trainiert; souveräne Option, kein GPT-Ersatz
**Aleph Alpha (Pharia)** — Heidelberg (DE) · kommerziell/souverän · Deutscher Anbieter, On-Prem-/Sovereign-Fokus
**Mistral / Mixtral** — Frankreich (EU) · Open Weight · Starke Leistung, gut dokumentiert
**Llama 3 (bis 70B)** — Meta (US) · Open Weight · Verbreitet, großes Ökosystem
**Qwen3 / Gemma 3** — Alibaba / Google · Open Weight · Effizient, gute Mehrsprachigkeit

Faustregel: Für maximale Souveränität EU-Modelle (Teuken, Aleph Alpha, Mistral); für maximale Leistung ein Open-Weight-Modell wie Llama/Qwen – jeweils on-premise oder EU-souverän betrieben.

DSGVO-KI-Checkliste: 12 Punkte vor dem Go-live

AVV (Art. 28) mit jedem Verarbeiter abgeschlossen.
Rechtsgrundlage (Art. 6) dokumentiert.
EU-Datenresidenz für Inferenz *und* Speicherung.
Zero Data Retention oder kurze, dokumentierte Fristen.
Kein Training auf Ihren Daten (Opt-out/vertraglich).
Zweckbindung & Datenminimierung (Art. 5).
DSFA (Art. 35) bei hohem Risiko durchgeführt.
Betroffenenrechte (Auskunft, Löschung) technisch umsetzbar.
Drittlandtransfer geprüft (Art. 44–49, Schrems II).
CLOUD-Act-Exposition des Anbieters bewertet.
Schutzbedarfsklassen definiert (welches Modell sieht welche Daten?).
Audit-Trail & Protokollierung für Nachweisbarkeit.

Was ein lokales LLM nicht kann (die Grenzen)

On-Premise ist kein Allheilmittel. Drei ehrliche Einschränkungen:

Leistungslücke: Ein 7B-Souverän-Modell wie Teuken ersetzt kein Frontier-Modell für komplexe Aufgaben – für viele Standardaufgaben (Zusammenfassung, Extraktion, RAG) reicht es aber aus.
Betriebsaufwand: Hardware, Updates, Monitoring und Skalierung liegen bei Ihnen – das verlangt MLOps-Kompetenz.
On-Prem ≠ automatisch DSGVO-konform: Der Datenabfluss entfällt, aber Rechtsgrundlage, DSFA, Betroffenenrechte und technische Sicherheit (Art. 32) müssen Sie weiterhin erfüllen.

Genau hier setzt ein schutzklassen-basiertes Routing an: sensible Daten an lokale/EU-Modelle, unkritische an die günstigste Cloud – das Beste aus beiden Welten.

Häufige Fragen (FAQ)

Welche KI ist DSGVO-konform?

Keine KI ist „automatisch" DSGVO-konform. Konformität entsteht durch AVV (Art. 28), EU-Datenresidenz, Zero Data Retention und Zweckbindung. Am sichersten sind On-Premise- oder EU-souveräne Sprachmodelle, da hier kein Drittland-Zugriff möglich ist.

Ist ChatGPT DSGVO-konform?

Nur in der Enterprise-/API-Variante mit AVV, EU Data Residency und Zero Data Retention. Die kostenlose und die Plus-Version erfüllen diese Anforderungen nicht.

Was ist On-Premise-KI?

On-Premise-KI bezeichnet KI-Modelle, die vollständig auf eigener Hardware oder im eigenen Rechenzentrum laufen, sodass keine Daten das Unternehmen verlassen. Das macht sie DSGVO-konform by design.

Warum sind US-KI-Anbieter ein DSGVO-Problem?

Über den US CLOUD Act können US-Behörden auf Daten zugreifen, selbst wenn diese in EU-Rechenzentren liegen. Das kollidiert mit Art. 44–50 und Art. 48 DSGVO sowie dem Schrems-II-Urteil.

Welche LLMs kann man on-premise betreiben?

Open-Weight-Modelle wie Mistral/Mixtral, Llama 3, Qwen3 und Gemma 3 sowie souveräne EU-Modelle wie Teuken-7B (OpenGPT-X) und Aleph Alpha Pharia.

Was kostet ein lokales LLM?

Je nach Modellgröße: kleine Modelle ab wenigen Euro pro Monat (CPU), GPU-Server ab ca. 184 €/Monat, dedizierte 48-GB-Systeme 400–700 €/Monat; große 70B-Systeme 2.500–3.500 € einmalig für die Hardware.

Reicht EU-Hosting allein für DSGVO-Konformität?

Nein. EU-Hosting hilft, genügt aber nicht, wenn der Anbieter einem US-Mutterkonzern und damit dem CLOUD Act unterliegt. Erst Sovereign- oder On-Premise-Betrieb schließt den Drittland-Zugriff aus.

Quellen

CLOUD Act (2018) – otris.de / idgard.com · DSGVO Art. 5/28/44–50/48 · Schrems II (C-311/18, EUR-Lex – vor Publikation prüfen) · OpenAI EU Data Residency (16.01.2026), ZDR – openai.com / compound.law · Stanford HAI (10/2025) Privacy-Studie · Teuken-7B – Fraunhofer IAIS / OpenGPT-X · Hardware/Kosten – pronetwork-media.de, redorbit.ai (ROI-Werte als Anbieterangaben). Fact-Check-Status: `data/page-analyses/fable-ban-pillar-research.md`.

Was ist DSGVO-konforme KI? On-Premise & souveräne Sprachmodelle für Unternehmen (2026)

Was ist DSGVO-konforme KI? Die 4 Stufen der Konformität

Ist ChatGPT DSGVO-konform? (und Copilot, Gemini, DeepSeek)