Wie wählt man den richtigen KI-Berater? 10 Kriterien für Unternehmen

Den richtigen KI-Berater wählt man nicht nach Markenname, sondern entlang von 10 Kriterien: regulatorische Kompetenz (EU AI Act, DSGVO, ISO 42001), Branchentiefe, methodische Roadmap, Vendor-Unabhängigkeit, MLOps-Reife, belastbare Referenzen, Team-Mix aus Beratern und Engineers, transparentes Preismodell, DSGVO-konforme Datenhaltung und langfristige Nachbetreuung. Die Anbieterwahl ist das größte Risiko in einem KI-Projekt.
Warum die Anbieterwahl das größte Risiko in KI-Projekten ist
In vier von fünf gescheiterten KI-Projekten liegt die Ursache nicht in der Technologie, sondern in der Anbieterwahl. Das Modell, die Cloud, der LLM-Provider — all das ist austauschbar. Der Beratungspartner ist es nicht. Ein KI-Berater trifft in den ersten Wochen Entscheidungen über Datenarchitektur, Betriebsmodell und Regulatorik, die sich später nur mit erheblichem Aufwand korrigieren lassen. Wer die falsche Beratung wählt, verliert nicht nur Budget, sondern auch Monate Einführungszeit — in einem regulatorischen Umfeld, in dem 2026 jeder Monat zählt.
Dieser Leitfaden ist keine Werbung, sondern ein Bewertungsraster. Die zehn Kriterien sind so gewählt, dass Sie sie auf jeden Anbieter anwenden können — auch auf ADVISORI. Am Ende finden Sie Red Flags, einen RFP-Fahrplan und eine Entscheidungshilfe für die Frage, ob Sie KI intern aufbauen oder extern einkaufen sollten.
Die 10 Kriterien — im Überblick
- Regulatorische Kompetenz: EU AI Act, DORA, DSGVO, ISO 42001
- Branchentiefe in regulierten Sektoren: Banken, Versicherungen, Gesundheit
- Methodik: belastbares Roadmap-Framework statt Ad-hoc-Beratung
- Technologie-Neutralität: vendor-independent statt Cloud- oder LLM-Lock-in
- MLOps- und Produktions-Kompetenz, nicht nur PoC-Factory
- Referenzen und messbare Ergebnisse: Case Studies mit Zahlen
- Team-Zusammensetzung: Berater plus Engineers, nicht nur Berater
- Transparentes Preismodell: Festpreis-Phasen statt offenes T&M
- Datenschutz und On-Premise-Fähigkeit — gerade für DACH entscheidend
- Nachbetreuung und Retainer-Modelle über die Einführung hinaus
Kriterium 1: Regulatorische Kompetenz (EU AI Act, DORA, DSGVO, ISO 42001)
Der EU AI Act (Verordnung (EU) 2024/1689) reguliert seit 2024 KI nach Risikoklassen und trifft damit jedes Unternehmen, das KI im Kundenkontakt, in der Personalentscheidung oder in kritischer Infrastruktur einsetzt. Für Finanzunternehmen addiert DORA die Anforderungen an IKT-Risikomanagement. Die DSGVO bleibt Querschnittsrecht, ISO 42001 ist seit 2024 der neue Management-System-Standard speziell für KI.
Was das für die Beraterwahl bedeutet: Fragen Sie konkret, wer im Team den AI Act gelesen hat (nicht „kennt"), wer schon ein Hochrisiko-System konform in Betrieb gebracht hat, und wie Governance-Artefakte (Risk-Assessments, Datenblätter, Monitoring) im Projekt verankert werden. Ein Anbieter, der „Regulatorik machen wir später" sagt, ist disqualifiziert — später heißt Rückbau und Audit-Findings.
Prüffrage: „Zeigen Sie mir einen Use-Case, den Sie nach AI-Act-Klassifikation als Hochrisiko eingestuft und dann konform betrieben haben — mit welchem Governance-Setup?" Wer hier nur abstrakt antwortet, hat es nie gemacht.
Kriterium 2: Branchentiefe in regulierten Sektoren
KI-Beratung in einer Bank ist nicht KI-Beratung im Onlineshop. In regulierten Sektoren — Finanzdienstleistung, Versicherung, Gesundheit, Energie, öffentliche Verwaltung — sind Datenverfügbarkeit, Prüfketten und Freigabeprozesse die eigentlichen Engpässe, nicht das Modell. Ein Berater ohne Branchentiefe optimiert auf Modellgüte und übersieht, dass die BaFin, das BSI oder der Datenschutzbeauftragte am Ende das Deployment blockieren.
Branchentiefe zeigt sich nicht im Logo-Karussell auf der Website, sondern in Gesprächsvokabular. Fragen Sie nach MaRisk-, VAIT- oder BAIT-Erfahrung, wenn Sie Bank sind. Fragen Sie nach MDR-Erfahrung, wenn Sie im Gesundheitsbereich sind. Wer auf diese Begriffe flüssig antwortet, hat die Projekte wirklich gemacht.
Kriterium 3: Methodik — Roadmap-Framework statt Ad-hoc-Beratung
Gute KI-Beratung ist methodisch. Sie folgt einem Rahmen, der Phasen, Artefakte und Entscheidungspunkte klar benennt — typischerweise Discovery, Pilot, Scale, Operate. Ad-hoc-Beratung dagegen liefert Workshops und Strategiefolien, aber keine überprüfbaren Zwischenergebnisse. Ein belastbares Framework erkennen Sie daran, dass der Anbieter Ihnen das Artefakt-Set pro Phase vorab zeigt: Welche Deliverables bekommen Sie zu welchem Zeitpunkt in welcher Qualität?
Achten Sie besonders auf die Übergänge. Wer zwischen Pilot und Produktivbetrieb nur einen Foliensatz liefert, produziert PoC-Leichen. Wer ein Scale-Artefakt mit Datenpipelines, Monitoring und Runbooks übergibt, weiß, wie Produktion geht.
Kriterium 4: Technologie-Neutralität
Manche Beratungen sind faktisch Verkaufsarme eines Cloud- oder Modellanbieters. Das ist nicht per se schlecht — aber es muss offen gelegt werden. Wenn der Anbieter unabhängig vom Technologiestack behauptet, dann fordern Sie den Beweis: Zeigen Sie mir zwei Referenzprojekte auf unterschiedlichen Hyperscalern und ein weiteres on-premise. Ein echter vendor-unabhängiger Partner kann das problemlos.
Lock-in entsteht nicht durch einen Anbieter allein, sondern durch die Architekturentscheidungen, die er Ihnen empfiehlt. Fragen Sie konkret: „Welche Komponenten unseres Setups wären in 24 Monaten zu einem anderen Anbieter migrierbar — und mit welchem Aufwand?" Ein belastbarer Berater hat diese Antwort schon vor dem Projekt.
Kriterium 5: MLOps- und Produktions-Kompetenz
Die größte Lücke im KI-Beratungsmarkt liegt zwischen Proof-of-Concept und Produktion. Viele Anbieter sind exzellent darin, einen beeindruckenden Prototyp in vier Wochen zu bauen — und lassen den Kunden dann mit einem Jupyter-Notebook stehen, das niemand in Betrieb nehmen kann. MLOps-Reife ist der Unterschied zwischen „KI-Experimente" und „KI im Geschäftsbetrieb".
Konkret zu prüfen: Hat der Anbieter Modell-Versionierung, Data- und Feature-Stores, Monitoring für Drift und Datenqualität, automatisierte Retraining-Pipelines und Incident-Response für KI-Systeme? Wenn zu einer dieser Fragen eine zögerliche Antwort kommt, werden Sie den Weg zur Produktion selbst gehen müssen.
Kriterium 6: Referenzen und messbare Ergebnisse
Eine gute KI-Referenz enthält drei Zahlen: die Ausgangslage, das Ergebnis und die investierte Zeit. „Wir haben für einen Versicherer die Schadenbearbeitung automatisiert" ist keine Referenz. „Wir haben 68 Prozent der eingehenden Schadensfälle automatisch vorklassifiziert, die Bearbeitungszeit von 6 auf 2 Tage reduziert und die Umsetzung in 11 Monaten erreicht" ist eine.
Wenn der Anbieter keine Zahlen zeigen darf (NDA), darf er Ihnen zumindest den Bereich nennen und idealerweise ein Referenzgespräch mit dem Projektverantwortlichen auf Kundenseite vermitteln. Ein Anbieter, der keine Referenz erreichbar machen kann, hat entweder keine — oder die Kunden möchten nicht sprechen. Beides ist ein Signal.
Kriterium 7: Team-Zusammensetzung — Berater plus Engineers
Reine Beratungshäuser liefern Foliensätze. Reine Implementierungshäuser liefern Code ohne strategischen Rahmen. Für ein KI-Projekt brauchen Sie beides in einem Team. Fragen Sie in der Anbahnung, wer im Delivery-Team fest sitzt: Welchen Anteil hat der Senior-Berater? Wer schreibt den produktiven Code? Wer übernimmt den Betrieb? Ist das eine Person, zwei oder fünfzehn?
Ein gemischtes Team aus drei bis fünf Rollen — Strategieberater, Data Engineer, ML Engineer, Governance-Spezialist und Solution Architect — deckt die Spanne eines ernsthaften KI-Projekts ab. Wer weniger bietet, lagert Teile aus — fragen Sie, an wen.
Kriterium 8: Transparentes Preismodell
Die klarste Unterscheidung im KI-Beratungsmarkt läuft beim Preismodell. Time-and-Materials (T&M) ohne Deckel bedeutet offenes Budget mit Anreiz, das Projekt zu strecken. Festpreis pro Phase mit klaren Abnahmekriterien verteilt das Risiko fair: Der Anbieter trägt das Lieferrisiko, Sie tragen das Scope-Risiko. Hybrid-Modelle (Festpreis für Discovery und Pilot, T&M mit Cap für Scale) sind meist das Beste aus beiden Welten.
Achten Sie auf verdeckte Kostenkomponenten: Lizenzen für proprietäre Bibliotheken, Subscription-Gebühren für Modell-APIs, Data-Labeling-Kosten, die zusätzlich zum Tagessatz laufen. Ein transparenter Anbieter zeigt Ihnen die Gesamtkosten (TCO) über 24 Monate, nicht nur den Tagessatz für die nächsten acht Wochen.
Kriterium 9: Datenschutz und On-Premise-Fähigkeit
Im DACH-Raum — besonders in der Finanzdienstleistung, im Gesundheitssektor und in der öffentlichen Verwaltung — ist die Frage „wo stehen die Daten?" keine technische Fußnote, sondern ein Vertriebskriterium. Ein Berater, der nur US-Hyperscaler-Setups kennt, fällt bei Ihrem Datenschutzbeauftragten durch.
Prüffragen: Kann der Anbieter ein Setup vorschlagen, bei dem personenbezogene oder sensible Daten nie das EU-Rechenzentrum verlassen? Gibt es Erfahrung mit europäischen Cloud-Anbietern (Open Telekom Cloud, IONOS, STACKIT) oder vollständig on-premise? Wie wird mit LLM-Inferenz umgegangen — dedizierte EU-Instanzen, private Endpoints, lokal gehostete Open-Source-Modelle? Wer hier konkret antworten kann, spart Ihnen monatelange Architekturdiskussionen.
Kriterium 10: Nachbetreuung und Retainer-Modelle
KI-Systeme degradieren im Betrieb — Modelle driften, Datenverteilungen ändern sich, Compliance-Anforderungen verschärfen sich. Ein guter KI-Berater endet deshalb nicht mit dem Go-Live. Fragen Sie explizit nach dem Modell für die Phase danach: Gibt es einen Retainer, der Monitoring, Modell-Refresh und kleinere Erweiterungen abdeckt? Was kostet er monatlich? Wer ist der benannte Ansprechpartner?
Die Alternative — „rufen Sie uns an, wenn etwas brennt" — ist für ein produktives KI-System unzureichend. Ein definiertes Betriebsmodell nach dem Go-Live gehört in das Angebot, nicht in nachgelagerte Verhandlungen, wenn das Projektbudget bereits aufgebraucht ist.
Red Flags: Woran Sie einen schwachen KI-Berater erkennen
Ein paar Muster tauchen in der Anbahnung immer wieder auf. Nehmen Sie jedes einzelne ernst:
- Reine Verkaufspräsentation ohne technische Tiefe: nach 60 Minuten wissen Sie nicht, wie der Anbieter arbeitet, aber der Tagessatz steht.
- „Agentic AI" als zentraler Begriff, ohne dass klar wird, was konkret gebaut werden soll — Buzzword-Architektur statt Problem-Analyse.
- Nur ein Technologiestack im Portfolio (nur OpenAI, nur AWS, nur Azure) — der Anbieter empfiehlt, was er kann, nicht was passt.
- Keine konkreten Referenzen mit Zahlen, nur Logo-Wände von Firmen, bei denen angeblich „schon mal etwas gemacht" wurde.
- Unklare Trennung zwischen Delivery-Team und Account-Team: im Pitch sitzen Senior-Berater, im Projekt plötzlich Juniors.
- Regulatorik wird vertröstet („das machen wir in der zweiten Phase") statt als Leitplanke gesetzt.
- Keine Angaben zu MLOps, Monitoring oder Runbooks — der Anbieter denkt bis zum Demo-Termin, nicht bis zum Produktivbetrieb.
- Preis ist überraschend niedrig und deutlich unter Marktniveau — der Anbieter subventioniert ein Einstiegsprojekt, um Sie im Scale zu binden.
So führen Sie eine RFP für KI-Beratung durch — 5 Schritte
- Fassen Sie Problem und Zielbild in einer einseitigen Brief-Notiz zusammen: Welcher Geschäftsfall, welche KPI, welcher Zeithorizont, welche regulatorischen Leitplanken. Ohne diese Seite wird jede RFP schwammig.
- Laden Sie drei bis fünf Anbieter ein — weniger als drei liefert keinen Vergleich, mehr als fünf kostet alle Beteiligten nur Zeit. Mischen Sie bewusst: einen großen Namen, einen Spezialisten, einen Herausforderer.
- Verlangen Sie einen Solutioning-Workshop mit echten (aber anonymisierten) Daten oder Prozessbeispielen. Wer nur Foliensätze liefert, fällt raus. Echte Anbieter zeigen in 2 bis 4 Stunden, wie sie denken.
- Bewerten Sie die Angebote entlang der 10 Kriterien, mit Gewichtung. Regulatorik, Methodik und MLOps verdienen mehr Gewicht als Preis — ein günstiger Anbieter ohne Produktionskompetenz ist am Ende der teuerste.
- Starten Sie mit einem zeitlich begrenzten Discovery/Pilot (6 bis 10 Wochen), erst dann wird Scale ausgeschrieben. So können Sie einen Anbieter mit überschaubarem Risiko kennenlernen, bevor das Hauptbudget fließt.
Die 5 Fragen, die Sie im Erstgespräch stellen sollten
- „Zeigen Sie mir einen Use-Case, den Sie in den letzten zwölf Monaten in Produktion gebracht haben — mit Zahlen zum Ergebnis und zur Laufzeit."
- „Wie ordnen Sie unser Vorhaben nach EU AI Act Risikoklassen ein, und welche Governance-Artefakte entstehen im Projekt?"
- „Wer aus dem Team, das wir heute sehen, arbeitet tatsächlich im Projekt — und in welchem Umfang?"
- „Welche Komponenten unseres Setups könnten wir in 24 Monaten zu einem anderen Anbieter oder Stack migrieren — und mit welchem Aufwand?"
- „Wie sieht das Betriebsmodell nach dem Go-Live aus — Retainer, Incident-Response, Modell-Refresh — und was kostet das monatlich?"
Intern aufbauen oder extern einkaufen? Eine Entscheidungsmatrix
Die Frage „KI-Team intern aufbauen oder extern einkaufen?" ist selten schwarz-weiß. Sechs Faktoren verschieben die Antwort:
- Strategische Relevanz: Ist KI für Sie ein Wettbewerbsvorteil (→ Kompetenz intern halten) oder Standardisierung (→ extern)?
- Regulatorische Dichte: Je stärker reguliert, desto mehr interne Verantwortung — Beratung kann vorbereiten, nicht ablösen.
- Zeitkritik: Interner Aufbau dauert 12 bis 24 Monate. Bei akutem Bedarf ist externes Know-how der einzige realistische Weg.
- Volumen: Unter fünf produktiven Use-Cases lohnt sich kein eigenes Team — das Fixkostenniveau einer KI-Abteilung beginnt bei drei bis fünf Vollzeitstellen.
- Datenverfügbarkeit: Stehen Ihre Kerndaten intern schon in nutzbarer Form? Wenn nein, braucht es zuerst externe Data-Engineering-Kompetenz.
- Talentmarkt: Kann Ihr Standort realistisch Senior-ML-Engineers und Governance-Profile anziehen? Wenn nein, ist ein hybrides Modell oft überlegen.
Das stabilste Modell für mittelgroße DACH-Unternehmen ist in unserer Erfahrung hybrid: ein kleines internes Team (2 bis 4 Personen) mit Strategie-, Produkt- und Governance-Verantwortung, flankiert durch eine externe Beratung für Discovery, Engineering-Spitzen und Regulatorik-Tiefe. So halten Sie die Entscheidungshoheit im Haus und kaufen gezielt Kapazität und Expertise dazu, wenn sie gebraucht wird.
Häufig gestellte Fragen zur Auswahl von KI-Beratern
Was ist das wichtigste Kriterium bei der Auswahl eines KI-Beraters?
In regulierten Sektoren ist regulatorische Kompetenz (EU AI Act, DSGVO, ISO 42001, branchenspezifische Aufsicht) der mit Abstand wichtigste Faktor. Ein technisch starker Anbieter ohne Regulatorik-Tiefe produziert im Zweifel ein System, das vom Datenschutzbeauftragten oder der Aufsicht nicht freigegeben wird. In weniger regulierten Sektoren rückt MLOps-Reife und Methodik an die Spitze.
Wie viele KI-Beratungen sollte ich in eine Ausschreibung einladen?
Drei bis fünf Anbieter ist der Sweet Spot. Weniger als drei liefert keinen sinnvollen Vergleich, mehr als fünf kostet alle Beteiligten Zeit, ohne die Entscheidungsqualität zu erhöhen. Mischen Sie bewusst: ein großer Name (Benchmarking), ein Spezialist (Tiefe) und ein Herausforderer (frische Perspektive).
Wie lange dauert ein typischer RFP-Prozess für KI-Beratung?
Für ein mittelgroßes KI-Projekt sollten Sie 6 bis 10 Wochen für die RFP einplanen: 2 Wochen Briefing und Versand, 3 bis 4 Wochen Angebotserstellung und Solutioning-Workshops, 1 bis 2 Wochen Bewertung und Entscheidung, 1 bis 2 Wochen Vertragsverhandlung. Schneller geht nur, wenn Sie Ihren Anbieterkreis bereits vorqualifiziert haben.
Sollten wir KI intern aufbauen oder extern einkaufen?
Das hängt von sechs Faktoren ab: strategische Relevanz, regulatorische Dichte, Zeitkritik, Use-Case-Volumen, Datenverfügbarkeit und Talentmarkt. Für mittelgroße DACH-Unternehmen ist ein hybrides Modell meist am stabilsten — ein kleines internes Team für Strategie und Governance plus externe Beratung für Engineering-Spitzen und Regulatorik-Tiefe.
Woran erkenne ich einen unseriösen KI-Berater?
Typische Red Flags sind: reine Verkaufspräsentation ohne technische Tiefe, Buzzword-Stapel ohne konkrete Architektur („agentic AI"), keine Referenzen mit Zahlen, unklare Trennung zwischen Pitch- und Delivery-Team, Regulatorik als Nachgedanke, fehlende MLOps-Kompetenz und auffällig niedrige Einstiegspreise als Lock-in-Hebel.
Ist ein spezialisierter oder generalistischer Anbieter besser?
Für regulierte Branchen ist ein Spezialist mit Branchentiefe fast immer überlegen — BaFin-, MaRisk- oder MDR-Erfahrung entsteht nicht nebenbei. Für breite Transformationsprogramme quer durch mehrere Geschäftsbereiche kann ein Generalist mit starkem Partnernetzwerk besser passen. Die Gretchenfrage: Ist Ihre regulatorische Exposition hoch oder niedrig?
Welche Rolle spielt der EU AI Act bei der Anbieterwahl?
Eine zentrale. Seit August 2024 treten die Vorschriften schrittweise in Kraft, mit voller Wirkung für Hochrisiko-Systeme ab 2026/2027. Ein KI-Berater, der Ihren Use-Case nicht nach AI-Act-Risikoklassen einordnen kann und keine Governance-Artefakte (Konformitätserklärung, Risk-Assessment, Monitoring-Setup) im Angebot vorsieht, ist für Projekte mit Aufsichtsbezug nicht ausreichend qualifiziert.
Was sollte im Vertrag mit einer KI-Beratung stehen?
Mindestens: klare Deliverables pro Phase mit Abnahmekriterien, IP- und Code-Eigentum nach Projektende, Datenverarbeitungsvertrag (DSGVO-konform), benannte Schlüsselpersonen im Delivery-Team, Eskalationspfad, Ausstiegsklausel mit Handover-Paket, Retainer- oder Support-Option nach Go-Live, Haftungsregelung bei Regulatorik-Findings und eine Regelung zu Subunternehmern. Standard-Beraterverträge ohne diese Punkte sind unzureichend.
Weitere relevante Beiträge
Vertiefen Sie Ihr Wissen mit ausgewählten Artikeln aus der gleichen Themenwelt.

Generative KI im Unternehmen: Vom Pilot zum produktiven Enterprise-Rollout
Generative KI produktiv einführen: die drei Deployment-Muster (Copilot, RAG, Fine-Tuning), fünf Use-Case-Archetypen, Compliance nach EU AI Act und OWASP LLM Top 10, realistische Kosten-Mathematik und das Betriebsmodell, an dem die meisten Pilotprojekte scheitern.

Welche 4 Arten von KI gibt es? Der vollständige Leitfaden
Die 4 Arten künstlicher Intelligenz nach Arend Hintze (2016): Reaktive Maschinen, Limited Memory, Theory of Mind und selbstbewusste KI. Mit Beispielen, Einordnung im EU AI Act und Bezug zum heutigen Unternehmenseinsatz.

KI-Roadmap entwickeln: Die 4-Phasen-Methode für Enterprise AI-Transformation
Eine KI-Roadmap in vier Phasen: Potenzial-Assessment, Use-Case-Auswahl, Pilot und Skalierung. Mit Zeitplan 12-18 Monate, Scoring-Matrix, Pitfall-Taxonomie, EU-AI-Act- und ISO-42001-Einbettung sowie einer FAQ für Entscheider.
