← Zurück zum Blog

48 Stunden, um einen Sprach-KI-Agenten in Produktion zu bringen, sind kurz. Über 200 von Vocalis 2025-2026 begleitete Projekte wird diese Frist in 6 von 10 Fällen eingehalten, wenn das Unternehmen vorbereitet kommt. Siehe technischen Kontext im Pillar-Guide Sprach-KI-Agent.

Voraussetzungen (vor H0)

Fehler Nr. 1 bei gescheiterten Deployments: ohne Vorbereitung der Inputs starten.

Pre-Deployment-Checkliste

Fehlt ein Element, addieren Sie 24 bis 72 Stunden zum Zeitplan.

Tag 1 — Konfiguration (8 Stunden)

Stunde 0 bis 1: operatives Kickoff

Video-Briefing zwischen Fachreferent, Sponsor und Vocalis-Team. In 60 Minuten validieren wir: Phase-1-Umfang, Zielmotive, Agent-Persona, KPIs, Schwellenwerte.

Stunde 1 bis 3: Konzeption des Gesprächsflusses

Das Vocalis-Team strukturiert den Gesprächsfluss aus den gelieferten Transkripten. Wir identifizieren Hauptintentionen (3 bis 7), zu erfassende Variablen, Transferbedingungen.

Stunde 3 bis 4: Stimmenauswahl und Klonen

Drei Optionen: Bibliotheksstimme, personalisierte Stimme (Klonen aus 90 Sekunden Aufnahme), oder Premium-ElevenLabs-Synthese-Stimme.

Stunde 4 bis 6: CRM- und Telefonie-Integration

Anschluss der SIP-Nummer (Aircall, Ringover). CRM-Anschluss via API. Wir konfigurieren die Business-Function Calls.

Stunde 6 bis 8: erster End-to-End-Test

Sie rufen die Testnummer an und führen 3 typische Gespräche.

Tag-1-Gesundheitsindikator: am Ende von Tag 1 muss der End-to-End-Test in 80% der Standardfälle bestehen.

Tag 2 — Tests, Anpassungen und Inbetriebnahme (8 Stunden)

Stunde 9 bis 12: interne Benutzertests

5 bis 10 interne Mitarbeiter rufen den Agenten mit verschiedenen Szenarien an.

Stunde 12 bis 14: Anpassungen und Prompt-Fine-Tuning

Schnellste Korrekturen: System-Prompt anpassen, Few-Shot-Beispiele hinzufügen.

Stunde 14 bis 16: Tests mit realen Nutzern (Early Access)

5 bis 10% des realen Traffics werden auf den Agenten umgeleitet.

Stunde 16 bis 17: Review und Entscheidungen

Mit dem Sponsor: Überprüfung bearbeiteter Anrufe. Go/No-Go-Entscheidung.

Stunde 17 bis 18: Inbetriebnahme und Monitoring

Vollständige Umstellung auf die Produktionsnummer.

"Wir hatten ernsthaft vorbereitet: saubere Anrufstranskripte, CRM-Zugang bereit, Sponsor verfügbar. Ergebnis bei H+47: Agent in Produktion." — Vertriebsdirektor, Versicherungsmakler, Vocalis-Deployment April 2026.

Fallstricke, die einen Tag kosten

  1. Unklare Abgrenzung: alles auf einmal abdecken wollen.
  2. CRM nicht zugänglich: kein Admin verfügbar.
  3. Sponsor abwesend: Entscheider nicht erreichbar.
  4. Nicht verfügbare Nummer: SIP-Nummer bestellen dauert manchmal 48h.

Nach H+48: kontinuierliche Optimierung

Die 48-Stunden-Bereitstellung ist nicht das Ende, sondern der Anfang. Die folgenden zwei Wochen widmen sich der Optimierung. Regel: jede Woche absorbiert der Agent 5 bis 10% zusätzliches Volumen.

Um zu verstehen, welche Anrufe der KI anvertraut werden sollten, lesen Sie unseren Vergleich Sprach-KI-Agent vs. Mensch. Für emotionale Zuhörqualität siehe stimmliche emotionale Intelligenz.

Fazit

Eine 48-Stunden-Bereitstellung ist kein Marketing-Coup: Es ist die direkte Folge sorgfältiger Vorbereitung und eines vernünftig abgegrenzten Phase-1-Umfangs.