Wer wochenlang Interviews, E-Mails oder Protokolle auswertet, hat keine Zeit für Strategie. Statista+ zeigt am Beispiel von Experteninterviews, wie ein flexibles System aus Skripten und KI-Modulen den Aufwand drastisch beschleunigt – und warum die Logik überall funktioniert, wo heute noch manuell Informationen aus Texten in Tabellen fließen.
Von Ralf Theil, 26.03.2026.
Die Crux der manuellen Analyse
Schritt 1: Transkripte bereinigen (regelbasiert)
Schritt 2: Sprachliche Bereinigung (LLM)
Schritt 3: Der Kernprozess – Insights und Zitate extrahieren
Schritt 4: Der Output als Datenbank
Von Analysten zu Supervisoren
Die neue Ökonomie des Influencer-Marketings
01
Ein qualitatives Experteninterview liefert tiefe Einblicke – aber in der Nachbereitung steht man erst einmal vor Unmengen von unstrukturierten Daten. Eine Stunde Audio, automatisch transkribiert, liefert rund 80.000 Zeichen – voller Füllwörter, Verständnisfehler und Halbsätze.
So sah der Alltag bei Statista+ aus, wo qualitative Interviews zum Kerngeschäft gehören: Sie validieren quantitative Ergebnisse, erschließen Nischenmärkte und liefern Kontext, den keine Datenbank hergibt. „Wenn du fünf Tage am Stück solche Interviews auswertest, tritt irgendwann Fatigue ein“, erinnert sich Kaba Barsch, Head of Data-Driven Solutions. Früher kostete die Analyse eines einzigen Gesprächs bis zu zwölf Stunden – bei einem typischen Projekt bedeutete das sechs Wochen reine Fleißarbeit, in der Nuancen oft verloren gingen.
Doch nicht nur der Zeitfaktor spielt eine Rolle: „Wenn wir die Daten strukturiert vorliegen haben, ist das Ergebnis auch für den Kunden wertvoller als vorher“, sagt Frederik Gronwald, Chief Customer Officer.
Das Ziel: Schneller arbeiten ohne Qualitätsverlust. Doch wie entscheidet man, welche Werkzeuge wo zum Einsatz kommen?
Nicht jedes Interview ist gleich komplex. Entscheidend ist, welche Daten in die Analyse fließen und welches Ergebnis am Ende stehen soll. Statista+ prüft deshalb vorab zwei Faktoren:
Input-Varianz – Wie heterogen sind die Rohdaten?
Der Input sind die Interviewdaten, die analysiert werden sollen.
Beispiel für hohe Input-Varianz: Wer Vertriebsmitarbeitende, Zwischenhändler:innen und Endnutzer:innen zum gleichen Produkt befragt, erhält sehr unterschiedliche Perspektiven und Detailinformationen.
Output-Varianz – Wie differenziert soll das Analyseergebnis sein?
Der Output ist das Ergebnis der Analyse, das dem Kunden geliefert wird.
Wichtig: Input- und Output-Varianz sind unabhängig voneinander. Auch aus sehr heterogenen Rohdaten (hohe Input-Varianz) kann ein einfaches, aggregiertes Ergebnis entstehen (niedrige Output-Varianz) – etwa, wenn zunächst nur grundlegende Muster identifiziert werden sollen.
Die Konsequenz: Spezialisierte Module statt Einheitslösung
Je höher die Varianz, desto leistungsfähiger müssen die Werkzeuge sein. „Wir haben am Anfang versucht, der KI alles in einem Prompt zu erklären“, erinnert sich Kaba Barsch. „Das führte zu sehr komplexen und fehleranfälligen Prompts.“ Die Lösung: Für jede Kombination gibt es spezialisierte Module.
Bei niedriger Varianz reicht ein einfaches Python-Skript oder ein schnelles, günstiges LLM. Bei hoher Varianz greifen komplexe KI-Module mit mehrstufigen Prompts und engmaschiger manueller Kontrolle.
Statista ist eines der weltweit führenden Data-as-a-Service-Unternehmen und bietet mit über 1,5 Millionen Statistiken zu 80.000 Themen die Basis für faktenbasierte Entscheidungen. Der hier vorgestellte Case wurde von Statista+ realisiert. Als spezialisierte Service-Marke übersetzt Statista+ diese Datenkompetenz in maßgeschneiderte Marktforschung und komplexe Datenanalysen für internationale Unternehmen.
Kaba Barsch, Head of Data-Driven Solutions
Kaba Barsch ist Head of Data-Driven Solutions bei Statista+ und verantwortet Data Science, Analytics und Visualisierung. Sie entwickelt KI-basierte Lösungen, die aus Analysen tragfähige Entscheidungen machen. Ihr Fokus: komplexe Vorhaben so strukturieren, dass Teams wirksam arbeiten und datenbasierte Lösungen verantwortungsvoll einsetzen können. Vor Statista war sie in Forschung, Lehre und internationalen Programmen an der Schnittstelle von Wissenschaft und Praxis tätig.
Frederik Gronwald ist Chief Customer Officer bei Statista und verantwortet alle kundenorientierten Funktionen sowie Revenue. Er verzahnt Daten, Produkte, konkrete Beispiel-Inhalte (Marktanalyse / Buchhaltungssoftware), Technologie und Vertrieb, um Kunden entlang ihrer Wertschöpfungskette zu begleiten. Zuvor leitete er als Chief Solution Officer die Service-Marke Statista+ und verantwortete deren Übergang ins Kerngeschäft. Frederik bringt über 15 Jahre Erfahrung im Aufbau internationaler Vertriebs- und Marketingstrukturen mit.
Frederik Gronwald, Chief Customer Officer
02
Transkriptions-Tools teilen längere Aussagen oft in überflüssige Zeitstempel-Fragmente – das verwirrt LLMs. Statista+ nutzt ein Python-Skript, das anhand der Zeitstempel und Sprecher-IDs erkennt, was zusammengehört, und Segmente sinnvoll zusammenführt.
Der Code-Ansatz:
Jetzt kommt die KI. Der Text wird in Chunks geteilt, um das Kontextfenster nicht zu sprengen, und die OpenAI-API erhält den Auftrag: Entferne Füllwörter, korrigiere Grammatik, aber verändere niemals den Inhalt. Ein Beispiel von Kaba Barsch zeigt, wie wichtig Kontextverständnis bei Fachbegriffen ist: Aus „Netz in Struktur Entwicklungs Bahn“ (Originaltranskript) wird „Netzinfrastrukturentwicklungsplan“.
Der Prompt (Ausschnitt):
Bei Interviews mit hoher Varianz identifiziert die KI zunächst Themencluster und ordnet dann die Aussagen zu. Hier stieß das Team auf eine zentrale Herausforderung: „Wenn wir anfangs nach direkten Zitaten zu bestimmten Themen gefragt haben, hat das Modell oft Phrasen erfunden“, erklärt Kaba Barsch. Die Lösung: Eine klare Rollenbeschreibung als „qualitativer Forscher“. Statt Floskeln („It's an important category and will become even more important“) liefert die KI nun Zitate, die konkret zur jeweiligen Insight passen.
Stichprobenartige manuelle Qualitätschecks begleiten jeden Schritt. Vor der finalen Freigabe prüft ein:e erfahren:e Analyst:in gezielt Grenzfälle und die Kohärenz der Ergebnisse.
Der Prompt (Ausschnitt):
Früher endete der Prozess in einer PowerPoint-Präsentation mit verdichteten Insights – etwa SWOT-Analysen aus dutzenden Interviews. Das Problem: Wollte ein Kunde tiefer einsteigen oder eine Aussage hinterfragen, bedeutete das erheblichen Mehraufwand.
Heute liefert die Pipeline eine strukturierte Datenbank in Excel oder JSON. Von der Management Summary über Kernaussagen bis zum Originalzitat können Kunden selbst durchklicken – und dabei auch Widersprüche oder Muster erkennen, die in der Zusammenfassung untergehen würden.
Ein Blick in eine beispielhafte Marktanalyse zeigt Erkenntnisse und Aussagen auf verschiedenen Ebenen:
03
„Übersicht verschafft Einsicht“, sagt Kaba Barsch: Analyst:innen müssen heute keine Interviews mehr dreimal durchhören, um minutiöse Notizen anzufertigen. Sie definieren die inhaltliche Logik – also wonach die KI suchen soll – und prüfen am Ende die Qualität der Insights. Was früher sechs Wochen dauerte, erledigt die Pipeline in 30 Minuten Rechenzeit – inklusive menschlicher Validierung sind es zwei Tage.
Die Maschine ordnet, der Mensch versteht: Dieses Prinzip funktioniert als Blaupause für jede Abteilung, die mit unstrukturierten Informationen arbeitet. Überall dort, wo Daten heute noch manuell aus Mails, Calls oder Protokollen in Tabellen fließen, automatisiert dieser Baukasten den Prozess.
Eines bleibt jedoch analog: Das Interview selbst. „Empathie, Nachfassen, Menschlichkeit – das ist ein Differenzierungsfaktor“, sagt Frederik Gronwald. Die Maschine darf die Daten ordnen, aber verstehen muss sie am Ende immer noch der Mensch.
04
05
Das war erst der Anfang. Jetzt weitere Use Cases und Online Kurse als Teil von t3n PRO entdecken.
Das war erst der Anfang. Jetzt weitere Use Cases und Online Kurse als Teil von t3n PRO entdecken.