News-Artikel

Vom Audio zum Text: DSC bringt KI-gestützte Transkription in die Digital Humanities

Auf der DHd2026 in Wien gaben Nele Fuchs und Annika Nolte einen Hands-on-Workshop zu automatisierten Audiotranskriptionen mit Whisper. Der Beitrag zeigt, wie das DSC im Rahmen von DataNord praxisnahe Datenkompetenzen für die Digital Humanities vermittelt.

Am 24. Februar 2026 sind Nele Fuchs und Annika Nolte vom Data Science Center (DSC) mit einem ganztägigen Workshop auf der Konferenz DHd2026: Nicht nur Text, nicht nur Daten in Wien vertreten. Die jährlich stattfindende Tagung bringt Forschende aus den Digital Humanities zusammen und widmet sich der Frage, wie vielfältige Daten, Methoden und algorithmische Verfahren nachhaltig in geisteswissenschaftliche Forschung integriert werden können.

Vor diesem Hintergrund geben die beiden DataNord-Teammitglieder den Workshop „Vom Audio zum Text: Automatisierte Transkriptionen mit Whisper“, der sich an Forschende und Multiplikator:innen richtet, die qualitative Audiodaten effizient in ihre Workflows einbinden möchten.

Automatisierte Transkription als Einstieg in datenintensive Digital Humanities Forschung

Interviews sind in vielen Bereichen der Digital Humanities – etwa in Oral History, Linguistik oder Ethnografie – eine zentrale Datenquelle. Gleichzeitig ist deren manuelle Transkription extrem zeitaufwendig. Im Workshop lernen die Teilnehmenden, wie sich dieser Prozess mit dem Open-Weight-Spracherkennungsmodell Whisper deutlich beschleunigen lässt.

Whisper ermöglicht die Erstellung erster Transkriptentwürfe, die anschließend manuell überprüft und ergänzt werden. Ein besonderer Fokus liegt dabei auf dem verantwortungsvollen Einsatz solcher KI-Tools in der Forschung: von Datenschutzfragen über Hardwareanforderungen (CPU vs. GPU) bis hin zu Qualitätsgrenzen automatisierter Transkripte.

In einer Hands-on-Session erproben die Teilnehmenden Whisper praktisch anhand bereitgestellter Audiodateien oder eigener Materialien. Gemeinsam reflektieren sie, welche Auswirkungen automatische Transkriptionen auf das Quellenmaterial haben – insbesondere dann, wenn große Datenmengen nicht vollständig manuell geprüft werden können – und welche Konsequenzen sich daraus für weitere (teil-)automatisierte Analysen ergeben.

Offene Lehrmaterialien für nachhaltige Datenkompetenz

Das didaktische Konzept sowie die begleitenden Jupyter-Notebooks stehen als Open Educational Resources (OER) auf Zenodo zur Verfügung und können von Multiplikator:innen in eigenen Lehr- und Weiterbildungsformaten nachgenutzt werden. Entwickelt wurden diese Materialien im Rahmen des BMFTR-geförderten Projekts DataNord.

Damit leistet das DSC einen konkreten Beitrag zur Stärkung datenwissenschaftlicher Kompetenzen in den Geisteswissenschaften: nicht abstrakt, sondern direkt an realen Forschungspraktiken orientiert – von der Datenaufbereitung über KI-gestützte Workflows bis hin zu Fragen der Reproduzierbarkeit.

DataNord und das DSC: Datenkompetenz für die Humanities

Der Workshop steht exemplarisch für den Ansatz von DataNord und dem DSC, Datenkompetenzen fachnah und interdisziplinär zu vermitteln. Gerade in den Digital Humanities, wo Text, Audio, Bilder und algorithmische Methoden zunehmend zusammenkommen, braucht es niedrigschwellige Zugänge zu Data Science, Forschungsdatenmanagement und KI.

Durch Formate wie dieses bringt das DSC datenwissenschaftliche Expertise gezielt in die geisteswissenschaftliche Forschung ein – und schafft zugleich Räume für Austausch über methodische, technische und ethische Fragen datenintensiver Forschung.


Additional links:

Book of Abstract (With DSC article: Fuchs, N., Nolte, A., Steinmann, L., Drechsler, R., 2026. Vom Audio zum Text: Automatisierte Transkriptionen mit Whisper. pp. 79-81)
https://zenodo.org/records/18693970 (OER Resource From Audio to Text: Automated Transcriptions with Whisper – An Open Educational Resource)
DataNord

If you have any questions, please contact:

Nele Fuchs
DSC Data Scientist | Humanities
Tel. +49 (421) 218 59853
E-Mail: n.fuchsprotect me ?!uni-bremenprotect me ?!.de

Annika Nolte
DSC Data Scientist | Environmental and Marine Sciences
Tel. +49 (421) 218 59856
E-Mail:anolteprotect me ?!uni-bremenprotect me ?!.de

Aktualisiert von: News