Transkriptionen
von Audio und Video

Akkurat. Klar. Ihre Funktion im Blick.

Audio- und Videotranskriptionen haben viele Funktionen. Sie sind die Grundlage von Untertitelungen. Sie dienen der Archivierung von medialen Inhalten. Sie werden zur wissenschaftlichen Protokollierung von Interviews und Experimenten genutzt. Darum transkribieren wir Ihre Medien mit Blick auf ihre Funktion, von guter Lesbarkeit bis hin zu den Regeln von Dresing & Pehl.

Transkription - Symbolbild: Pegasus springt über Bergtal von einem Medium ins andere

Funktional Optimiert

Warum Transkriptionen
von Menschen?

Software wie Adobe Premiere und Onlineplattformen wie Happy Scribe können Transkriptionen vollautomatisch erstellen. Darum nutzen wir von Beyond the Blur diese Softwarelösungen auch selbst. Allerdings nur als grobe Ausgangsbasis für einen saubere Überarbeitung durch einen Menschen. Denn: Auch wenn Audio-to-Text und Video-to-Text immer besser funktionieren, sind diese Systeme noch immer sehr fehleranfällig. Leider gerade dort, wo es am meisten zählt. Bei Unternehmensvideos werden Firmen, Produkt- und Personennamen routinemäßig falsch geschrieben. Bei wissen­schaft­lichen Diskussionen und Interviews scheitern die Systeme gerade am Fachvokabular.

Zudem optimieren diese Softwarelösungen nicht auf die jeweilige Funktion hin. Transkriptionen für Untertitelungen sollten for allem gut lesbar sein und gelegentlich Erklärungen für Hörgeschädigte enthalten. Wissenschaftliche Transkriptionen sollten vor allem genau und akkurat sein. Zudem sind oft erläuternde Kommentare notwendig. Die Transkription eines Interviews für psychologische Zwecke muss zum Beispiel häufig Informationen darüber enthalten, wie sich der Probant verhält. Lacht er, weint er, wirkt er verunsichert. Professionelle Transkriptionen erfordern daher eine menschliche Überarbeitung mit Blick auf dieses Funktionen. Ihr Vorteil dabei:

  • Wiederholungen, Fülllaute usw. können gelöscht werden
  • Transkriptionen für Hörgeschädigte möglich
  • Transkriptionen nach Dresing & Pehl möglich
  • Sonderanforderungen können berücksichtigt werden

Was kosten unsere Transkriptionen?

Faire Preise. Gute Resultate.

  • Preis nach Audio- und Videolänge

    Der Preis bezieht sich auf Projekte mit guter Audio­qualität sowie ohne ausgeprägte Dialekte - inklusive eine Korrekturschleife. Ist die Audioqualität schlecht oder wünschen Sie eine erweiterte Trans­kriptionen für Hörgeschädigte oder eine Transkriptionen nach Dresing und Pehl, dann ist der Minutenpreis höher.

    3/ Min.+30Pauschale

      Ihre Vorteile

    • Softwaregestützt, aber mit "Humans in the Loop"
    • Akkurater und flexibler als vollautomatische Softwaretranskriptionen
    • Fachvokabular und Namen von Personen, Institutionen, Marken etc. werden gesondert überprüft
    • Expresslieferungen möglich
    • Verlässliche Budgetplanung möglich
    • Gute Vergleichbarkeit von Angeboten
  • Unsere Standards. Wissenschaftliche STandards.

    Transkriptionen nach Dresing und Pehl

    Kein Zweifel, auch im Marketing und in der Unterhaltungsindustrie steht einiges auf dem Spiel. Aber machen wir uns nichts vor: Die wissenschaftliche Standards der Forschung sind deutlich höher. So ist es auch bei Transkriptionen. Weil diese in der qualitativen Analyse angewandt werden und deshalb zumindest ein grobes, allgemeines Verständnis dieser Analyse erfordern, lässt sich die Erstellung von Transkriptionen für Forschungs­zwecke schwerer automatisieren.

    Warum solche Transkriptionen deutlich aufwendiger sind, ver­deutlicht ein Blick auf die Regeln, die Thorsten Dresing und Thorsten Pehl in ihrem Praxisbuch besprechen:

    Inhaltlich-semantische Transkription

    • Wörtliche Transkription, keine lautsprachliche oder zusammenfassende Darstellung.
    • Anpassung von Wortverschleifungen an das Schriftdeutsche.
    • Übersetzung von Dialekten ins Hochdeutsche, falls möglich.
    • Umgangssprachliche Partikeln („gell, ne“) werden erfasst.
    • Glättung oder Auslassung von Stottern und abgebrochenen Wörtern.
    • Abbruchzeichen „/“ für unvollendete Halbsätze.
    • Lesbarkeitsfördernde Interpunktion; Fokus auf Sinneinheiten.
    • Keine Transkription von Rezeptionssignalen (z.B. „hm“), sofern sie den Redefluss nicht unterbrechen.
    • Markierung von Pausen ab ca. 3 Sekunden durch „(...)“.
    • Markierung betonter Wörter durch VERSALIEN.
    • Separate Absätze für jeden Sprecherbeitrag, mit Zeitmarken.
    • Emotionale Äußerungen in Klammern (z.B. „(lacht)“).
    • Unverständliche Stellen durch „(unv.)“ gekennzeichnet, bei Bedarf mit Ursache (z.B. „Mikrofon rauscht“).

    Erweiterte inhaltlich-semantische Transkription:

    • Detailliertere Kennzeichnung von Pausen, Fülllauten und Betonungen.
    • Markierung von Sprecherüberlappungen durch „//“.
    • Präzise Darstellung von Zögern und Wortfindungshemmungen.

    Einheitliche Schreibweise:

    • Einheitliche Darstellung von Partikeln und Fülllauten (z.B. „hm“, „ähm“).
    • Ausschreibung von Maßeinheiten und Symbolen.
    • Wörtliche Schreibweise von Zitaten und Redewendungen.
    • Zahlenregel: Kleine Zahlen (bis zwölf) als Wörter, größere in Ziffern.

    Allgemeine Richtlinien:

    • Klare Definition des Zwecks und der Zielsetzungen der Transkription vor Beginn.
    • Orientierung an Lesbarkeit vs. Detailtiefe je nach Forschungsziel.
    • Nutzung von Transkriptionsprogrammen zur Effizienzsteigerung.
    • Zeitaufwand planen: 5- bis 10-fache Interviewdauer für einfache Systeme, bis zu 60 Stunden pro Stunde Material für komplexe Systeme.

    Die gute Nachricht: Wissenschaftliche Transkriptionen sind zwar nicht vollständig automatisierbar, aber es gibt Systeme, die sich darauf spezialisiert haben und die Erstellung solcher Transkriptionen gegenüber herkömmlichen Systemen beschleunigen. Ein Beispiel ist die Transkriptionssoftware f4, welches wir für entsprechende Transkriptionen auch unterstütztend nutzen können. Ganz ohne eine genaue Überarbeitung geht es allerdings auch mit f4 nicht.