Transkriptionseditoren

Wilfried Schütte

Überblick

Vergleich

Die Transkriptionseditoren ELAN, EXMARaLDA, F4, FOLKER und Praat werden mit ihren Merkmalen in einer beigefügten Tabelle verglichen, geordnet nach den Rubriken "Verfügbarkeit", "Dokumentation", "Medien", "Spuren", "Transkription", "Ausgabe", "Interoperabilität", "Metadaten im Transkript-Header" und "Weitere Merkmale".

Auswahlkriterien

Bei Transkriptionseditoren gibt es nicht ein für alle NutzerInnen und Anwendungsszenarien verbindliches und optimales Werkzeug. Editoren müssen zu projektspezifischen Zielen passen. Auswahlkriterien für Editoren können u.a. sein:

  • Typ der Aufnahmedaten: Sollen Audio- oder Videoaufnahmen transkribiert werden?
  • Fokus: Wenn es um Videoaufnahmen geht, sollen multimodale Aspekte berücksichtigt werden oder geht es um ein Verbaltranskript, wie man es auch für Audioaufnahmen anfertigen würde?
  • Arbeitsgeschwindigkeit beim Transkribieren - diese hängt allerdings nicht nur von der Ergonomie des Editors, sondern auch von anderen Faktoren ab:
    • "Granularität" der Annotationen - eine wortweise Annotation in Praat oder ELAN ist arbeitsaufwändiger als eine phrasenweise (typischerweise mit EXMARaLDA oder FOLKER, aber auch in ELAN möglich).
    • Transkriptionsprinzip (orthografisch, in literarischer Umschrift, phonetisch).
    • Angestrebte Genauigkeit der Verschriftung und der zeitlichen Synchronisation (z.B. bei Prosodie und Simultanpassagen).
    • Gesprächsaufnahmen: technische Qualität, Frequenz und Lautstärke von Nebengeräuschen und -gesprächen, Gespräche mit geordnetem Sprecherwechsel und Rederecht vs. viele Simultanpassagen/Überlappungen.
  • Visualisierungsbedürfnisse: Soll das Transkript in Zeilen- oder Partiturschreibweise visualisiert werden? Gibt es dazu normative Vorgaben? Wie wichtig ist eine Orientierung an „Intonationsphrasen“ als einem Kernkonzept für GAT-2-Transkripte zumindest auf der Ausbaustufe des Basis- oder des Feintranskripts? (NB: Segmente bzw. Intervalle wie in EXMARaLDA oder FOLKER sind nicht identisch mit Intonationsphrasen!). Bei hohen Genauigkeitsanforderungen kann es notwendig sein, das Sprachsignal zu visualisieren als Waveform, F0-Kurve, Spektrogramm, auch mit Formanten, Intensity usw.. Dies erleichtert die Annotation, vor allem für bei der genauen Bestimmung des Referenzbereichs von Annotationen. Das ist in Praat für alle Analysen gegeben, in ELAN, FOLKER oder EXMARaLDA mit Timeline im Waveform-Oszillogramm.
  • Datenmodell: Sollen pro Sprecher eine Annotationsspuren oder mehrere Spuren angelegt werden? Zusätzliche Annotationsspuren sind notwendig z.B. für Interlinearübersetzungen; unterschiedliche (multimodale) Dimensionen wie Sprechtext, Gestik, Mimik, Objektmanipulation, Proxemik; morphosyntaktische oder variationslinguistische Annotationen. Für eine Mehrebenen-Transkription ist die Partiturschreibweise unverzichtbar, auch wenn sie in den GAT-2-Konventionen für Verbaltranskripte ausdrücklich verworfen wird. Derartige mehrfache, auch semantisch differenzierte Annotationsspuren pro Sprecher können in ELAN oder EXMARaLDA angelegt werden; in FOLKER ist dagegen nur eine Spur pro Sprecher möglich. Bei multiplen Annotationsspuren bieten einige Programme die Option an, hierarchische Beziehungen zwischen Annotationsspuren zu definieren. Diese Möglichkeit ist z.B. bei ELAN gegeben, bei Praat nicht. Wird die Auswahl für eine Annotation auf einer hierarchisch höheren Spur geändert, verschieben sich die Auswahlgrenzen auf untergeordneten Spuren mit.
  • Ausgabe in Textform: Welche Anforderungen werden an die Transkript-Ausgabe gestellt? Wird ein vollständiger Ausdruck des Transkripts benötigt oder eine auszugsweise Visualisierung für Präsentations- und Publikationszwecke? Diese Anforderungen betreffen u.a. das Transkript-Layout (Partitur, Zeilen- oder Spaltenschreibweise), den Satzspiegel und Referenzen (z.B. Zeilennummern, Segmentnummern, segmentweise Zeitstempel). Die Ausgabemöglichkeiten in Textform sind z.B. bei EXMARaLDA recht vielseitig und parametrisierbar, bei FOLKER vielseitig, aber nicht parametrisierbar, bei ELAN sehr beschränkt und bei Praat gar nicht vorhanden.
  • gewünschte Interoperabilität (s.u.).
  • Kompatibilität mit Video- und Audio-Dateiformaten. Beispiele: FOLKER verlangt PCM-WAV-Dateien. Die Multimedia-"Architektur" von ELAN ist zwar gründlich in der Version 4 überarbeitet worden, aber nicht mit jedem Videodateiformat und -codec kompatibel. Notfalls muss man hier also vor dem Transkribieren konvertieren. Besser ist, von vornherein brauchbare Formate und Codecs zu verwenden.
  • Metadaten-Verwaltung: Sollen die Metadaten zu Aufnahmen und Transkripten in den Transkripten selbst abgelegt werden und hat der Editor die dafür notwendigen Funktionen (z.B. EXMARaLDA)? Sollen die Metadaten mit einem anderen Programms desselben Systems erfasst werden (z.B. COMA im EXMARaLDA-System)? Sollen die Metadaten mit einem System unabhängig von der Transkripteingabe erfasst werden (z.B. bei der Datenbank für Gesprochenes Deutsch DGD 2.0 des IDS)?

Interoperabilität

"Interoperabilität" bedeutet, dass mehrere Werkzeuge zur Bearbeitung mündlicher Sprachkorpora kompatibel zueinander sind: Dateien können zwischen den Werkzeugen ausgetauscht werden, weil die Werkzeuge sich an Standards für Austauschformate (wie XML) halten bzw. einen Import oder Export für Dateiformate der anderen Werkzeuge vorsehen. Auf diese Weise lassen sich korpustechnologische Werkzeuge arbeitsteilig einsetzen: Ein Werkzeug muss nicht alles können, sondern man nimmt für die verschiedenen Arbeitsschritte jeweils das am besten dafür geeignete Werkzeug.

Für Transkriptionseditoren bedeutet Interoperabilität: Lassen sich die Transkripte vom Erstellungs- in andere Programme exportieren? Das ist wichtig für den Datenaustausch mit anderen Projekten oder auch für die eigene Weiterverarbeitung in anderen Programmen. Dabei ist es aber möglich, dass bestimmte Informationen beim Datenaustausch verloren gehen (z.B. sprecherbezogene Metadaten, semantische Definitionen von Annotationsspuren).

EXMARaLDA verfügt über sehr reichhaltige derartige Schnittstellen für den Import und Export , Praat und ELAN nur beschränkt. Allerdings gehen beim EXMARaLDA-Export nach Praat oder ELAN die Metainformationen im EXMARaLDA-Header zum größten Teil verloren. Am MPI Nijmegen wurde für die Metadatenverwaltung IMDI („ISLE Meta Data Initiative“, vgl. http://www.mpi.nl/IMDI/) entwickelt, sodass die Metadaten auch nicht im Header der ELAN-Annotationsdatei enthalten sein müssen.

Interoperabilität ist wichtig für den Austausch von Transkripten und den Aufbau von Korpora und Datenbanken. Wenn das Projekt diese Arbeitsschritte umfasst, ist von der Transkription mit Textverarbeitungs-Software und einfachen Programmen wie f4 und Transana abzuraten. Man braucht dann vielmehr ein standardisiertes Austauschformat für die Schnittstellen zwischen den Editoren und gegebenenfalls auch für die Übergabe an eine Gesprächsdatenbank.

Annotation Graph Toolkit (AGTK)

Vier einfache Werkzeuge (University of Pennsylvania) zum Annotieren von Video- und Audio-Daten. EXMARaLDA-Daten können in das AIF-Format, mit denen diese Werkzeuge arbeiten, überführt werden. Annotationsgraphen sind ein formaler Rahmen zur Repräsentation linguistischer Annotationen zu zeitlich geordneten Daten. Annotationsgraphen abstrahieren von Dateiformaten, Kodierschemata und Benutzeroberflächen und sehen eine logische Ebene für Annotationssysteme vor.

http://agtk.sourceforge.net/

ANVIL (Annotation of Video and Spoken Language)

anvil36-all2.jpg

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

ANVIL ist ein kostenloses Werkzeug zum Annotieren von Video-Daten. Es bietet eine frame-genaue, hierarchische Mehrspur-Annotation, bei der benutzerdefinierte Kodierungen verwendet werden. Das intuitive Annotationsfenster zeigt farbkodierte und zeitsynchronisierte Elemente auf unterschiedlichen Spuren. Besondere Merkmale sind Links über Spuren hinweg, nicht-zeitliche Objekte und ein Projektwerkzeug zur Verwaltung ganzer Korpora von Annotationsdateien. ANVIL ist usprünglich 2000 für die Gestik-Forschung entwickelt worden, wird jetzt aber auch in vielen anderen Forschungsbereichen eingesetzt, z.B. zur Mensch-Computer-Interaktion.

ANVIL kann Labeldateien aus PRAAT importieren, stellt ein Oszillogramm und die F0-Kurve dar. Die Annotationsdateien basieren auf XML. Exportierte Tabellen können in Statistikprogrammen wie SPSS verwendet werden. ANVIL ist in Java geschrieben und läuft auf Windows-, Macintosh- und Unix-Plattformen.

http://www.anvil-software.de/

CLAN

CHAT.png

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

CLAN von der Carnegie Mellon University ist ein bereits langjährig eingesetzter Editor zum Erstellen von Transkriptionen im CHAT-Format (vgl. http://childes.psy.cmu.edu/manuals/chat.pdf). Die CLAN-Programme werden als eine Anwendung heruntergeladen, installiert und genutzt. Funktional gesehen besteht CLAN hingegen aus zwei Teilen:

  • Der eine Teil ist der CLAN-Editor für Dateien im CHAT- oder CA ("Conversation Analysis")-Format. Der Editor sieht auch weitere Funktionen vor wie die Wiedergabe von Video und Audio, Verknüpfungen zu Audio und Video, Zeichensätze für lateinische und nicht-lateinische Schriften, Konsistenzprüfung für die Daten, Hinzufügen von Kodierungen zu Dateien und Export in andere Programme.
  • Der zweite Teil von CLAN ist ein Bündel von Programmen zur Datenanalyse. Diese Programme laufen in einem separaten "Commands"-Fenster. Die Ergebnisse der Analyseprogramme werden an das CLAN-Ausgabe-Fenster übermittelt.

Ein Transkript im CHAT-Format (Quelle: Uta Lam, Childes System Overview - Basic. April 2007. http://childes.psy.cmu.edu/intro/utalam.ppt):

http://childes.psy.cmu.edu/clan/

easytranscript

easytranscript.png

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

easytranscript ist eine Transkriptionssoftware mit Player für Audio- und Videodateien und Editor für die Textbearbeitung. Aktuell liegt die Software in der Version 2.20 vor. Sie ist kostenlos und kann für Windows, Linux und Mac verwendet werden.

Bei diesem Programm können Zeitmarken gesetzt werden, die eine schnelle Orientierung innerhalb der Datei ermöglichen und zudem mit anderen Transkriptionsprogrammen wie beispielsweise f4 kompatibel sind. Damit sind wie bei anderen Transkriptionseditoren Transkriptions- und Mediendatei miteinander verbunden. Um die Arbeit zu erleichtern, können individuelle Textbausteine definiert und verwendet werden. Erleichterung und Zeitersparnis bietet ebenso das Stenographie-Feature: Nach der entsprechenden Einstellung können Abkürzungen erkannt und vom Programm automatisch ausgeschrieben werden. Generell eignet sich diese QDA-Software besonders gut für einen einfachen und schnellen Einstieg auch ohne große Vorkenntnisse: Für die Verständlichkeit des Programmes sind alle Funktionen und Icons mit entsprechenden Hilfstexten versehen und begleiten die BenutzerInnen durch die Bearbeitung.

Für die Verwendung von easytranscript ist die vorherige Installation von Java Runtime und dem VLC-Player notwendig.

http://e-werkzeug.eu/index.php/de/easytranscript

ELAN

ELAN.gif

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

ELAN ("EUDICO Linguistic Annotator") ist ein frei verfügbares Werkzeug, um Annotationen einzugeben, zu editieren, zu visualieren und zu suchen. Das Programm wurde am Max-Planck-Institut für Psycholinguistik in Nijmegen (Niederlande) als robuste technologische Grundlage für die Annotierung und Verwertung multimedialer Korpora entwickelt. ELAN ist insbesondere für eine Analyse von Sprache, Zeichensprache und Gestik konzipiert, kann aber zum Zweck des Annotierens, der Analyse und der Dokumentation von jedem benutzt werden, der mit medialen Korpora arbeitet, d.h. mit Video und/oder Audiodaten.

Von der Website können Versionen für Windows, Macintosh und Linux heruntergeladen werden, bei Windows und Linux ist eine JAVA-Laufzeitumgebung enthalten.

Das ELAN-Annotations-Tool für Audio- und Videodateien hat u.a. folgende Funktionen:

  • vom Benutzer definierbare Tiers inkl. deren Abhängigkeiten,
  • hierarchische Annotationen wie sie z.B. für Morphologie erforderlich sind,
  • Annotationen in verschiedenen Character-Sets wie z.B. Chinesisch, Arabisch, Hebräisch, IPA inkl. Support für deren Schriftsysteme (Ligaturen beim Arabischen),
  • leichtes Markieren eines Medien-Fragmentes, dessen auditiver bzw. visueller Kontrolle und dessen Annotierung,
  • Veränderung der Präsentationsgeschwindigkeit bei Audio und Video-Signalen,
  • verschiedene Viewer für die Annotationen, wobei alle Viewer derart verknüpft sind, dass ein Navigieren in einem Viewer auch zu einem Markieren der entsprechenden Elemente in den anderen führt,
  • Unterstützung zum schnellen Einlesen und zur Zeitzuordnung bereits existierender Annotationen,
  • Media-Synchronisations-Modus, um mehrere parallele aber leicht zeitversetzte Video- und Audioaufnahmen zu einem Ereignis zu synchronisieren,
  • Möglichkeit, bis zu vier Videos simultan abzuspielen, mit skalierbarem Videofenstern und reichhaltigen Navigationsmöglichkeiten.

Ab der Version 4 wurde eine erste, vorläufige Interaktion mit dem webbasierten Lexikon-Werkzeug LEXUS ermöglicht, die in zukünftigen Versionen erweitert werden soll. Extern definierte kontrollierte Wortlisten werden unterstützt, Einträge in kontrollierten Wortlisten können alphabetisch sortiert werden und eine dynamische Liste von Vorschlägen während der Eingabe lässt sich aktivieren. Zudem ist es möglich, eine Anzahl von Sprachen zu spezifizieren, die für benutzerdefinierte Wörterbücher relevant sind. Alle oder viele Anmerkungen auf mehreren Ebenen lassen sich jetzt besser in einer gemeinsamen Aktion bearbeiten: Löschen aller Anmerkungen oder Annotationswerte auf einer Auswahl von Spuren, Erstellen von Anmerkungen auf abhängigen Spuren für alle Anmerkungen auf der übergeordneten Spur usw. Einige neue Exportformate wurden eingeführt und bestehende Exporte (z.B. SMIL und QuickTime-Text) mit Optionen versehen. Das Video kann man nun in der Mitte des Bildschirms platzieren und nicht benötigte "Betrachter", also Ansichten/Viewer, aus dem Fenster entfernen. Unter Windows wurde ein neuer Player ("Java – DirectShow-Framework") implementiert, um eine Reihe von Codecs-Problemen (vor allem mit MPEG-1 und MPEG-2 Dateien) zu beheben. Dieser Player sollte unter "Bearbeiten -> Einstellungen -> Plattform/Betriebssystem" voreingestellt werden. Ab der Version 4.7.0 wurde für Linux ebenfalls ein neuer Mediaplayer implementiert. Dieser basiert auf dem VLC-Player und ist voreingestellt.

Die aktuelle ELAN-Version 4.8.1 enthält einige neue Funktionen und behebt einige Systemfehler. Die meisten neuen Funktionen wurden im Rahmen von zwei CLARIN-NL-Projekten entwickelt. Eine wichtige neuen Funktion ist ein Kommentarsystem, mit dem Kommentare eingefügt und mit Kollegen geteilt werden können. Die dafür im Wesentlichen zu nutzende Benutzeroberfläche ist ein „Comment Viewer“ in der oberen rechten Ecke des Bildschirms. Kommentare haben eine Verknüpfung zu einem zeitlich markierten Segment des Mediums und optional zu einer Spur (Tier); das „crosshair“ im Timeline-Viewer weist mithilfe von farbigen Balken/Streifen auf kommentierte Segmente hin. Der Inhalt eines Kommentars besteht aus einfachem Text, ein Kommentar hat verschiedene andere Attribute. Die Liste der Kommentare kann gefiltert, sortiert und auf verschiedene Weise konfiguriert werden. Ddie Kommentare können auf verschiedene Weise gespeichert und geteilt werden:

  • Kommentare werden lokal und optional auf einem Webserver gespeichert
  • eine mit Kommentaren versehene Datei ist eine XML-Datei (.eafcomment) und bezieht sich auf eine Transkriptionsdatei
  • das Teilen der Kommentare kann organisiert werden über Filesharing-Tools, die geteilte Ordner auf einem lokalen Dateisystem verwenden, über E-Mail – der Empfänger kann den Kommentar über die Zwischenablage importieren - oder über den Webservice, der registrierten Nutzern das Teilen und Synchronisieren von Kommentaren ermöglicht

Eine Suchfunktion ermöglicht die Suche in mehreren Kommentardateien. Eine .eaf-Datei mit Kommentar öffnet man durch einen Doppelklick auf den Kommentar in der Ergebnisliste.

Schon länger bietet ELAN einen Viewer für die integrierte Anzeige von Metadaten und eine Suchen-und-Ersetzen-Funktion für mehrere Dateien. Der Metadaten-Viewer unterstützt die Darstellung einer Auswahl von Metadaten-Paaren (Schlüssel und Werte) aus einer IMDI-Datei. Suchen und Ersetzen kann man in einer Auswahl von EAF-Dateien oder in Ordnern mit EAF-Dateien, auf allen Annotationsspuren oder in einer Auswahl davon, auch mit regulären Ausdrücken. Annotationen können in unterschiedlicher Weise verschoben werden. Einige Import und Export-Funktionen wurden erweitert; der Timeseries-Viewer kann nun in das Hauptfenster von ELAN integriert werden. Seit der Version 3.6 ist außerdem ein "Audio Recognizer" als Hilfsmittel zur semi-automatischen Transkription eingebaut - bislang allerdings nur als Pausen-Detektor, den man parametrisieren und mit Pausen-Material trainieren kann. Damit lässt sich automatisch eine vorsegmentierte Annotationsspur erzeugen, in der sich x-Segmente (Sprache) und s-Segmente (Pausen) abwechseln - anschließend sind die x-Segmente mit Transkriptionstext zu füllen. Zukünftig können hier "Third-Party"-Spracherkenner eingebaut werden.

Das EAF-Schema wurde mit der Version 4.7.0 aktualisiert. Die XML-Struktur von benutzerdefinierten Wörterbüchern wurde durch dieses Update so verändert, dass die Abwärtskompatibilität nicht mehr gewährleistet ist. Dafür gibt es unter „Einstellungen“ über den Menü-Punkt „Save as EAF 2.7“ die Möglichkeit, die Datei im Vorgängerfomat zu speichern.

ELAN ist ein "Standalone"-System, d.h. es verfügt über keine Werkzeuge zur Verwaltung einer Transkript-Datenbank für eaf-Dateien (eaf = "ELAN annotation file"), ebenso über keine Metadaten-Verwaltung - dafür sind andere MPI-Entwicklungen wie der IMDI-Editor Arbil und -Browser vorgesehen. Das Annotationsprinzip ist eine "echte" Zeitleiste (wie bei den Praat-Editoren), auf der Annotationen auf beliebig vielen, semantisch frei definierbaren Spuren eingetragen werden können (d.h. wie bei Praat werden beim Annotieren/Transkribieren gleich Anfangs- und Endzeitmarken für jede Annotation erzeugt). Auch die Transkription des Sprechtextes wird als "Annotation" verstanden.

Auch bei Videoaufnahmen sollte eine verlinkte extrahierte Audiodatei zugeordnet werden (z.B. für wortweises Annotieren - die Waveform erleichtert die Identifizierung von Segmentgrenzen, etwa dem Wortbeginn, und Pausen). Verfahren der Extraktion von Audiospuren aus Videodateien werden hier näher beschrieben. Die reichen Navigationsmöglichkeiten von ELAN erlauben bei der Arbeit mit Videodateien Feinanalysen z.B. zur Gestik und Mimik. Durch die Arbeit mit Selektionen wird der Referenzbereich von Annotationen (auditiv und durch Abgleich mit der Waveform) bestimmt.

ELAN legt den Transkribierenden nicht auf ein bestimmtes Transkriptionssystem (d.h. Transkriptionskonventionen wie z.B. GAT) fest. Für die Eingabe von Sonderzeichen ist nicht wie in EXMARaLDA ein Zusatzpanel für transkriptionssystemspezifische Sonderzeichen vorgesehen. Stattdessen sind Sonderzeichen in ELAN durch Wahl einer abweichenden Eingabemethode verfügbar (Verfahren: rechte Maustaste auf Titelzeile, "Eingabemethode auswählen"), z.B. für IPA mit "Lookup List" oder mit Tastaturfolgen ("IPA extended keyboard mapping") oder für Fremdsprachen, auch mit nichtlateinischen Zeichensätzen.

Annotationen müssen in ELAN semantisch definiert werden durch Zuordnung zu zuvor vom Benutzer definierten "linguistischen Typen" (z.B. "Phrasen", "Wörter", "Übersetzung", "Kommentar"). Zwischen den Annotationsspuren gibt es Hierarchien ("independent tier", "parent tier" und "referring tier"; dabei fungiert "time subdivision" als lückenlose Unterteilung der Annotationen eines "parent tier", z.B. Phrasen in Wörter; "included in" als Unterteilung von Annotationen eines "parent tier" mit zugelassenen Lücken, z.B. für Pausen zwischen Wörtern einer Phrase). Die Hierarchieverhältnisse können über "Ansicht"/ "Zeilenabhängigkeiten" grafisch dargestellt werden. Im Vergleich mit Praat wird im ELAN-Fenster selbst keine Prosodieanalyse, z.B. für Spektrogramme oder eine Grundfrequenzkurve, angeboten. Dadurch gibt es in ELAN selbst kein Hilfsmittel zur Bestimmung von Segmentgrenzen auf Phonemebene und für Grenzintonation, wie man es für eine sehr präzise Transkription in Praat nutzen kann. Allerdings kann man im Kontextmenü der Waveform die ganze Datei oder die aktuelle Auswahl in einem Praat-LongSound-Fenster öffnen. ELAN hat übliche Textverarbeitungsfunktionen (z.B. "Suchen und Ersetzen"); Der Import und Export von Dateien wurde in den neueren Versionen stark ausgebaut: War in 4.4.0 der Export von ELAN-Dateien auf Shoebox und CHAT beschränkt, ist seit 4.7.0 der Im- und Export auch von und auf Toolbox, Transcriber (nur Import), csv/tab-delimited Text-Dateien und Praat, dessen Interaktion mit ELAN durch die neue Version insgesamt verbessert ablaufen sollte, möglich. Weiter ist seit der Version 4.5.0 der Import multipler Dateien als Toolbox-Datei voll funktionsfähig. Mit dem Erscheinen der Version 4.6.0 wird mit dem Flextext-Format von FLEx ein gänzlich neues Format im Im- und Export unterstützt. Ein Austausch mit EXMARaLDA ist weiterhin nur von EXMARaLDA aus möglich.

Zur Visualisierung, d.h. zur Darstellung des Transkripts als Textseite mit Partitur-Umbrüchen oder als Webseite: Eine RTF-Darstellung im Partiturformat ist in ELAN nicht möglich. Angeboten wird nur der Export als parametrisierbarer "Tabulator begrenzter Text", "Traditioneller Transkriptionstext" (Annotation für Annotation, wobei simultane Annotationen durch übereinstimmende Zeitmarken erkannt werden können), als "interlinearer Text", wobei simultane Annotationen durch engeren Zeilenabstand kenntlich sind, als XML- oder als HTML-Datei (parametrisierbar). Noch in der Entwicklung ist das Korpusverwaltungs- und Recherchetool ANNEX.

Bedienungsanleitungen, Hilfestellung und weitere Informationen:

http://tla.mpi.nl/tools/tla-tools/elan/

EXMARaLDA

Der EXMARaLDA-Partitureditor:

EXMARaLDA4.gif

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

Ein EXMARaLDA-Transkript in Textform:

EXMARaLDA3.gif

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

EXMARaLDA ("Extensible Markup Language for Discourse Annotation") ist ein System von Konzepten, Datenformaten und Werkzeugen für die computergestützte Transkription und Annotation gesprochener Sprache. Alle Komponenten des EXMARaLDA-Systems sind frei verfügbar. Die wichtigsten Merkmale von EXMARaLDA sind:

  • XML-basierte Dateiformate: EXMARaLDA-Transkripionen werden grundsätzlich als XML-Dateien gespeichert. Durch die Nutzung dieses W3C-Standards wird sichergestellt, dass Daten flexibel nutzbar und langfristig archivierbar sind.
  • JAVA-basierte Werkzeuge: Alle Software-Werkzeuge für die Erstellung und Verarbeitung von EXMARaLDA-Daten (Partitur-Editor und Corpus-Manager) sind JAVA-Anwendungen. Damit sind sie auf allen derzeit gängigen Betriebssystemen (Windows, Macintosh, Linux, Unix) lauffähig.
  • Interoperabilität: Das EXMARaLDA-Konzept baut auf dem Annotation Graph-Framework (Bird/Liberman 2001) auf, um eine größtmögliche Austauschbarkeit und Wiederverwendbarkeit von Transkriptionsdaten sicherzustellen. Auf diese Weise wird es möglich, neben den EXMARaLDA-eigenen auch andere weit verbreitete Werkzeuge (z.B. Praat, ELAN) zur Erstellung und Bearbeitung von EXMARaLDA-Daten zu benutzen.

Darüber hinaus können EXMARaLDA-Daten für gedruckte oder web-basierte Veröffentlichungen in eine Vielzahl von gängigen Präsentationsformaten (RTF, HTML, PDF) überführt werden. Schließlich unterstützt EXMARaLDA durch eine Reihe parametrisierter Funktionen auch direkt die Arbeit mit verschiedenen weit verbreiteten Transkriptionssystemen ( HIAT, DIDA, GAT, CHAT). Die aktuelle Version des EXMARaLDA-Partitureditors ist 1.5.1 vom 21.10.2011, daneben gibt es Previews der Version 1.5.2. In den Partitur-Editor wurde seit der Version 1.4 ein Waveform-Panel (Oszillogramm) integriert.

EXMARaLDA setzt die Installation einer Java-Laufzeitumgebung (JRE, "Java Runtime Environment") voraus, die man gleichfalls von der EXMARaLDA-Website beziehen kann. EXMARaLDA ist Unicode-fähig, d.h. kann für alle wesentlichen Sprachen und weltweiten Schriftsysteme Sonderzeichen verwalten, u.a. auch Diacritica und Pfeilzeichen. Dazu muss unter Windows der Schriftsatz "Arial Unicode MS" installiert sein, der mit den meisten Microsoft Office-Paketen installiert wird.

EXMARaLDA hat als Transkriptionseditor eine Reihe von Vorzügen:

  • EXMARaLDA ist ein Interlinear-Editor, d.h. Gesprächstranskripte werden in einem Partiturformat angelegt. Dabei werden jedem beteiligten Sprecher Annotationsspuren zugeordnet; das sind Zeilen ("tiers") für den Sprechtext und 1-n Kommentarzeilen. Spuren können mithin für die Transkription, für die Deskription, die Annotation, für Links und benutzerdefiniert eingerichtet werden. Das Gespräch wird durch Ereignisgrenzen unterteilt; das sind Synchronisationspunkte für mindestens zwei Zeilen der Partitur, gegebenenfalls auch für alle Zeilen. Solche Synchronisationspunkte sind insbesondere beim Sprecherwechsel, am Anfang und Ende von Überlappungen (Simultanpassagen) oder am Anfang und Ende des Referenzbereiches von Kommentaren/Annotationen sinnvoll.
  • Durch diese Synchronisationspunkte ist eine Korrektur des Transkripts leicht möglich, etwa für das Hinzufügen von Simultanpassagen oder Veränderungen in der Ausdehnung der Simultanpassagen in einem späteren Editiergang.
  • In EXMARaLDA sind wie in einem Textverarbeitungsprogramm ein globales Suchen und Ersetzen sowie Cut&Paste von Text möglich. Das ist eine wichtige Arbeitserleichterung z.B. bei systematischen Rechtschreibfehlern, bei der Maskierung von Personen- oder Ortsnamen oder bei der Korrektur der Zuordnung einer Äußerung zu einem Sprecher.
  • EXMARaLDA ist plattformunabhängig, weil es unter Java läuft. Es ist darum unter Windows98/ME/NT/2000/XP/Vista/7/8, Apple MAC OS X und Unix/Linux verwendbar.
  • EXMARaLDA-Transkripte werden in einem Datenaustauschformat (XML) abgelegt.
  • Die Transkripte sind durch Zuordnung von Formatierungstabellen oder Stylesheets sowohl flexibel nach Nutzerbedürfnissen als auch konsistent formatierbar; das betrifft u.a. eine spurweise Schriftgröße und -art, die Zeichenformatierung und die Ausgabe von RTF-Dateien mit oder ohne Rahmenlinien bei den Ereignisgrenzen.
  • Im Transkript sowie zu den beteiligten Sprechern können Metadaten (Verwaltungs- und Dokumentationsdaten) abgelegt werden, etwa zur Projektzugehörigkeit, zu Aufnahmeort und -datum, Namen, Alter, Geschlecht und Beteiligungsrolle der Sprecher, die gleichfalls in der XML-Transkriptdatei gespeichert werden.
  • EXMARaLDA hat eine Vielzahl von Import- und Exportmöglichkeiten von anderen Transkriptionseditoren und in andere solche Programme (z.B. ELAN, Praat-TextGrid). EXMARaLDA-Transkripte lassen sich auch in ein Austauschformat zur Textverarbeitung (RTF, HTML) oder zur Einbindung in Webseiten (HTML oder SVG, "Scalable Vector Graphics") ausgeben. Diese Ausgabe wird in EXMARaLDA "Visualisierung" genannt und dient insbesondere zum vollständigen Ausdrucken von Transkripten, zu ihrem selektiven Kopieren in Analysetexte hinein oder zu ihrer Publikation in Webseiten.
  • Man kann in EXMARaLDA nach unterschiedlichen Transkriptionskonventionen arbeiten, z.B. nach HIAT (Halbinterpretative Arbeitstranskripte) oder nach GAT (Gesprächsanalytisches Transkriptionssystem).
  • Eine Mailingliste dient als Forum, in dem Benutzer und Entwickler Fragen, Anregungen und Probleme rund um das EXMARaLDA-System diskutieren können. Um die EXMARaLDA-Mailingliste zu abonnieren, sendet man eine Mail an verwaltung@listen.uni-hamburg.de, die nur den Text "subscribe exmaralda" enthält.
  • Mit dem EXMARaLDA-Suchwerkzeug EXAKT ("EXMARaLDA Analyse- und Konkordanztool") lassen sich Korpora nach transkribierten und annotierten Phänomenen durchsuchen.

Die Entwicklung von EXMARaLDA ist noch nicht beendet. Probleme gibt es z.B. derzeit noch beim RTF-Export ("Visualisierung") für den Seitenumbruch und dadurch, dass man beim Exportieren unterschiedliche Parameter je nach der Word-Version einstellen muss, für die der Export gedacht ist. Die zugeordneten Audio-und Videoplayer und das sog. "Praat-Panel" sind weniger zum flüssigen Transkribieren mit Mediendateien im WAV- oder MPEG-Format geeignet, sondern zum Synchronisieren der Ereignisgrenzen. Das neu in der Version 1.4 integrierte Oszillogramm schafft hier für Audiodateien Abhilfe.

http://www.exmaralda.org

f4/f5

f4.gif

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

Ein für das Transkribieren optimierter Audio-Player für Windows mit einfachem Texteditor, der die Verwendung von Fußschaltern mit den Funktionen eines klassischen analogen Transkriptionsgerätes unterstützt. Das Programm wird entweder mit der Maus, mit Tastenkombinationen oder dem USB-Fußschalter bedient. Mit der Taste F4 werden die wichtigsten Funktionen gesteuert, nämlich Starten, Stoppen und kurzer Rücksprung in der Mediendatei (daher der Name des Programms!). Die Taste lässt sich auch aus anderen Programmen heraus bedienen, ohne dass f4 im Vordergrund liegt (sog. "Hotkeys"). Die Geschwindigkeit der Wiedergabe lässt sich an das persönliche Schreibtempo anpassen, justiert werden können die Lautstärke und das Intervall für den Rücksprung beim Wiedergabe-Stopp (z. B. auf 2 Sekunden). Absatzweise werden Zeitmarken eingefügt. f4 ist insbesondere für qualitative Interviews mit regelmäßigem und geordnetem Sprecherwechsel geeignet, weniger für die gesprächsanalytische Transkription mit Mehrspur-Annotation und Feinsegmentierungen etwa bei Simultanpassagen.

f4 ist für Audio- und für Videodateien (mit Videoplayer) zu verwenden.Gelesen werden mp3, wma, wav, ogg, aif, mov, avi und mpg-Dateien (teilweise auch DVDs). In einer komplett überarbeiteten Version 2012 gibt es nun auch ein Oszillogramm (Wellenform). Ein Synchromodus wird zum Korrekturlesen oder Analysieren eines Transkriptes mit Zeitmarken verwendet: Sofern der Text Zeitmarken an jedem Absatzende enthält, wird während der Wiedergabe die aktuelle Passage farblich markiert, und der Text scrollt ähnlich einem Teleprompter automatisch mit.

F4 gibt es in drei Versionen:

  • f4 free: kostenlos, zum Ausprobieren für Audiodateien von maximal 10 Minuten.
  • f4 plus: 11 ¤, für die nichtkommerzielle Anwendung (Studium) ohne zeitliche Begrenzung in der Materiallänge. Zeitmarken aus anderen Transkriptionsprogrammen (z.B. Transana) werden erkannt und können für die weitere Verwendung konvertiert werden. Damit sind sie auch in Analyseprogrammen wie MAXQDA und Atlas.ti nutzbar.
  • f4 pro: 49 ¤, für die kommerzielle Nutzung und Unterstützung weiterer Fußpedal-Modelle.

f4 ist erhältlich als Einzellizenz, Volumenlizenz, USB-Stick-Lizenz oder kostenfreie Lehrlizenz.

http://www.audiotranskription.de/f4.htm

Die Mac-Version heißt f5, weil hier Starten und Pausieren mit der F5-Taste ausgeführt werden. Sie ist derzeit noch kostenlos, aber seit 2010 nicht weiterentwickelt worden und bietet so bislang weniger Funktionen als f4 (u.a. kein Oszillogramm, kein Synchromodus). Für 2013 sind kostenpflichtige und mit f4 funktionsgleiche Versionen geplant, ebenso eine Version für Linux.

http://www.audiotranskription.de/f5.htm

Feldpartitur

Der Feldpartitur-Editor mit Legende (entnommen dem Feldpartitur-Handbuch):

Feldpartitur-Editor2.png

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

Die Feldpartitur ist ein System zur Transkription von Videodaten für qualitative Sozialforscherinnen und -forscher. Mit der Feldpartitur werden Videoinformationen mittels Schriftzeichen oder visuellen Symbolen in einem Diagramm über einer Zeitleiste erfasst. Die Feldpartitur-Software wird wird als SaaS-Software ("Software as a Service") angeboten. Forschende arbeiten dabei mit SSL-Sicherheitsstandard auf einem Hochleistungsserver in einer Internet cloud. Sie müssten sich daher nicht um die Konvertierung von Videoformaten kümmern und können per cloud gemeinsam in einem Team oder in einem Seminar arbeiten. Als Internetbrowser muss dabei Google Chrome verwendet werden.

Die aktuelle Beta-Version hat fünf Editier-Modi:

  • Framing: Repräsentationale Darstellung visueller Konstituenten durch das stehende Einzelbild (frame-by-frame-Analyse)
  • "transcript" (TS): Transkription gesprochener Sprache auf der Basis bestehender Text-Transkriptionsstandards
  • "notescript" (NS): Notation von Symbolen innerhalb eines definierten Bezugsrahmens
  • "codescript" (CS): Unterstützung der Aneignungsprozesse durch makroprozessuales Kodieren, Interpretieren, Deuten von Ereignissen im Video
  • "Text" (TXT): Verbalumschreibung von Ereignissen im Video

Die Feldpartitur lässt sich in unterschiedlichen Phasen des Forschungsprozesses einsetzen:

  • Analyseinstrument zur sukzessiven und zunehmend begrifflichen Identifikation relevanter Videokonstituenten in einem zyklisch angelegten Forschungsprozess. Transkripte, Kodierungen und analytische Beobachtungen können als Kodes, Freitexte und als visuelle Symbole in der Feldpartitur eingegeben werden. Damit ermöglicht die Feldpartitur teilweise die Funktionen von Software zur qualitativen Sozialforschung (wie atlas.ti oder MAXQDA) ohne das für diese bekannte "Einbahnstraßenproblem": Man muss dort ein XML-Transkript für die Verwendung in der QDA-Software exportieren, kann es dann nicht mehr im externen Transkriptionseditor nachbearbeiten und nach Neu-Export in der QDA-Software aktualisieren, ohne alle vorherigen Kodierungen zu verlieren.
  • Darstellungsinstrument, um videobasierte Ergebnisse – etwa einer Schlüsselsequenz – empirisch belegt zu publizieren oder zu präsentieren. Dies insbesondere dann, wenn sensible Bilddaten nicht zur Publikation freigegeben werden.
  • Messinstrument für weiterführende qualitative und quantitative Auswertungsprozesse (Export in Excel oder SPSS).
  • Qualifikationsinstrument für Forschende, aber insbesondere auch für deren Studierende/SchülerInnen.

Weitere Informationen:

  • Christine Moritz (2011): Die Feldpartitur. Multikodale Transkription von Videodaten in der Qualitativen Sozialforschung. Wiesbaden: VS Verlag.

http://www.feldpartitur.de/software/

FOLKER

Segmente-Ansicht:
Segmente-Ansicht.png

Partitur-Ansicht:
Partitur-Ansicht.png

Beitrags-Ansicht:
Beitrags-Ansicht.png

Syntax- und Zeitkontrolle mit rot markierten Fehlern:
Fehler.png

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die jeweilige Bildvorschau klicken!

Mit dem FOLKER-Editor werden Transkripte in einem spezifischen XML-Format für das Projekt „Forschungs- und Lehrkorpus gesprochenes Deutsch“ (FOLK) des IDS erstellt. FOLKER wurde entwickelt von Thomas Schmidt, früher Universität Hamburg, jetzt Institut für Deutsche Sprache Mannheim (IDS) in Zusammenarbeit mit der IDS-Abteilung Pragmatik. In den Editor eingebaut sind ein Audioplayer und eine Darstellung des Sprachsignals als Oszillogramm, um so bequem Segmente zum Transkribieren auswählen und dabei automatisch Zeitmarken für diese Segmente setzen zu können. FOLKER arbeitet auf der Grundlage eines Datenmodells für GAT-2-Minimaltranskripte (cGAT) und überprüft segmentweise bei der Texteingabe, ob die cGAT-Konventionen eingehalten werden und keine zeitlichen Inkonsistenzen auftreten. Beispielsweise sind überlappende Transkriptions-Segmente, die demselben Sprecher zugeordnet werden („Selbst-Überlappungen“), unzulässig.

Im Editor lässt sich das Transkript wahlweise darstellen als Folge von Segmenten, als Partitur oder als Folge von Sprecherbeiträgen, bei denen aufeinander folgende und einem Sprecher zugeordnete Segmente zusammengefasst werden. Diese Darstellungsmöglichkeiten passen zu einer sinnvollen Abfolge von Arbeitsschritten beim Transkribieren: Die Ersteingabe einer Rohversion ohne Berücksichtigung der genauen Extension von Überlappungen findet zweckmäßigerweise in der Segmente-Ansicht statt. In der Partitur-Ansicht können dann in einer Korrektur-Durchsicht die Feinheiten von Überlappungen korrigiert werden. Die Beiträge-Ansicht dient dem abschließenden Korrekturhören. Alle Ansichten lassen sich als Texte ausgeben - für das ganze Transkript im HTML-Format, für Ausschnitte über die Zwischenablage im RTF-Format, auch zur Ansicht und Weiterbearbeitung in einer Textverarbeitung wie Microsoft Word. Diese Ansichten sind nicht etwa Export-Formate, sondern unterschiedliche Visualisierungen desselben Modells. Wer transkribieren möchte, muss sich also nicht vorab für eine Zeilen- oder Partiturdarstellung entscheiden, sondern kann in FOLKER flexibel mit unterschiedlichen Visualisierungen für dieselbe Transkript-Datei umgehen.

FOLKER ist für das FOLK-Nutzungsszenario ausgelegt und unterstützt dieses effizient. Dazu gehört u.a.:

  • Beschränkung auf Audiodateien
  • Syntaxkontrolle für Minimaltranskripte in Anlehnung an GAT-2 (beim Preview der Version 1.2 auch für Basistranskripte)
  • präzise Notation von Pausen und Überlappungen
  • Interoperabilität mit der Datenbank Gesprochenes Deutsch, Version 2.0.

Im Gegensatz dazu sind EXMARaLDA, ELAN und Praat Mehrzweckeditoren, die möglichst viele Nutzungsszenarien in einer Oberfläche unterstützen wollen.

FOLKER wird für Windows, in der Preview-Version auch für Macintosh und Linux angeboten. Die aktuelle FOLKER-Version kann in beiden Versionen von http://agd.ids-mannheim.de/folker.shtml heruntergeladen werden, nachdem man sich dort mit registriert hat. Dabei ist die Angabe von Name und E-Mail-Adresse obligatorisch. Aktuell ist die Version 1.1 vom 30.9.2010. Voraussetzung unter Windows ist die Installation einer Java-Laufzeitumgebung ab Version 1.6. Dem Programm fehlt noch eine Undo-Funktion; notfalls muss man zur letzten gespeicherten Version zurückkehren.

Dokumentation:

  • für Anwender: Auch vor dem Download des Programms kann man sich anhand der Schnellstart-Anleitung (1 Seite) und des Handbuchs über die Benutzeroberfläche und die Funktionen von FOLKER informieren.
  • für Entwickler: Auf dem FOLKER-Datenmodell basiert das von FOLKER geschriebene und gelesene XML-Datenformat. Das Dokument ist zu lesen als Ergänzung zum XML-Schema "Folker_Schema.xsd", das die hier erläuterten Elemente in einer formalen Dokumentgrammatik beschreibt.
  • Zu den Möglichkeiten und Beschränkungen eines Imports von FOLKER-Transkripten in die QDA-Software MAXQDA siehe hier ( hier als PDF)

Praat

Der Praat-TextGridEditor:

Praat2.gif

Textgrid-Fenster, von oben nach unten: Waveform, Analysespur mit Spektrogramm, gelber Intensitäts / Energie-Kurve und türkisblauer Grundfrequenzkurve, Annotationsspuren.

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

Dieses auf Windows, Macintosh und UNIX lauffähige kostenlose Programm wurde von Paul Boersma und David Weenink am Phonetischen Institut der Universität Amsterdam geschrieben und wird fortlaufend durch neue Programmversionen gepflegt. Praat ist ein umfangreiches und sehr flexibles Werkzeug für die instrumentalphonetische Signalanalyse und -resynthese. U.a. können Spektrogramme erstellt werden, die Grundfrequenz kann extrahiert und modifiziert werden, einzelne Signalteile können gelängt oder gestreckt werden, Signale können auf verschiedene Arten resynthesiert werden; mit Praat lassen sich neuronale Netze erstellen, Optimalitäts-Tabellen zeichnen und Lernverhalten innerhalb der Optimalitätstheorie simulieren. Praat eignet sich im Hinblick auf gesprächsanalytische Bedürfnisse vor allem für die Darstellung von Spektrogrammen (für genaue phonetische Analysen, auch von dialektal variierten Vokalqualitäten), von Grundfrequenzkurven (sog. „pitch“ oder „F0-Kurve“ zur Darstellung von Tonhöhenverläufen in der Stimmführung) und von Intensitäten (Energiemessungen). Auch auditiv beim Transkribieren festgestellte Betonungen lassen sich so verifizieren; in der Regel sind Betonungen aber keine einfach lokalisierbaren Phänomene, sondern werden durch Kombination von Tonhöhenverläufen, Staupausen und Intensitäten realisiert. Praat lässt sich auch zum "Labeln" von Audiodateien und damit zum Transkribieren nutzen; dabei werden die transkribierten Äußerungssegmente sogleich mit der Audiodatei synchronisiert.

Die neue Version 5.4 des Programms Praat wird in 64-Bit-Editionen für alle Betriebssysteme (Windows, Mac und Linux) angeboten, wodurch Speicherprobleme verhindert werden sollen. Praat unterstützt jetzt andere Steuerungsarten, z.B. kann ein Sound-Fenster durch Streichen über das Trackpad und Hilfedateien können mit dem Mausrad oder durch Wischgesten gescrollt werden. Die Grafikfunktionen wurden modernisiert: Praat kann jetzt das Bild-Fenster als PDF-Datei auf dem Mac und unter Linux speichern; in allen Plattformen lässt sich das Bildfenster als 300-dpi oder 600-dpi PNG-Datei speichern. Praat kann mehr Dateitypen als zuvor lesen: neuere Arten von Sound-Dateien und Grafikdateien wie PNG und JPEG. Grafikdateien lassen sich als Foto-Objekte öffnen und dann auf das Bildfenster oder in ein Demo-Fenster ziehen. Man kann auch ein mehrfarbiges Foto-Objekt aus einer Formel erstellen, es ziehen oder als PNG- oder JPEG-Datei speichern. Praat operiert jetzt mit einer beliebigen Anzahl von Kanälen, nicht nur mit Mono und Stereo-Dateien. Die Skriptsprache wurde vereinfacht, eine "Variablensubstitution" ist nicht mehr erforderlich; ältere Skripte laufen aber weiter.

Weitere Informationen:

http://www.praat.org

Transana

transana.png

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

Ein Programm für Videotranskription mit umfangreichen Funktionen, das am Wisconsin Center for Education Research der University of Wisconsin-Madison entwickelt wurde. Mittlerweile gibt es Transana in 4 kostenpflichtigen Versionen:

  • "Standard version (single user)" für 75 $ pro Nutzer oder Computer
  • "Professional version (single user)" für 350 $ pro Nutzer oder Computer für die Darstellung komplexerer Daten (mehrere simultane Transkripte und Mediendateien, Analyse von Standbildern, Export von Videoclips)
  • "Multi-user version" für 795 $ pro Projekt zur kollaborativen Analyse von Video, Audio oder Standbildern in Projektteams
  • "computer lab version", vergleichbar der "professional version", aber mit Unterstützung von Netzwerkfunktionen, wenn Mediendateien nicht auf den Arbeits-PCs gespeichert werden sollen, für 795$ pro Computer-Netzwerk mit bis zu 35 PCs.

Das Videomaterial muss je nach Version auf dem Computer oder einem Server als MPEG-1-, MPEG-2, QuickTime- MOV- und MP4- (unter Windows und Mac OS X), WMV-Video (nur unter Windows) oder in den meisten Versionen von AVI-Dateien verfügbar sein. Bei den Audiodateien unterstützt Transana die Formate MP3, WAV, WMA (nur unter Windows) und AAC. Auch große Datenmengen stellen kein Problem dar. Dabei stehen neben Englisch 10 Sprachversionen zur Verfügung (auch deutsch). Man kann transkribieren, analytisch interessante Passagen als Clips identifizieren, diesen Clips Schlüsselworte zuordnen, Clips sortieren, umfangreiche gegliederte Sammlungen von aufeinander bezogenen Clips anlegen, die Beziehungen zwischen zugeordneten Schlüsselwörtern untersuchen und die Ergebnisse mit KollegInnen austauschen.

Die neueste Version 2.60 ermöglicht es, Standbilder auf verschiedene Weise in qualitative Analysen zu integrieren: U.a. kann man Standbilder aus Videodateien erzeugen oder entsprechende Grafikdateien importieren. Dabei lassen sich Bilder in der Größe verändern und beschneiden, um einen Teil des Bildes zu betonen. Kodierungen können durch Einzeichnungen im Bild hinzugefügt werden. Standbilder können mit bestimmten Stellen in Video-Dateien verknüpft werden, um ihren Kontext bereitzustellen. Die Merkmale werden im Screencast "Still Images in Transana", etwa ab 3:58 im Video, demonstriert.

Weitere Informationen:

  • Schwab, Götz (2006). Transana - ein Transkriptions- und Analyseprogramm zur Verarbeitung von Videodaten am Computer. In: Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 7, 70-78.

http://www.transana.org/

TranscriberAG

TranscriberAG_1.jpg TranscriberAG_2.jpg

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

TranscriberAG wurde zur Unterstützung des manuellen Annotation von Sprachsignalen entwickelt. Das Programm bietet eine benutzerfreundliche grafische Benutzeroberfläche (GUI) für die Segmentierung von Sprachaufnahmen von langer Dauer, die Transkription sowie das Labeln von Redebeiträgen, Themawechseln und akustischen Bedingungen. TranscriberAG ist auf die Bedürfnisse der Gesprächsforschung ausgerichtet, die Funktionen erlauben aber auch die Anwendung in anderen Disziplinen. Das Programm nutzt das Annotationsgraphen als natives Format, kann aber eine Reihe von anderen Annotations-Formaten lesen. TranscriberAG wird als freie Software unter der GNU General Public License GPLv3 vertrieben und läuft auf mehreren Plattformen (Windows XP, Mac OS X und Linux).

TranscriberAG kann dank Importbibliotheken wie FFmpeg viele Audio-und Videoformate lesen, sehr lange Dateien (bis zu mehreren Stunden) handhaben und sie synchronisiert wiedergeben. Das Programm kann mehrere Segmentierungsschichten der (Abschnitt, Redebeitrag und und Satz) zuzüglich der Rahmenbedingungen anlegen, unterstützt "named entities", erlaubt eine einfache Erstellung und Modifikation von Zeitankern und importier alte Dateiformate wie trs. TranscriberAG bietet auch eine Vielzahl von Funktionen, um bequem die Annotationen und das Signal zu durchsuchen und die Signalausgabe zu verbessern (Änderung von Tempo/Pitch), um die Annotation zu erleichtern und zu beschleunigen.

Anmerkung: Leider läuft TranscriberAG mit der derzeit aktuellen Version 2.0.0-b1 weder unter Windows 7/8 noch unter Mac OS X 10.8.x! Vorerst kann man unter aktuellen Betriebssystemversionen nur mit dem Vorgängerprogramm Transcriber arbeiten; vgl. http://trans.sourceforge.net/en/presentation.php.

http://transag.sourceforge.net/

trAVis

trAVis.jpg

Zur Großdarstellung in einem neuen Fenster/Tab bitte auf die Bildvorschau klicken!

trAVis Musikzentriertes Transkriptionsprogramm für audiovisuelle Medienprodukte

trAVis ist ein kostenfrei zugängliches musikzentriertes Transkriptionsprogramm für audiovisuelle Medienprodukte, das bildbezogene und texthermeneutische Ansätze mit musikwissenschaftlichen Zugängen verbindet. Mit trAVis kann das komplexe Zusammenspiel von Bild, Text und Ton/Musik interdisziplinär transkribiert, analysiert und interpretiert werden. Dies umfasst unter anderem das Erstellen eines Transkripts in einem frei editierbaren Pattern- und Zeilen-System, das Transkribieren von Musik in westlicher Notenschrift, das Visualisieren von audiovisuellen Korrespondenzen mit Hilfe von Zeichenfunktionen u.v.m.

www.travis-analysis.org.
Dieser Link kann nur mit dem Browser Firefox geöffnet werden.

Weitere Informationen:

  • Jost, C./Klug, D./Schmidt, A./Reautschnig, A./Neumann-Braun, K. (2013): Computergestützte Analyse von audiovisuellen Medienprodukten (Reihe: Qualitative Sozialforschung, Band 22). Wiesbaden: Springer VS.
Edit | Attach | Watch | Print version | History: r70 < r69 < r68 < r67 < r66 | Backlinks | Raw View | Raw edit | More topic actions
Topic revision: r70 - 2016-03-03 - knoll
 
This site is powered by the TWiki collaboration platform Powered by Perl