Download neueste Vorabversion [April 18 2013 (2203)]
EXMARaLDA
02.05.2013 - EXMARaLDA review in der Zeitschrift LD&C
14.03.2013 - GeWiss-Korpus veröffentlicht
22.03.2013 - Fachmesse zur Korpustechnologie für mündliche Korpora
19.12.2012 - Offizielle Version der Datenbank für Gesprochenes Deutsch (DGD2) online
16.11.2012 - HSM 14: 'Multilingual Corpora and Multilingual Corpus Analysis'
13.04.2012 - Programm: LREC Workshop 'Best Practices for Speech Corpora in Linguistic Research'
01.02.2012 - Neue Version des Demokorpus (HTML5 und Video-Integration, neues englisches Beispiel)
20.10.2011 - Neue Versionen der EXMARaLDA-Tools liegen zum Download bereit.
20.10.2011 - Korpora des SFB 'Mehrsprachigkeit' beim HZSK
06.12.2010 - Call for Papers: GSCL-Tagung zu "Mehrsprachigen Ressourcen und mehrsprachigen Anwendungen"
30.11.2010 - Geburtstagsedition der EXMARaLDA-Tools liegt zum Download bereit.
29.11.2010 - 10 Jahre EXMARaLDA!
EXMARaLDA steht für "Extensible Markup Language for Discourse Annotation". Es ist ein System von Konzepten, Datenformaten und Werkzeugen für die computergestützte Transkription und Annotation gesprochener Sprache, sowie für das Erstellen und Auswerten von Korpora gesprochener Sprache. EXMARaLDA wurde ursprünglich im Teilprojekt "Computergestützte Erfassungs- und Analysemethoden multilingualer Daten" des Sonderforschungsbereichs "Mehrsprachigkeit" (SFB 538) der Universität Hamburg entwickelt. Seit Juli 2011 wird die Entwicklung im Hamburger Zentrum für Sprachkorpora, seit November 2011 in Zusammenarbeit mit dem Archiv für Gesprochenes Deutsch am IDS Mannheim, weitergeführt. Alle Komponenten des EXMARaLDA-Systems sind frei verfügbar.
![]() |
![]() |
![]() |
![]() |
Die wichtigsten Merkmale von EXMARaLDA sind:
- XML-basierte Dateiformate
EXMARaLDA-Daten werden grundsätzlich als XML-Dateien gespeichert. Durch die Nutzung dieses W3C-Standards wird sichergestellt, dass Daten flexibel nutzbar und langfristig archivierbar sind. - JAVA-basierte Werkzeuge
Alle Software-Werkzeuge für die Erstellung und Verarbeitung von EXMARaLDA-Daten (Partitur-Editor, Corpus-Manager und Suchwerkzeug EXAKT) sind JAVA-Anwendungen. Damit sind sie auf allen derzeit gängigen Betriebssystemen (Windows, Macintosh, Linux, Unix) lauffähig. - Interoperabilität
Das EXMARaLDA-Konzept baut auf dem Annotation Graph-Framework (Bird/Liberman 2001) auf, um eine größtmögliche Austauschbarkeit und Wiederverwendbarkeit von Transkriptionsdaten sicherzustellen. Auf diese Weise wird es möglich, neben den EXMARaLDA-eigenen auch andere weit verbreitete Werkzeuge (Praat, ELAN, FOLKER oder Transcriber) zur Erstellung und Bearbeitung von EXMARaLDA-Daten zu benutzen.
Darüber hinaus können EXMARaLDA-Daten für gedruckte oder web-basierte Veröffentlichungen in eine Vielzahl von gängigen Präsentationsformaten (RTF, HTML, PDF) überführt werden. Schließlich unterstützt EXMARaLDA durch eine Reihe parametrisierter Funktionen auch direkt die Arbeit mit verschiedenen weit verbreiteten Transkriptionssystemen (HIAT, DIDA, GAT, CHAT).












