Universität Bielefeld - Sonderforschungsbereich 360

Datei: INFO.DOC
Datum: 25.05.97
Autor: Michaela Johanntokrax
       Tech. Fakultät (Angewandte Informatik)
       Universität Bielefeld
       Postfach 100131
       33501 Bielefeld
       Tel.:  0521 106 5329
       Fax:   0521 106 2992
       Email: michaela@techfak.uni-bielefeld.de
© COPYRIGHT SFB 360 "Situierte Künstliche Kommunikatoren" an der Universität Bielefeld

Diese CD-ROM beinhaltet die Dialoge 26 bis 50 (Sprachsignale und orthographische Transkriptionen) von 50 Dialogen, die im Teilprojekt A3 des SFB 360 an der Universität Bielefeld in einem Wizard-of-Oz-Szenario erstellt wurden.

Weiterhin sind Informationen zum Aufbau des Wizard-of-Oz-Szenarios, zur Sprechercharakteristik, zur Transkriptionskonvention und die Daten der Beurteilung des Szenarios durch die Versuchspersonen aufgeführt.

Die Sprachsignale haben folgendes Format: kein Header, 16000 Hz Abtastrate, 16 Bit Intel-Format, Mono.

Die Texte sind in zwei Formaten gespeichert, zum einen als Word6.0-Version (*.doc), zum anderen entweder als Postskriptdatei (*.ps) oder als txt-Version; die Umlaute in den txt-Dateien werden in TeX-Notation wiedergegeben. Die Dialoge 01 - 25 befinden sich auf einer zweiten CD-ROM. Die CD-ROM hat folgende Struktur:

INFO  \ INFO.DOC
      \ INFO.TXT

26-50 \ TEXT     \ 26RZ.DOC
                   26RZ.TXT
                   ...
                   50TP.DOC
                   50TP.TXT

      \ TURN     \ 26RZ          \ *.SIG (Signaldatei)
                                 \ *.TXT (Textdatei)
                  ...
                 \ 50TP          \ *.SIG
                                 \ *.TXT

DOKS  \ FR_BOGEN \ FB_MUSTER.DOC
                   FB_MUSTER.TXT
                   FR_BOGEN.DOC
                   FR_BOGEN.TXT
                   INFO.DOC
                   INFO.TXT
      \ SPRECHER \ SPRECHER.DOC
                   SPRECHER.TXT
      \ ORTH_TRA \ *.DOC
                 \ *.PS
      \ WOZ_SYS  \ *.DOC
                 \ *.PS

Das Verzeichnis 26-50

Unter TEXT sind die orthographischen Transkriptionen der Dialoge 26 - 50 (*.DOC, *.TXT) aufgeführt. Die Dateinamen setzen sich aus der Dialognummer und dem jeweiligen Sprecherkürzel (z.B. 26RZ) zusammen. Das Verzeichnis TURN hat pro CD-ROM 25 Unterverzeichnisse, deren Namen Dialognummer und Sprecherkürzel (z.B. 26RZ) wiedergeben. Unter den Unterverzeichnissen befinden sich die einzelnen Turns eines Dialogs. In den Dateinamen sind zusätzlich die jeweiligen Turnnummern aufgeführt (z.B. 26RZ001.*). Die Text-Dateien (*.TXT) beinhalten die orthographischen Transkriptionen der Turns, dazu kommen die korrespondierenden Signaldateien (*.SIG). Es ist zu beachten, da"s nicht alle Sprecherbeiträge, die in den Transkriptionen unter 26-50\TEXT aufgeführt sind, auch in 26-50\TURN vorkommen; einige Sprecherbeiträge waren derart leise gesprochen, da"s die betreffenden Sprachsignale nicht auf die CD-ROM aufgenommen wurden.

Das Verzeichnis DOKS

In dem Unterverzeichnis FR_BOGEN sind die Beurteilungen des Wizard-of-Oz-Szenarios durch die Versuchspersonen aufgeführt. Eine genaue Beschreibung dieser Daten findet sich in der Datei INFO.TXT unter diesem Verzeichnis. Unter ORTH_TRA wird die verwendete Konvention zur orthographischen Transkription (ORTH_TRA.DOC, ORTH_TRA.PS) beschrieben. Das Unterverzeichnis SPRECHER beinhaltet eine Datei (SPRECHER.TXT), in der relevante Informationen über die Sprecher aufgeführt sind, so z.B. Alter, Geschlecht, Dialekt, usw. In WOZ_SYS findet sich eine detaillierte Beschreibung (WOZ_SYS.DOC, WOZ_SYS.PS) des Wizard-of-Oz-Szenarios und der Aufnahmebedingungen.
Anke Weinberger, 1997-10-27