Prof. Dr. Gerhard Sagerer
Technische Fakultät
(0521) 106-29 35
sagerer@TechFak.Uni-Bielefeld.DE
Dipl.-Inform. Volker Wendt
Raum V9-146, Tel. 48 81
vwendt@techfak.Uni-Bielefeld.dDE
Die geplante Fortführung der in B1 begonnenen Arbeiten in einem neuen Teilprojekt A6 soll Sprach- und Bildverarbeitung (auf der Basis von sowohl Bottom-up- als auch Top-down-Prozessen) stärker fokussieren und der Bedeutung der in B1 erzielten Ergebnisse für Verfahren der künstlichen Perzeption Rechnung tragen. Die bisher schon sehr intensive Kooperation mit den Sprach- bzw. Bildperzeptionsprojekten soll weiter ausgebaut werden, wobei die Mittlerfunktion zwischen perzeptions- und referenzbezogenen Teilprojekten weiter besteht.
Nach der Verlagerung in den A-Bereich sollen die bisherigen Ergebnisse zur Sprach-Bild-Interaktion und zur generischen Behandlung komplexer Objekte im Verlauf von Konstruktionsprozessen auf algorithmischer Seite als Ausgangspunkt zur Entwicklung von Methoden zum Lernen komplexer Handlungen, Episoden und Kategorien dienen. D.h. es sollen Methoden zum symbol-grounding aus auditiv-sprachlichen und visuellen Wahrnehmungen sowie deren Wechselwirkungen entwickelt werden. Dabei darf sich die angestrebte semantische Kompetenz nicht in der Spezialisierung auf einmal wahrgenommene Ereignisse erschöpfen; es müssen vielmehr Generalisierungsmechanismen entwickelt werden, um zuvor erworbenes Wissen auch auf neue Situationen anzuwenden bzw. übertragen zu können. Dies erfordert die Implementierung kompexerer, aber flexibler Gedächtnismodelle, die autonom erworbenes Wissen über die Zeit vorhalten und erweitern aber auch kategorisieren können.
Im Mittelpunkt der psycholinguistischen Untersuchungen steht die experimentelle Erforschung der kognitiven Robustheit von Bild-Sprach-Integration. In enger Anlehnung an die algorithmischen Ziele müssen hier vor allem Fragen der Integration simultan oder sukzessiv verfügbarer auditiv-sprachlicher und visuell-bildlicher Informationen, zur Herausbildung neuer Kategorien und deren Modifikation, zum Wissenstransfer sowie zur Beteiligung von Gedächtnisprozessen beantwortet werden. Methodisch und technisch wird also auch weiterhin die experimentell-simulative Methode der Kombination empirischer, psycholinguistischer Untersuchungen und automatischen Spracherkennens und Verstehens sowie der Analyse visueller Daten verfolgt.
![]() |
Erstellt von: Anke Weinberger (2002-09-27). Wartung durch: Anke Weinberger (2003-02-20). |