Universität Bielefeld - Sonderforschungsbereich 360

Forschungsbericht des SFB 360, 1993/94


A. Allgemeine Angaben für den SFB 360 "Situierte Künstliche Kommunikatoren"

I. Strukturdaten

a) Wissenschaftliches Personal b) Eingeworbene Drittmittel

Folgende Drittmittel wurden durch den SFB 360 für die Jahre 1993 und 1994 eingeworben. Drittmittelgeber war in beiden Jahren die Deutsche Forschungsgemeinschaft (DFG):

II. Organisatorische Aspekte und Schwerpunkte in der Forschung

Seit dem 1. Juli 1993 existiert an der Universität Bielefeld der Sonderforschungsbereich (SFB) 360 "Situierte Künstliche Kommunikatoren". Der Sonderforschungsbereich beschäftigt sich mit der Modellierung dessen, was ein Mensch leistet, wenn er mit einem Partner kooperativ eine einfache Montageaufgabe in einer bestimmten Situation löst. Zu diesen Intelligenzleistungen gehören die akustische Wahrnehmung des gesprochenen Wortes, die optische Wahrnehmung des Partners und der in der Situation vorhandenen Gegenstände und Vorgänge, das Verstehen des so Wahrgenommenen, die Formulierung eigener Äußerungen, wie z.B. von Anweisungen an den Partner sowie schließlich die Planung und Ausführung von Handlungen.

Damit will der SFB Beiträge zu zwei Bereichen leisten. Im Bereich der Grundlagenforschung geht es um ein besseres Verständnis der Intelligenzleistungen, die ein Mensch vollbringt, wenn er eine Montageaufgabe bewältigt. In einem zweiten anwendungsorientierten Bereich geht es um die Umsetzung dieser Erkenntnisse für die Gestaltung einer auf die Bedürfnisse des Menschen zugeschnittenen Mensch-Maschine-Kommunikation.

Die Forschungen im SFB werden von Mitgliedern der Fakultät für Linguistik und Literaturwissenschaft und der Technischen Fakultät kooperativ durchgeführt. Der SFB zeichnet sich somit durch eine Zusammenarbeit zwischen Wissenschaftlern einer geistes- und sozialwissenschaftlichen Disziplin sowie einer technischen Disziplin aus, so daß die traditionellen Barrieren zwischen diesen wissenschaftlichen Disziplinen überwunden werden konnten. Die Universität Bielefeld ist aufgrund ihrer langjährigen Tradition im Bereich der interdisziplinären Forschung für diesen SFB geradezu prädestiniert.

Sprecher des SFB:
Prof. Dr. Gert Rickheit
Fakultät für Linguistik und Literaturwissenschaft

Stellvertretender Sprecher:
Prof. Dr. Gerhard Sagerer
Technische Fakultät


B. Spezielle Darstellung pro Teilprojekt


Teilprojekt A1: Hybride Wissensrepräsentation

I. Forschungsarbeiten

a)

Antragsteller:		Prof. Dr. Helge Ritter, Prof. Dr. Gerhard Sagerer

Wiss. Mitarbeiter: Dipl.-Phys. Gunther Heidemann (DFG)

Dipl.-Inform. Reinhard Moratz (DFG)

b) Ziel des Teilprojekts im Rahmen des Sonderforschungsbereichs ist die Entwicklung und Realisierung eines hybriden Systems zur Bildanalyse unter Berücksichtigung sprachlicher Interaktionen im Kontext eines künstlichen Kommunikators. Im Vordergrund steht dabei die Integration der Paradigmen neuronaler Netze und semantischer Netze zu einem homogenen Wissensrepräsentationssystem. Das heißt, daß neben der Repräsentation auch Module zur Nutzung gespeicherten Wissens zum Lernen neuer Wissensbestände und zur Analysesteuerung in das zu entwickelnde System zu integrieren sind.

Bei einer isolierten Betrachtung des Problems Bildanalyse - als Aufgabe, individuelle Beschreibungen für Bilder oder Bildfolgen zu generieren - steht der Aspekt der Rezeption im Vordergrund. Die Einbettung eines Vision-Systems in den Kontext des Künstlichen Kommunikators steuert zusätzliche Gesichtspunkte bei, da das Verarbeitungsergebnis wichtige Ausgangsbasis von Sprachproduktion und Dialog werden soll. Andererseits lassen sich wesentliche Einschränkungen für den Bildanalyseprozeß aus sprachlichen Interaktionen sowie Handlungs- und Interpretationskonventionen gewinnen.

Die Realisierung einer solchen Integration hängt vor allem davon ab, in welcher Weise und wie gut sich Entsprechungen zwischen Begriffen und visuellen Beschreibungsprimitiva aufbauen lassen. Im visuellen Bereich betrifft dies hauptsächlich die Frage, welche visuellen Beschreibungsprimitiva gewählt werden. Dabei sind zunächst zwei Ansätze zur Identifikation von Objekten und zur Generierung von Szenenbeschreibungen zu unterscheiden. Beide Fälle können zunächst gemeinsam als hierarchische Segmentierung charakterisiert werden. Vom Pixelbild ausgehend, werden einfache Bildelemente, wie etwa Linien, detektiert. Diese werden zu komplexeren Bildelementen, wie z.B. zu einfachen Objektteilen zusammengesetzt, sowie deren gegenseitige Lage im Raum analysiert.

Während auf den untersten Ebenen zumeist geeignete Filter eingesetzt werden, sind ab der Detektion einfacher Objektteile bis zur Objektidentifikation zwei Paradigmen zu unterscheiden: Analog orientierte Repräsentationen, wie neuronale Netze einerseits, sowie der Einsatz expliziter Wissensrepräsentationstechniken andererseits.

Hervorzuheben sind als Vorteile für den Kontext eines Künstlichen Kommunikators die Lernfähigkeit neuronaler Ansätze sowie deren Analogien zur Organisation des Gehirns einerseits und die expliziten Dekompositionen, Eigenschaftsdefinitionen und reichen Strukturierungsmöglichkeiten semantischer Netze andererseits. Als Nachteile sind vor allem der Aufwand zur Erstellung und Adaption von Wissensbasen bei expliziten Repräsentationen sowie der Umfang von Lernstichproben bei neuronalen Netzen und die Probleme bei der Koordination multipler neuronaler Netze zu nennen. Diese Koordination wirft auch das Problem der Dekomposition von Objekten in ihre Teile auf.

Aus diesen Erläuterungen leitet sich unmittelbar die Motivation zur Integration semantischer und neuronaler Netzwerke zu einer hybriden Wissensrepräsentation ab:

II. Wissenschaftliche Veröffentlichungen


Teilprojekt A2: Mechanismen perzeptiver Gruppierung

I. Forschungsarbeiten
a)

Antragsteller:		Dr. Stefan Posch, Prof. Dr. Helge Ritter
Wiss. Mitarbeiter:	Dipl.-Ing. Anke Maßmann (DFG)
b) Perzeptives Gruppieren ist ein Begriff, der eng mit der Gestaltpsychologie verknüpft ist. Jenseits von einer (Wieder-) Erkennung vertrauter Gegenstände haben Menschen die Fähigkeit, im Gesehenen Strukturen zu interpretieren ohne konkrete Vorstellung des Bildinhaltes. Gesetze zur Beschreibung dieser Mechanismen wurden Anfang unseres Jahrhunderts durch die Gestaltpsychologie formuliert.

Die automatische Bildanalyse nimmt sich unter dem Begriff "perzeptives Gruppieren" die menschliche Wahrnehmung zum Vorbild. In Anlehnung an die Gestaltpsychologie sollen die strukturellen Bezüge eines Bildes für die Verarbeitung genutzt werden. Eine Verringerung von Mehrdeutigkeiten erleichtert die Interpretation der Bilddaten und mindert gleichzeitig Komplexität und Rechenaufwand. Einfache und reguläre Strukturen entstehen selten durch Zufall. Das Vorhandensein solcher Regularitäten deutet auf einen grundlegenden kausalen Zusammenhang hin, der durch die Existenz eines Objektes hervorgerufen wird. Dies wurde als "principle of non-accidentalness" durch Witkin und Tenenbaum (1983) formuliert. Wie bei den Baufix-Teilen gut erkennbar, drückt sich eine solche reguläre Organisation oft in Symmetrien, Parallelitäten sowie regelmäßigen Wiederholungen ähnlicher Strukturen (Leiste mit Löchern) aus.

Der verfolgte Gruppierungsansatz stützt sich auf ein konturbasiertes Verfahren. Dazu werden die Intensitätsunterschiede des Grauwertbildes detektiert (Kanten). Eine Verdünnung mit anschließender Approximation der Kanten in Geradensegmente und elliptische Bögen bereitet die Gruppierung vor (Kontursegmente). Die Organisation des Gruppierungsprozesses erfolgt in einem hierarchischen System. Auf der untersten Ebene werden mögliche "Verlängerungen" vorhandener Segmente gesucht. Diese Gruppierungen werden durch die Begriffe "Kolinear", "Kurvilinear" und "Nähe" unterschieden. Die Gruppierungen der nächsten Ebene suchen nach räumlich benachbarten Segmenten im Sinne von Parallelität und Symmetrie. Von der "eindimensionalen" Verlängerung der Kontursegmente ist hier ein erster Schritt in Richtung Zweidimensionalität erkennbar. Die Konstruktion geschlossener Strukturen in der dritten und höchsten Ebene vollendet die Zweidimensionalität. Diese Gruppierungen von Kontursegmenten bilden die Knoten eines "Gruppierungs-Netzes", welches eine Bewertung der Gruppierungs-Hypothesen liefert. Dieser Vorgang von Gruppierung und Bewertung wird für alle vorgestellten Gruppierungsebenen durchgeführt. Das Ergebnis dieses Prozesses spiegelt die im Bild befindlichen Objekte in ihren Umrißkonturen wider.

II. Wissenschaftliche Veröffentlichungen


Teilprojekt A3: Automatische Erkennung diskursrelevanter Eigenschaften von Sprachsignalen mit linguistisch strukturierten stochastischen Modellen

I. Forschungsarbeiten
a)

Antragsteller:		Prof. Dr. Dafydd Gibbon, Dr. Franz Kummert

Wiss. Mitarbeiter: Christel Brindöpke, MA (DFG)

Michaela Johanntokrax, MA(DFG)

b) In diesem Teilprojekt werden stochastische Spracherkennungsverfahren mit formalen phonologischen Modellen und computerlinguistischen Techniken verknüpft, um die Erkennungsleistungen eines Künstlichen Kommunikators im Bereich der diskursrelevanten Sprachsignalverarbeitungseigenschaften zu simulieren. Nach drei Jahren wird hierfür ein implementierter Prototyp als Demonstrator vorhanden sein. Die behandelten Phänomene umfassen dialogrelevante Interjektionen und Kurzphasen und ihre Interaktion mit prosodischen Kategorien wie Akzentuierung und Tonhöhenverlauf.

Als empirische Grundlage für die Entwicklung werden Daten aus dem für den SFB definierten Szenario verwendet. Hierfür wird, auch als Service-Leistung für die anderen Teilprojekte, ein definiertes Dialogkorpus erstellt, transkribiert und als annotierte Signaldatenbasis zur Verfügung gestellt. Für die orthographische Transkription der Daten (sowie weiterer Daten innerhalb des SFB) wurde in Zusammenarbeit mit anderen Teilprojekten des SFB eine Konvention für die orthographische Transkription dialogischer Daten erstellt.

Die erforderlichen empirischen Daten wurden nach neuesten methodologischen Erkenntnissen in einem sogenannten "Wizard-of-Oz"-Szenario akquiriert. Hierzu wurde ein künstlicher Kommunikator als Rechnerkonfiguration mit menschlichem Bediener und synthetischer Sprachausgabe (von einem industriellen Forschungslabor unentgeltlich zur Verfügung gestellt) simuliert. Je nach Aufgabe wurden sowohl Roboterfunktionen als auch sprachliche Interaktion durch den menschlichen Bediener mittels manueller Bedienungselemente (Tastatur und Maus) gesteuert.

Für die Entwicklung des Teilmodells der Erkennungsleistungen eines Künstlichen Kommunikators im Diskursbereich wird ein sprecherunabhängiger Worterkenner -- ergänzt um Erkenner für die Detektion von Diskurspartikeln und prosodischer Ereignisse -- entwickelt.

II. Wissenschaftliche Veröffentlichungen


Teilprojekt B1: Interaktion sprachlicher und visueller Informationsverarbeitung

I. Forschungsarbeiten
a)

Antragsteller:		Prof. Dr. Gerhard Sagerer, Dr. Hans-Jürgen Eikmeyer,
			Prof. Dr. Gert Rickheit

Wiss. Mitarbeiter: Dipl.-Math. Uta Naeve (DFG)

Dr. Lorenz Sichelschmidt (DFG)

Dipl.-Inform. Gudrun Socher (DFG)

b) Künstliche Kommunikatoren verfügen über Komponenten zur Verarbeitung visueller und sprachlicher Information, die miteinander in vielfacher Weise interagieren. Diese Interaktion wird in diesem Teilprojekt exemplarisch im Bereich der Objektidentifikation und Objektbenennung empirisch untersucht, theoretisch modelliert und im Rahmen einer Implementierung realisiert.

Ausgangspunkt für die empirischen psycholinguistischen Untersuchungen ist die Beobachtung, daß Sprecher bei Objektbenennungen Attribute verwenden, die perzeptuell fundiert sind (z.B. Farbe, Form, Größe, räumliche Relationen zu anderen Objekten), und daß Hörer diese Informationen zur Objektidentifikation verwenden. Man kann sogar davon ausgehen, daß Wahrnehmungsprozesse durch zusätzlich verfügbare sprachlich codierte Information steuerbar sind. Die Realisierung solcher Interaktionen muß sich dem Problem stellen, daß Objektmerkmale, die von natürlichen Kommunikatoren leicht erkannt werden können, von maschinellen Systemen nur schwer erkennbar sind und umgekehrt.

Im Rahmen des Projektes wurde bereits eine Reihe von Studien durchgeführt. Explorationsstudien zum Verhalten menschlicher Kommunikatoren in Konstruktionsdialogen, zur Objektbeschreibung anhand der im Flugzeugkonstruktionsszenario vorkommenden Einzelobjekte und zur Verwendung von Raumrelationen bei menschlichen Kommunikatoren sind beendet und teilweise ausgewertet. Die Ergebnisse dieser Studien liefern Hinweise auf Anforderungen an den Künstlichen Kommunikator, die für die Interaktionskomponente wesentlich sind.

Ein erstes Demonstrationssystem zur Integration von Bild- und Sprachverarbeitung ist fertiggestellt und wird laufend erweitert. Die wissensbasierte Verarbeitung erfolgt anhand einer gemeinsamen homogenen Wissensbasis für Bild und Sprache. Dazu wird der Wissensrepräsentationsformalismus ERNEST verwendet. Das System ordnet gesprochenen Objektreferenzen Objekte in einem von einer Stereokamera aufgenommenen Bild einer Szene mit Objekten des Szenarios zu. Die dreidimensionale Szene wird aus dem Stereobild rekonstruiert, um räumliche Relationen zwischen Objekten berechnen zu können und um auf wechselnde Referenzrahmen zu reagieren. Zunächst werden einfache Relationen verarbeitet. Neben der Erweiterung der Wissensbasis wird auch an einer Erweiterung des Wissensrepräsentationsformalismus zur adäquaten Modellierung qualitativen Wissens gearbeitet.

II. Wissenschaftliche Veröffentlichungen


Teilprojekt B2: Computersimulation von Prozessen der Objektbenennung

I. Forschungsarbeiten
a)

Antragsteller:		Dr. Hans-Jürgen Eikmeyer, Prof. Dr. Walther Kindt,
Wiss. Mitarbeiter:	Uwe Laubenstein (DFG)

Dr. Ulrich Schade (DFG)

b) Ziel des SFB ist die Modellierung relevanter Aspekte natürlicher Kommunikatoren, eingeschränkt auf ein Basis-Szenario, in dem zwei Kommunikatoren gemeinsam eine Konstruktionsaufgabe lösen und ihre Aktionen mit Hilfe natürlicher Sprache koordinieren. Hierbei ist es offensichtlich notwendig, auf einzelne Objekte, aus denen ein größeres Ensemble konstruiert wird, aber auch auf Teilensembles von Objekten sprachlich Bezug zu nehmen. Dieses geschieht mit Objektbenennungen, d.h. sprachlichen Ausdrücken, die Sprecher mit dem kommunikativen Ziel produzieren, einem Hörer die Identifikation eines Objektes zu ermöglichen.

Die deutsche Sprachpsychologie beschäftigt sich schon seit Mitte der siebziger Jahre mit diesem Gegenstand, der gerade in neuster Zeit wieder verstärkt ins Forschungsinteresse gerückt ist. Somit ist ein reichhaltiger Fundus an empirischen Fakten über die Produktion und Rezeption solcher Benennungen verfügbar.

Ziel des Projektes ist es, aufbauend auf einer Teilmenge der empirischen Erkenntnisse, ein konnektionistisches Produktionsmodell für Objektbenennungen zu erstellen, das zwar noch nicht alle empirischen Fakten modellieren, das aber als Kern für ein umfassendes Modell angesehen werden kann. Empirische Ergebnisse und Computersimulation sind im methodischen Ansatz des SFB, der sogenannten experimentell-simulativen Methode, eng miteinander verwoben: die verfügbaren empirischen Daten zur Objektbenennung bilden den Ausgangspunkt für Modelle, die durch Computersimulation evaluiert werden.

II. Wissenschaftliche Veröffentlichungen


Teilprojekt B3: Referenz im Diskurs

I. Forschungsarbeiten
a)

Antragsteller:		Prof. Dr. Hannes Rieser, Prof. Dr. Hans Strohner

Wiss. Mitarbeiter: Dipl.-Psych. Ingo Duwe (DFG)

Dr. Wolfgang Heydrich (DFG)

Dr. Lorenz Sichelschmidt (DFG)

b) Das Ziel des Projektes ist die Erforschung von Referenzprozessen in aufgabenorientierten Dialogen unter besonderer Berücksichtigung von semantisch devianter, aber pragmatisch erfolgreicher Referenz. Dabei werden Methoden der theoretischen Linguistik, der experimentellen Psycholinguistik und der Computersimulation verwendet. Das Hauptinteresse richtet sich auf die Entwicklung eines rezeptionsorientierten Modells, das die semantischen und pragmatischen Aspekte des Gegenstandsbereichs in einen kognitiv interpretierten Rahmen kommunikativer Prozesse integriert.

Um diese Ziele erreichen zu können, ist das Projekt in drei interagierende Teile gegliedert: Pragmatik (unter Einschluß semantischer Fragestellungen), Empirie und Simulation. Im pragmatischen Teil wird ein Modell kognitiv interpretierbarer Referenzselektion für (deviante) definite und indefinite Kennzeichnungen erstellt. Einige kommunikative und kognitive Aspekte kanonischer und devianter Referenz werden in einer Serie bedingungs- und prozeßanalytischer Experimente auf der Grundlage theoretisch fundierter Hypothesen erforscht und im Rahmen pragmatikorientierter Modellbildung interpretiert. Dies ist der Gegenstand des experimentellen psycholinguistischen Projektteils. Im begleitenden Simulationsteil schließlich werden Prototypen von theoretisch und empirisch abgesicherten Modellen dem Test der Computersimulation unterzogen.

Alle Projektteile zusammen führen zur Entwicklung einer kognitiv relevanten integrierten Theorie devianter und nicht-devianter Referenz im Diskurs.

Die enge Kooperation zwischen theoretischer Linguistik, experimenteller Psycholinguistik und Computersimulation bedeutet die Realisierung einer Methodologie, wie sie sich für die interdisziplinäre Forschung im Rahmen der kognitiven Wissenschaften als vielversprechend erwiesen hat.

II. Wissenschaftliche Veröffentlichungen


Teilprojekt B4: Vertikale Organisation von kognitiven, perzeptiven und sensomotorischen Fähigkeiten Künstlicher Intelligenz

I. Forschungsarbeiten
a)

	
Antragsteller:		Prof. Dr. Gert Rickheit, Prof. Dr. Helge Ritter, 

Prof. Dr. Gerhard Sagerer

Wiss. Mitarbeiter: Prof. Dr. Boris Velichkovsky (DFG)

b) Im Teilprojekt B4 des Sonderforschungsbereichs 360 wurden in den vergangenen zwei Jahren unterschiedliche Experimente mit Augenbewegungsmessungen vorgenommen. Dabei erforderte zunächst die Installation und Inbetriebnahme des benötigten "Eye-Trakker"-Gerätes einen erheblichen Aufwand. Anschließend wurden folgende Forschungsarbeiten durchgeführt:

Übertragung der Blickposition: Es wurde untersucht, wie sich die permanente Übertragung der Augenbewegung zwischen zwei Partnern, die gemeinsam eine Aufgabe lösen sollen, auf deren Kommunikation auswirkt. Bei einem computergestützten Puzzlespiel, das es zu lösen galt, wurde einem der Partner als zusätzliche Information die momentane Blickposition des anderen wie ein "Zeiger" eingeblendet (SFB-Report 94/6).

Erhöhung der Eye-Tracker-Meßgenauigkeit durch ein neuronales Netz: Eine neuartige Variante neuronaler Netze, eine sogenannte "parametrisierte selbstorganisierende Karte" wurde zur Korrektur der vom Eye-Tracker gelieferten Blickpositionskoordinaten eingesetzt. Dadurch konnte der Meßfehler auf etwa ein Drittel seines ursprünglichen Wertes reduziert werden (SFB-Report 95/1).

Aufmerksamkeitsverteilungen in ambigen Bildern: Die Korrelation zwischen der Interpretation eines ambigen (zweideutigen) Bildes und der zugehörigen Verteilung der Aufmerksamkeit in diesem Bild wurde untersucht. Diese subjektive Verteilung wurde zudem visualisiert und auf diese Weise anderen Personen zugänglich gemacht (SFB-Report 95/2).

Fokus-Experimente: In Zusammenarbeit mit dem Teilprojekt B3 wurde der Zusammenhang zwischen Augenbewegung, Fokussierung, Referenz und Objektbeschreibung studiert. Zugrundegelegt wurden die Augenbewegungen einer Versuchsperson, die einer weiteren erklären sollte, wie sie ein bestimmtes Konstrukt aus Bauklötzen nachbilden konnte.

Visuelle Suchstrategien: In einem Experiment sollte die Versuchsperson den einzigen Unterschied zwischen zwei gleichzeitig dargebotenen Verteilungen geometrischer Objekte finden. Untersucht wurde dabei die Frage, inwieweit lokale Verteilungsparameter wie z.B. die Objektdichte den Suchprozeß steuern.

Erweiterung der Eye-Tracker-Umgebung für 3D-Experimente: Mit Hilfe einfacher technischer Änderungen der Eye-Tracker-Apparatur und einer externen Videokamera ist es nun möglich, nicht nur Monitorbilder als Vorlagen für Eye-Tracking-Experimente zu benutzen, sondern auch reale Objekte zu betrachten und sogar zu manipulieren.

II. Wissenschaftliche Veröffentlichungen


Teilprojekt C1: Konzeptdynamik

I. Forschungsarbeiten
a)

Antragsteller:		Prof. Dr. Gert Rickheit, Prof. Dr. Ipke Wachsmuth

Wiss. Mitarbeiter: Dipl.-Inform. Bernhard Jung.

b) Das Teilprojekt C1 "Konzeptdynamik" - im Projektbereich "Wissen und Inferenz" - untersucht situierte Repräsentationen von Objektkonzepten. Ausgangshypothese ist, daß solche Repräsentationen - hier als Aktualkonzepte bezeichnet - variabel und dynamisch sind: Sie können im Verlauf einer Situation ihre interne Struktur, d.h. die Zusammenstellung ihrer Attribute, und damit verbunden ihre begriffliche Einordnung in ein Kategoriensystem verändern. Im SFB-Beispielszenario der Montage eines Flugzeugmodells aus Teilen eines Holzbaukastens ist es beispielsweise möglich, daß ein zunächst als "Schraube" eingeführtes Objekt später die Rolle einer "Achse" einnimmt; dieser Rollenwandel müßte in einer dynamischen Umkonzeptualisierung des Objektes Ausdruck finden. Ein Künstlicher Kommunikator muß folglich dynamisches Wissen aufbauen können, das den jeweils erreichten Montagestand rekonstruiert, um verbal kommunizierte Montageanweisungen, dem Verständnis des Menschen entsprechend, interpretieren zu können.

Für diese Anforderungen reichen klassische Wissensrepräsentationen nicht aus. Deshalb wird im C1-Projekt ein neuartiger Ansatz dynamischer Wissensrepräsentation entwickelt, mit welchem sich das aktuelle Verständnis, das ein Mensch von den an der Konstruktion beteiligten Objekten hat, modellieren und mit der fortschreitenden Montagesituation schritthaltend dynamisch anpassen läßt. Zur Erprobung des Ansatzes wurde ein natürlichsprachlich instruierbares, wissensbasiertes Simulationssystem "Virtueller Konstrukteur" entwickelt; es ermöglicht die interaktive Montage komplexer Aggregate, die auf einer virtuellen Werkbank 3D-computergrafisch visualisiert werden. Statisches Vorwissen des Virtuellen Konstrukteurs wird in zwei Wissensbasen definiert, die Konzepte für die einzelnen Bauteiltypen bzw. die strukturierten Baugruppen des Flugzeugmodells vorhalten. Die visuell präsentierten Objekte und ihre Aggregatstrukturen werden durch netzartig verbundene Aktualkonzepte repräsentiert, welche durch semantische Netzwerke unter Hinzunahme von nachrichtenpropagierenden Condition-Action-Regeln und Constraint-Abgleichtechniken modelliert werden. Im Montageverlauf entstehende Flugzeugbaugruppen werden dynamisch konzeptualisiert, indem neue Aktualkonzepte im Arbeitsspeicher generiert bzw. schon existierende Aktualkonzepte bezüglich des statischen Vorwissens reklassifiziert werden. Durch Inspektion der geometrischen Szenenbeschreibung kann der Virtuelle Konstrukteur auch einfache Raumangaben in Instruktionen auswerten.

II. Wissenschaftliche Veröffentlichungen


Teilprojekt D1: Kommunizierende Agenten

I. Forschungsarbeiten
a)

Antragsteller:		Prof. Dr. Dieter Metzing, Dr. Henning Lobin

Wiss. Mitarbeiter: Dipl.-Inform. Steffen Förster (DFG)

Kornelia Peters, MA (DFG)

b) Im Projekt "Kommunizierende Agenten" soll situierte Kommunikation durch eine enge Verknüpfung von Sprache, Wahrnehmung und Handlung gewährleistet werden. Als kommunizierender Agent dient ein natürlichsprachlich steuerbarer (simulierter) Manipulator. Gegenstand der Untersuchung ist somit ein praktisch dominierter Tätigkeitszusammenhang, der ein spezifisches Verständigungssystem besitzt. Es soll eine Verarbeitung vor allem solcher sprachlicher Anweisungen ermöglicht werden, die nur aus dem Wahrnehmungs- und Handlungszusammenhang heraus verständlich sind. Solche Phänomene (vor allem Ellipsen) sind aus dem traditionellen Ansatz der KI bzw. Sprachverarbeitung heraus nur sehr schwer oder gar nicht zu verarbeiten. Zur integrierten Verarbeitung von Sprache, Wahrnehmung und Handlung wird eine hybride Architektur verwendet, bestehend aus einem symbolisch arbeitenden, deliberativen höheren System und einem reaktiven behavior-orientierten Basissystem.

Es gibt unterschiedliche Arten von Anweisungen, die sich in verschiedenen Verarbeitungsweisen niederschlagen. Eine erste Gruppe von Anweisungen bilden die sog. Interventionen. Das sind einfache (oft elliptische) Anweisungen, die sowohl die Positionierung des Manipulators wie auch die Ausführung bestimmter einfacher Aktionen betreffen. Interventionen können beim gegenwärtigen Stand des Projektes durch ein Finite State Transition Network (FSTN) als gültiges Muster erkannt und die relevanten Bestandteile direkt an das Basissystem weitergegeben werden. Die sprachlichen Daten können sich auf Aktionen, Objekte, deren Eigenschaften, Orte, Richtungen und Geschwindigkeit beziehen. Mit ihnen werden im Basissystem interne Sensoren gefüllt, so daß sprachliche Daten vom Basissystem wie Sensordaten verarbeitet werden können. Im Basissystem findet die Integration von sprachlichen Daten, Wahrnehmungsdaten und Daten über die aktuell ausgeführte Handlung statt. Die zweite Gruppe stellen die komplexeren Anweisungen dar. Aus ihnen werden zunächst konzeptuelle Repräsentationen aufgebaut, mit deren Hilfe Aktionsschemata ausgewählt und instantiiert werden. In den Aktionsschemata findet zum einen eine Dekomposition in Teilaktionen statt, zum anderen ermöglichen sie die Anbindung komplexerer Strukturen an das Basissystem.

Zur Realisierung des Basissystems wird ein behavior-orientierter Ansatz verwendet. Dieses Behaviorsystem ist eine Weiterentwicklung und Anpassung eines aus dem Umfeld der mobilen Robotik und der "Artificial Life"-Forschung stammenden Architekturprinzips und besitzt neben den inhärenten Eigenschaften (Reaktivität, Situiertheit, Robustheit) weitere, die für die Anwendung im Gebiet der Montagerobotik notwendig sind. Speziell ist dies Steuerbarkeit, also die Möglichkeit zur Beeinflussung der Ziele des Behaviorsystems durch andere Komponenten, in dieser hybriden Architektur das FSTN oder das höhere System.

Eine weitere Besonderheit des Basissystems ist die Integration eines visuellen Systems. Dieses visuelle System interagiert mit dem Behaviorsystem, es beantwortet Anfragen der Einheiten des Behaviorsystems bzgl. visueller Merkmale von Objekten (Farbe, Position relativ im Bild, etc.). Dazu wird eine ähnliche Architektur wie im Behaviorsystem verwendet.

In Zusammenarbeit mit dem Projekt GRANAS (KI-NRW) wurde ein verteilt arbeitendes Simulationssystem entwickelt, in dem die Simulation eines Manipulators mit 6 Freiheitsgraden möglich ist. Desweiteren können beliebige Welten, bestehend aus den aus dem SFB-Szenario bekannten Baufix-Teilen, aufgebaut werden. Der Roboter kann mit verschiedenen Sensoren ausgestattet werden und so autonom und reaktiv in seiner Umwelt agieren.

II. Wissenschaftliche Veröffentlichungen


Teilprojekt D3: Systemintegration für Künstliche Intelligenz

I. Forschungsarbeiten
a)

Antragsteller:		Prof. Dr. Gerhard Sagerer, Prof. Dr. Helge Ritter,
			Prof. Dr. Ipke Wachsmuth, Dr. Hans-Jürgen Eikmeyer

Wiss. Mitarbeiter: Dipl.-Inform. Gernot Fink (DFG)

Dipl.-Ing. Nils Jungclaus (DFG)

b) Die Integration heterogener Mustererkennungssysteme erfordert die Schaffung von Grundlagen für die Lösung komplexer Musteranalyseaufgaben durch verschiedene kooperierende Module. Dafür ist es wichtig, daß Module auf unterschiedlichen Rechnern ablaufen, parallel an Teilproblemen arbeiten und Daten in beliebiger Weise austauschen können.

Zur Realisierung solcher verteilter Systeme wurde im Rahmen des Teilprojektes D3 (Systemintegration) das Kommunikationssystem "DACS" (Distributed Applications Communication System) entwickelt. DACS bietet eine Anzahl von bewußt einfach gehaltenen Kommunikationsmethoden, die die Integration von Modulen zur Mustererkennung durch spezielle Kommunikationssemantiken unterstützen. Um die zu erwartende Komplexität der Systeme bei fortschreitender Integration von Modulen handhaben zu können, wurden verschiedene Mechanismen zur Überwachung verteilter Verarbeitung und zur Fehlersuche implementiert. Unter anderem besteht dabei die Möglichkeit, Datenpakete während der Kommunikation inspizieren und im Einzelschrittverfahren ausliefern zu können.

Anhand eines ersten Prototyps aus dem Bereich der Spracherkennung konnte überprüft werden, daß das Konzept von DACS eine einfache und leistungsfähige Integration von verteilten Modulen erlaubt. Messungen haben gezeigt, daß der für die besonderen Eigenschaften von DACS nötige Kommunikationsmehraufwand verglichen mit einer herkömmlichen Lösung kaum Leistungseinbußen mit sich bringt. Dieses ist in erster Linie auf die intern parallele Realisierung aller Komponenten von DACS zurückzuführen.

II. Wissenschaftliche Veröffentlichungen


Zur Startseite
Anke Weinberger, 1995-05-15, 1995-05-24