Universität Bielefeld - Sonderforschungsbereich 360

Sprachverarbeitung mit Combinatory Categorial Grammar:
Inkrementalität und Effizienz

Bernd Hildebrandt und Hans-Jürgen Eikmeyer

Zusammenfassung

Obwohl die CCG ein deskriptiv sehr mächtiger Grammatikformalismus ist, mangelt es ihr an Verarbeitungseffizienz. Zum einen beruht dies auf dem zentralen Mechanismus des Type-Raising und zum anderen auf dem Phänomen der Pseudo-Ambiguität. Erschwerden kommt hinzu, daß zur Bewältigung der freien Wortstellung mehrere Kategorien für eine Wortform angesetzt werden, die jeweils für eine spezifische Konstituentenfolge stehen. Die darauf beruhende Vielzahl lokal ambiger Verarbeitungspfade führt ebenfalls zu einer Beeinträchtigung der Verarbeitungseffizienz.

Vor dem Hintergrund der Entwicklung eines Sprachverstehenssystems, das einerseits kognitiven Verarbeitungsprinzipien folgt und das andererseits geeignet ist, ein Robotersystem zu steuern, haben wir einen Ansatz entwickelt, der eine inkrementelle und in weiten Teilen effiziente Sprachverarbeitung im Rahmen der CCg ermöglicht. Der Ansatz beruht einerseits auf der Ableitung von Regelschemata, durch die das problematische Type-Raising ersetzt werden kann, und andererseits auf einem System der Indizierung, mit dem mehrfache Kategorien vermieden werden, die lediglich der Repräsentation zulässiger Varianten von Konstituentenfolgen dienen. Neben aktivischen und passivischen Hauptsätzen können mit diesem Ansatz auch Neben- und Fragesätze sowie Äußerungen mit Modalverben effizient verarbeitet werden.



Anke Weinberger, 1999-09-