A Finite-State Approach to Shallow Parsing and Grammatical Functions Annotation of German

DSpace Repositorium (Manakin basiert)


Dateien:

Zitierfähiger Link (URI): http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-27580
http://hdl.handle.net/10900/46280
Dokumentart: Dissertation
Erscheinungsdatum: 2005
Sprache: Englisch
Fakultät: 5 Philosophische Fakultät
Fachbereich: Allgemeine u. vergleichende Sprachwissenschaft
Gutachter: Hinrichs, Erhard W. (Prof. Dr.)
Tag der mündl. Prüfung: 2005-02-16
DDC-Klassifikation: 400 - Sprache, Linguistik
Schlagworte: Syntaktische Analyse , Deskriptive Grammatik , Endlicher Automat , Linguistische Datenverarbeitung , Automatische Sprachanalyse
Freie Schlagwörter: Chunks , topologische Felder , grammatische Funktionen , Parser , endliche Automaten
chunks , topological fields , grammatical functions , parser , finite-state approach
Lizenz: http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=de http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=en
Gedruckte Kopie bestellen: Print-on-Demand
Zur Langanzeige

Inhaltszusammenfassung:

Die vorliegende Arbeit beschreibt einen mehrstufigen Parser, der grammatische Funktionen auf der Grundlage von flachen Annotationsstrukturen, die aus Chunks, topologischen Feldern und (Teil-)Sätzen bestehen, erkennt. Da grammatische Funktionen im Deutschen sehr eng mit dem Kasus verbunden sind, spielt die Zuweisung und Disambiguierung von morphologischen Informationen eine entscheidende Rolle als Schritt hin zu einer Annotation von grammatischen Funktionen. Alle Bauteile des Parsers bauen auf endlichen Automaten auf, um eine leistungsstarke Annotation sicherzustellen. Alle Stufen der Annotation sind robust; sie können mit unerwarteten Eingaben (aus dem Quelltext) ebenso umgehen wie mit fehlgeschlagenen Weitergaben aus den einzelnen Zwischenstufen. Unsere umfangreiche Evaluation des Parsers zeigt seine Wettbewerbsfähigkeit mit anderen Ansätzen. Sie gibt weiterhin Einblick in die allgemeinen Schwierigkeiten des Parsens der deutschen Sprache.

Abstract:

We describe an incremental parser which annotates grammatical functions in German on top of a shallow annotation structure consisting of chunks, topological fields and clauses. Since grammatical functions in German are strongly associated with case, the assignment and disambiguation of morphological information plays a crucial role as a step towards the annotation of grammatical functions. All components of the parser system rely on finite-state methods to ensure efficient annotation. All stages of the annotation are robust so that they can deal with unexpected input from the source text or failing intermediate annotation components. Our extensive evaluation of the parser shows its competitiveness with other approaches and also gives insights into the general problems of parsing the German language.

Das Dokument erscheint in: