Universelle Dependenzrelationen

Universelle Dependenzrelationen (englisch Universal Dependencies, abgekürzt UD) sind ein einheitliches System zur Annotation von grammatischen Strukturen, z. B. Part-of-speech (PoS), über Sprachen hinweg[1]. Verbunden mit diesem System ist ein offenes internationales Kooperationsprojekt mit über 600 Mitwirkenden, das versucht, die sprachlichen Strukturen einer jeden Sprache mithilfe von Baumbanken (tree banks) darzustellen und in einer frei zugänglichen Datenbank festzuhalten[2]. Das Wissen aus dieser Datenbank wird für linguistische Forschung, aber auch im Bereich der natürlichen Sprachverarbeitung (Natural language processing) genutzt.

Schema

Das Annotationsschema ist eine Kombination von drei verwandten Darstellungsarten natürlicher Sprache[3]: (Universal) Stanford Dependencies (USD;[4][5][6]), Google Universal Part-of-Speech tags[7] und Interset interlingua for morphosyntactic tagsets[8].

UD stellt die syntaktischen Beziehungen innerhalb eines Satzes mithilfe von Dependenzabhängigkeiten dar. Diese werden häufig mithilfe von Pfeilen dargestellt, die die voneinander abhängigen Satzteile miteinander verbindet. Zusätzlich wird jede Abhängigkeit durch eine syntaktische Funktion charakterisiert[9]. Zum Beispiel in dem Satz „Sie hinterließ ihm eine Notiz“[10] würde das UD Schema zeigen, dass die Wörter sie, ihm und Notiz von dem Wort 'hinterließ' abhängig sind, ausgedrückt durch Pfeile, die von 'hinterließ' zu den drei Wörtern verlaufen. Ferner würden die Pfeile mit den syntaktischen Funktionen beschriftet sein, die da lauten: 'Sie' ist das nominale Subjekt von 'hinterließ', das Pronomen 'ihm' ein indirektes Objekt und die Phrase 'eine Notiz' das direkte Objekt. Des Weiteren würde das Schema einen Pfeil von 'Notiz' zum unbestimmten Artikel 'eine' ziehen, da letzterer der Determinant von 'Notiz' ist.

Sprachen

Die UD Datenbank umfasst derzeit über 200 Baumbanken zu über 150 Sprachen[2].

Debatte um Funktionsworte

Das UD-Schema ist unter Forschenden der Dependenzgrammatik umstritten, da es Funktionswörter den Inhaltswörtern unterordnet, während die gängige Literatur der Dependenzgrammatik Inhaltswörter den Funktionswörtern unterordnet[11].

Einzelnachweise

  1. Marie-Catherine de Marneffe, Christopher D. Manning, Joakim Nivre, Daniel Zeman: Universal Dependencies. In: Computational Linguistics. 20. Mai 2021, ISSN 0891-2017, S. 1–54, doi:10.1162/coli_a_00402 (mit.edu [abgerufen am 17. März 2025]).
  2. a b Universal Dependencies. Abgerufen am 17. März 2025.
  3. Universal Dependencies. Abgerufen am 17. März 2025 (britisches Englisch).
  4. Marie-Catherine de Marneffe, Timothy Dozat, Natalia Silveira, Katri Haverinen, Filip Ginter, Joakim Nivre, and Christopher D. Manning. 2014. Universal Stanford Dependencies: A cross-linguistic typology. In Proceedings of LREC.
  5. Marie-Catherine de Marneffe, Bill MacCartney, and Christopher D. Manning. 2006. Generating typed dependency parses from phrase structure parses. In Proceedings of LREC.
  6. Marie-Catherine de Marneffe and Christopher D. Manning. 2008. The Stanford typed dependencies representation. In COLING Workshop on Cross-framework and Cross-domain Parser Evaluation.
  7. Slav Petrov, Dipanjan Das, and Ryan McDonald. 2012. A universal part-of-speech tagset. In Proceedings of LREC.
  8. Daniel Zeman. 2008. Reusable Tagset Conversion Using Tagset Drivers. In Proceedings of LREC.
  9. Simple Clauses. Abgerufen am 17. März 2025.
  10. Simple Clauses. Abgerufen am 17. März 2025 (Beispiel entnommen aus https://universaldependencies.org/u/overview/simple-syntax.html#intransitive-and-transitive-clauses (Beispiel 2) und ins Deutsche übersetzt).
  11. Timothy Osborne, Kim Gerdes: The status of function words in dependency grammar: A critique of Universal Dependencies (UD). In: Glossa: a journal of general linguistics. Band 4, Nr. 1, 30. Januar 2019, ISSN 2397-1835, doi:10.5334/gjgl.537 (glossa-journal.org [abgerufen am 17. März 2025]).