Themen

Das ist eine Liste der Kerndiskussionsthemen der Wiederholungseinheit.


Allgemein: Wozu dienen korpusbasierte Ansätze in der Sprachverarbeitung? Was sind ihre Vorteile (siehe Kompetenz versus Performanz)? Was sind die Schwierigkeiten? Welche Anwendungen gibt es?

Korpora: Welche Korpustypen gibt es? Was sind deren Merkmale, sprich welche Labels sind annotiert? Warum werden annotierte Korpora anstatt nicht annotierter Korpora zum Lernen von Sprachmodellen benutzt?

Wahrscheinlichkeitstheorie: Basiskonzepte, diverse Definitionen wie zB. Wahrscheinlichkeitsmass, Bayes'scher Satz, bedingte Wahrscheinlichkeit, MLE usw. Behandlung von ungesehenen Ereignissen.

PoS-Tagging: Was bedeutet PoS-Tagging? Wie ist ein HMM definiert? Wie funktioniert PoS-Tagging mit HMMs?

Stochastisches Parsing: Definition einer CFG. Wie wird aus einer CFG eine SCFG? Defintion von Bäumen. Was ist eine Derivation? Was sind Parsebäume? Was ist eine Dependenzgrammatik? Wie kann man Grammatiken lexikalisieren?


Brigitte Krenn
Last modified: Wed Jun 16 19:47:07 CEST 2004