Korpora: Welche Korpustypen gibt es? Was sind deren Merkmale, sprich welche Labels sind annotiert? Warum werden annotierte Korpora anstatt nicht annotierter Korpora zum Lernen von Sprachmodellen benutzt?
Wahrscheinlichkeitstheorie: Basiskonzepte, diverse Definitionen wie zB. Wahrscheinlichkeitsmass, Bayes'scher Satz, bedingte Wahrscheinlichkeit, MLE usw. Behandlung von ungesehenen Ereignissen.
PoS-Tagging: Was bedeutet PoS-Tagging? Wie ist ein HMM definiert? Wie funktioniert PoS-Tagging mit HMMs?
Stochastisches Parsing: Definition einer CFG. Wie wird aus einer CFG eine SCFG? Defintion von Bäumen. Was ist eine Derivation? Was sind Parsebäume? Was ist eine Dependenzgrammatik? Wie kann man Grammatiken lexikalisieren?