Seminar Informationsverarbeitung II: Cross-lingual IR SoSe23 2.MSc:WP5

s. https://www.cis.lmu.de/~stef/seminare/klassifikation_2022/

Das Modul vertieft die Kenntnisse der Grundlagen der Computerlinguistik. Diese Grundlagen umfassen linguistische Grundlagen (Morphologie, Syntax, Semantik), mathematische Grundlagen (Logik, Formale Sprachen, lineare Algebra, Wahrscheinlichkeitstheorie) und informatische Grundlagen (Komplexität, Programmieren, Parsing). Die Grundlagen in diesen drei Bereichen werden in der Übung an Beispielen konkretisiert und mittels umfangreicher Ubungsaufgaben von den Studierenden eingeübt.

Thema des Semesters ist die Kategorie Genus

Gegenstand des Kurses ist zunächst der Aufbau und die interne Struktur von Wortformen in den Sprachen der Welt. Auf welche Weise werden lexikalische und grammatische Informationen, die durch Wortformen vermittelt werden, kodiert? Es folgt die Frage, mit welchen Mitteln die maschinelle Sprachverarbeitung die Analyse und Generierung von Wortformen als Basisbestandteilen von Sätzen vollziehen kann. Schließlich wird es um den Aufbau und Struktur von elektronischen Lexikonkomponenten in NLP-Systemen gehen.

Der Zugang zum Moodle-Kurs wird vor Kursbeginn per E-Mail an die eingeschriebenen Teilnehmerinnen und Teilnehmer verschickt.