Das Modul vertieft die Kenntnisse der Grundlagen der Computerlinguistik. Diese Grundlagen umfassen linguistische Grundlagen (Morphologie, Syntax, Semantik), mathematische Grundlagen (Logik, Formale Sprachen, lineare Algebra, Wahrscheinlichkeitstheorie) und informatische Grundlagen (Komplexität, Programmieren, Parsing). Die Grundlagen in diesen drei Bereichen werden in der Übung an Beispielen konkretisiert und mittels umfangreicher Ubungsaufgaben von den Studierenden eingeübt.

Klausur zur Vorlesung Korpusbearbeitung im Sommersemester 2021

Diese Moodle-Seite soll Sie bei der Vorbereitung auf die beiden Wiederholungsprüfungen zu Statistische Methoden unterstützen.

Diese Moodle-Kursseite wird im SoSe 2020 vor allem für Forums-Diskussionen genutzt werden. Sie können auf dieser Seite aber auch die zu bearbeitenden Aufgaben und die benötigten Daten finden.

Die eigentliche Kursseite finden Sie hier: https://www.cis.uni-muenchen.de/~schmid/lehre/AngewandtesProgrammieren/

Ihre Lösungen zu den Aufgaben sollten Sie per Email an schmid@cis.lmu.de einreichen.


Gegenstand des Kurses ist zunächst der Aufbau und die interne Struktur von Wortformen in den Sprachen der Welt. Auf welche Weise werden lexikalische und grammatische Informationen, die durch Wortformen vermittelt werden, kodiert? Es folgt die Frage, mit welchen Mitteln die maschinelle Sprachverarbeitung die Analyse und Generierung von Wortformen als Basisbestandteilen von Sätzen vollziehen kann. Schließlich wird es um den Aufbau und Struktur von elektronischen Lexikonkomponenten in NLP-Systemen gehen.

Der Zugang zum Moodle-Kurs wird vor Kursbeginn per E-Mail an die eingeschriebenen Teilnehmerinnen und Teilnehmer verschickt.

Thema des Semesters ist die grammatische Kategorie des Genus. Die Beziehungen zwischen Genus, Gender und Sexus werden ja gerade  intensiv und kontrovers im Zusammenhang mit der Forderung nach "gendergerechter Sprache" diskutiert. Insofern ist es naheliegend, das Ganze einmal aus sprachwissenschaftlicher Sicht zu betrachten. Der Themenkomplex eignet sich auch gut für  sprachvergleichende Untersuchungen, indem Genussysteme anderer Sprachen in den Blick genommen werden, und  nicht zuletzt auch für korpuslinguistische Untersuchungen.