Korpora (Sg. das Korpus), das sind elektronisch durchsuchbare und hinreichend erschlossene elektronische Textsammlungen, bilden in der heutigen linguistischen Forschung eine wichtige, wenn nicht gar unverzichtbare empirische Grundlage. Im Seminar werden Grundkenntnisse im Bereich der Korpuslinguistik vermittelt und anhand von praktischen Übungen vertieft. Im Vordergrund stehen dabei die folgenden Themenbereiche:

  • Grundbegriffe: Was ist ein Korpus? Token/type-Unterscheidung, Frequenzklassen, Zipfs Gesetz
  • Praktische Aspekte: Umgang mit dem Konkordanz-Werkzeug AntConc, reguläre Ausdrücke, einfache Programmierung mit R und Python