Intern
    Data Science Chair

    Praktikum: Natural Language Processing

    Veranstalter: Prof. Dr. Andreas Hotho, Albin Zehe, Lena Hettinger

    Vorbesprechung: Mittwoch, 24. Oktober 2018, 10:00 Uhr im Besprechungsraum von LS6 (B002)

    Umfang: 5 ECTS

    Kurzbezeichnung: 10-I=PRJAK

    WueCampus-Kurs: Link

    Konzept des Praktikums

    In diesem Master-Praktikum werden sich die Studierenden mit den Methoden des Natural Language Processing (NLP) beschäftigen.  Dabei bearbeiten sie in Kleingruppen eine Task des "International Workshop on Semantic Evaluation 2019" (SemEval), einem Wettbewerb zum Vergleich verschiedener NLP Systeme. Die Kleingruppen bearbeiten dabei dieselbe Fragestellung. Am Ende des Semesters werden die unterschiedlichen Ansätze und Lösungen vorgestellt und im Rahmen der SemEval auf einem Test-Datensatz evaluiert.

    Die beste Gruppe wird die Möglichkeit erhalten, ihren Ansatz in einem wissenschaftlichen Paper festzuhalten und zur SemEval einzureichen.

    Im Zentrum dieses Praktikums steht das Erlernen von NLP-Methoden und das wissenschaftlich fundierte Entwickeln von kreativen neuen Ansätzen, um das gesetzte Ziel zu erreichen.

    Ablauf des Praktikums

    Das Semester wird in zwei Phasen geteilt: In der ersten Phase, den ersten zwei Wochen ab dem ersten Besprechungstermin, wenden die Studierenden Tensorflow, das Deep-Learning-Framework von Google, an, indem sie darin zunächst verbreitete Methoden im NLP implementieren. Die dazu notwendige Auseinandersetzung mit dem wissenschaftlichen Paper sowie dem gegebenen Tool helfen den Studierenden, mit der darauf folgenden Aufgabe zurecht zu kommen. Die Bearbeitung der Aufgabe findet in Kleingruppen statt, die sich am ersten Termin zusammenfinden. Die so entstandenen Gruppen werden auch in der zweiten Phase weiter zusammenarbeiten.

    In der zweiten Phase des Praktikums wird die konkrete Fragestellung, die bearbeitet werden soll, erläutert. Während dieser Phase sind die Studierenden sehr frei in der Bearbeitung des Themas. Treffen in der Großgruppe sind für alle Teilnehmer im Zwei-Wochen-Rhythmus angesetzt. Bei diesen Treffen werden Zwischenstände präsentiert (evtl. mit kurzen Präsentationen), Fragen geklärt und Probleme diskutiert.

    Am Ende des Semesters sollte jede Kleingruppe ein funktionierendes System vorweisen können, welches auf einem vorher nicht bekannten Test-Datensatz evaluiert wird. Die Gruppe, welches das System mit dem besten Ergebnis auf dem Test-Datendatz entwickelt hat, bekommt die Möglichkeit, ihren Ansatz als wissenschaftliches Paper auf einem Workshop einer Konferenz einzureichen.

    Leistungsnachweis

    Am Ende des Semesters stellt jede Gruppe ihren Ansatz in einer 15-30 Minuten langen Präsentation vor. Außerdem ist ein Praktikumsbericht im Umfang von 10-15 Seiten abzugeben, der allerdings bereits als Grundlage für das angestrebte wissenschaftliche Paper gesehen werden kann.