Intern
    Data Science Chair

    Praktikum: Natural Language Processing

    Veranstalter: Prof. Dr. Andreas Hotho, Konstantin KobsAlbin Zehe

    Vorbesprechung: 09.05.2018, 13:45 Uhr (im Anschluss an die Übung, Seminarraum I)

    Umfang: 5 ECTS

    Kurzbezeichnung: 10-I=PRJAK

    WueCampus-Kurs: Link

    Konzept des Praktikums

    In diesem Master-Praktikum werden sich die Studierenden mit den Methoden des Natural Language Processing (NLP) beschäftigen. Dabei arbeiten sie in Kleingruppen an großen Text-Datensätzen aus dem Internet, um damit ein Modell zur Bestimmung von Stimmungen im Text (Sentiment Analysis) zu entwickeln. Die Kleingruppen bearbeiten dabei dieselbe Fragestellung. Am Ende des Semesters werden die unterschiedlichen Ansätze und Lösungen vorgestellt und auf einem Test-Datensatz evaluiert.

    Die beste Gruppe wird die Möglichkeit erhalten, ihren Ansatz in einem wissenschaftlichen Paper festzuhalten und auf einem Workshop einer NLP-Konferenz einzureichen.

    Im Zentrum dieses Praktikums steht das Erlernen von NLP-Methoden und das wissenschaftlich fundierte Entwickeln von kreativen neuen Ansätzen, um das gesetzte Ziel zu erreichen.

    Ablauf des Praktikums

    Das Semester wird in zwei Phasen geteilt: In der ersten Phase, den ersten zwei Wochen ab dem ersten Besprechungstermin, wenden die Studierenden Tensorflow, das Deep-Learning-Framework von Google, an, indem sie darin zunächst verbreitete Methoden im NLP implementieren. Die dazu notwendige Auseinandersetzung mit dem wissenschaftlichen Paper sowie dem gegebenen Tool helfen den Studierenden, mit der darauf folgenden Aufgabe zurecht zu kommen. Die Bearbeitung der Aufgabe findet in Kleingruppen statt, die sich am ersten Termin zusammenfinden. Die so entstandenen Gruppen werden auch in der zweiten Phase weiter zusammenarbeiten.

    In der zweiten Phase des Praktikums wird die konkrete Fragestellung, die bearbeitet werden soll, erläutert. Während dieser Phase sind die Studierenden sehr frei in der Bearbeitung des Themas. Treffen in der Großgruppe sind für alle Teilnehmer im Zwei-Wochen-Rhythmus angesetzt. Bei diesen Treffen werden Zwischenstände präsentiert (evtl. mit kurzen Präsentationen), Fragen geklärt und Probleme diskutiert.

    Am Ende des Semesters sollte jede Kleingruppe ein funktionierendes System vorweisen können, welches auf einem vorher nicht bekannten Test-Datensatz evaluiert wird. Die Gruppe, welches das System mit dem besten Ergebnis auf dem Test-Datendatz entwickelt hat, bekommt die Möglichkeit, ihren Ansatz als wissenschaftliches Paper auf einem Workshop einer Konferenz einzureichen.

    Leistungsnachweis

    Am Ende des Semesters stellt jede Gruppe ihren Ansatz in einer 15-30 Minuten langen Präsentation vor. Außerdem ist ein Praktikumsbericht im Umfang von 10-15 Seiten abzugeben, der allerdings bereits als Grundlage für das angestrebte wissenschaftliche Paper gesehen werden kann.