piwik-script

Intern
    Data Science Chair

    Information Retrieval

    In dieser Vorlesung geht es um Algorithmen und Methoden, wie sie etwa bei Suchmaschinen wie Google und Bing zur Anwendung kommen. Allgemein versteht man unter Information Retrieval das Aufbereiten und Finden von Informationen, wobei man dies häufig auf das Finden von Dokumenten mit relevanten Inhalten beschränkt. In der Vorlesung werden neben den inhaltlichen Konzepten, die hinter bekannten Suchmaschinen wie z.B. Google stehen, auch Ideen der effizienten Implementierung solcher Systeme eingeführt. Dabei wird auch mit Konzepten wie MapReduce und deren Implementierungen Apache Hadoop oder Apache Spark zur Analyse von Big Data auf verteilten Rechenclustern gearbeitet. Insgesamt werden unter anderem folgende Themen behandelt:

    • Boolesches und Vektorraum-Retrieval-Modelle
    • Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval
    • Performanz-Bewertung von Retrieval-Systemen
    • Anfrage-Operationen (Relevance Feedback, Anfrageerweiterung)
    • Anfragesprachen und –paradigmen
    • Strukturelle Anfragen
    • Texteigenschaften
    • Web-Suche: Einführung, Crawling, Interfaces, Link-Analyse
    • Implementierung von PageRank (Google Ranking) mit Apache Spark

    Organisatorisches

    Aktuelle Information finden Sie im WueCampus2-Kurs. Sie können sich dort einfach anmelden. Danach erhalten Sie auch wichtige Ankündigungen zur Veranstaltung per Mail.
    You can find current information in the WueCampus2 course. You can simply register there. After that you will also receive important announcements about the lecture by mail.

    • Vorlesung/Lecture
      Es wird am 03.05.2022 um 10:00 Uhr eine Erstveranstaltung geben, bei der alle wichtigen organisatorischen Informationen für den Ablauf des Semesters erläutert werden.
      Voraussichtlich wird die Vorlesung auf deutsch mit englischen Folien im "Übungsraum II" des Informatikgebäudes (M2) gehalten werden. Zusätzlich werden englische Vorlesungsaufnahmen bereitgestellt.
      There will be an initial event on 03.05.2022 at 10:00 am where all the important organizational information for the semester will be explained.
      Most likely, the lecture will be held in German with English slides in the "Übungsraum II" in the computer science building (M2). Additionally, English lecture recordings will be provided.
    • Übungen/Exercises
      Mi/Wed, 10:00 - 12:00 @ Seminarraum I (preferably English)
      Do/Thu, 10:00 - 12:00 @ Seminarraum II (preferably German)
    • Prüfung/Exam
      Es wird am Ende des Semesters eine Prüfung stattfinden. Form, Ablauf und genauer Zeitpunkt müssen allerdings noch erarbeitet werden, und werden baldmöglichst hier bekannt gegeben.
      There will be an exam at the end of the semester. However, the form, procedure and exact time still have to be worked out and will be announced here as soon as possible.

    Literatur