Deutsch Intern
    Data Science Chair

    Information Retrieval

    In dieser Vorlesung geht es um Algorithmen und Methoden, wie sie etwa bei Suchmaschinen wie Google und Bing zur Anwendung kommen. Allgemein versteht man unter Information Retrieval das Aufbereiten und Finden von Informationen, wobei man dies häufig auf das Finden von Dokumenten mit relevanten Inhalten beschränkt. In der Vorlesung werden neben den inhaltlichen Konzepten, die hinter bekannten Suchmaschinen wie z.B. Google stehen, auch Ideen der effizienten Implementierung solcher Systeme eingeführt. Dabei wird auch mit Konzepten wie MapReduce und deren Implementierungen Apache Hadoop oder Apache Spark zur Analyse von Big Data auf verteilten Rechenclustern gearbeitet. Insgesamt werden unter anderem folgende Themen behandelt:

    • Boolesches und Vektorraum-Retrieval-Modelle
    • Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval
    • Performanz-Bewertung von Retrieval-Systemen
    • Anfrage-Operationen (Relevance Feedback, Anfrageerweiterung)
    • Anfragesprachen und –paradigmen
    • Strukturelle Anfragen
    • Texteigenschaften
    • Web-Suche: Einführung, Crawling, Interfaces, Link-Analyse
    • Implementierung von PageRank (Google Ranking) mit Apache Spark

    Organisatorisches

    Bitte Beachten:

    Aufgrund der aktuellen Umstände wird die Vorlesung Information Retrieval auf Online-Lehre umgestellt. 
    Aktuelle Information finden Sie im WueCampus2-Kurs. Sie können sich dort einfach anmelden. Danach erhalten Sie auch wichtige Ankündigungen zur Veranstaltung per Mail.

    • Vorlesung
      Die Vorlesung wird Di, 10:15 - 11:45 über ZOOM gehalten. 
      Links zur Teilnahme an jedem Vorlesungstermin werden rechtzeitig in WueCampus2 bereitgestellt. Bitte stellen Sie sicher dass ZOOM auf Ihrem System funktioniert (siehe unten), damit Sie ohne Probleme an der Erstveranstaltung am 13.04. teilnehmen können.
      In der Erstveranstaltung werden wir einige Zeit damit verbringen die Technik des Systems zu testen, um einen korrekten Ablauf der kommenden Vorlesungen sicherzustellen, sowie alle wichtigen organisatorischen Informationen für den Ablauf des Semesters teilen.
    • Übungen
      Do, 8:15 - 9:45
      Do, 10:15 - 11:45
      Der Übungsbetrieb wird über ZOOM stattfinden. Bitte stellen Sie für eine bessere Betreuung sicher, dass Sie eine Kamera zur Verfügung haben (ggf. über Handy). Das genaue Übungsformat wird wie gehabt während der Erstveranstaltung bekanntgegeben.
    • Prüfung
      Es wird am Ende des Semesters eine Prüfung stattfinden. Form, Ablauf und genauer Zeitpunkt müssen allerdings noch erarbeitet werden, und werden baldmöglichst über WueCampus2 bekannt gegeben.
    • ZOOM
      ZOOM benötigt einen vorinstallierten Client. Ein Account wird zur Teilnahme allerdings nicht benötigt. ZOOM ist außerdem auch auf Android und IOS verfügbar. 
      (ZOOM funktioniert auch im Browser. Diese Variante können wir aber aufgrund der schlechteren Performance nicht empfehlen.)
    • Aktuelle Details werden im Ankündigungsforum des WueCampus2 Kurses geteilt.
      Bleiben Sie gesund!

    Literatur