English Intern
Lehrstuhl für Informatik I - Algorithmen und Komplexität

Algorithmically-Guided User Interaction

Algorithmisch geführte Benutzerinteraktion: Smart Crowdsourcing und die Extraktion von Metadaten aus alten Landkarten

Es gibt viele praktische Probleme, die bis jetzt algorithmisch nicht gelöst werden können – nicht weil die bekannten Algorithmen zu langsam sind, sondern weil es überhaupt keine zufriedenstellenden Algorithmen gibt. Ein Beispiel für ein solches praktisches Probleme ist die Extraktion von bedeutungsvollen Metadaten aus historischen Landkarten. Das Problem hat sich bisher der Automatisierung widersetzt, was bedauerlich ist, da alte Landkarten viel nützliche Information enthalten, z.B. für Historiker, Wirtschaftswissenschaftler und Stadtplaner. Bibliotheken produzieren riesige Mengen an digitalisierten Karten, indem sie ihre historischen Sammlungen scannen, aber sie tun sich schwer damit, die Inhalte ihrer Sammlungen zu "verstehen": Algorithmen für Computer-Vision sind nicht in der Lage, die gewünschten Metadaten zu extrahieren, und es gibt zu viele Karten um sie von Hand zu bearbeiten. Mit unseren Projektpartnern (u.a. drei Bibliotheken und das Open-Historical-Map-Data-Projekt) werden wir echte Probleme auf echten Daten in Angriff nehmen.

Die meisten Crowdsourcing-Anwendungen beruhen auf der offensichtlichsten Stärke der Crowd: ihrer Größe. Wenn wir genügend Benutzer auf ein Problem loslassen, werden wir es durch rohe Gewalt lösen. Aber genau wie Brute-Force-Algorithmen oft verschwenderisch mit Ressourcen umgehen, wäre es Verschwendung menschliche Mühe unüberlegt auszunutzen. In dem geplanten Projekt werden wir eine algorithmisch geführte, adaptive Benutzerinteraktion entwickeln, bei der Algorithmus und (mehrere) Benutzer kooperieren um die gegebene Probleminstanz effizient und verlässlich zu lösen. Dies wollen wir erreichen, indem wir die zugrundeliegenden Probleme formal modellieren, algorithmisch aufbereiten und anschließend mit Techniken wie aktivem Lernen (zur effiziente Aufgabenauswahl) und Sensitivitätsanalyse (zur Qualitätssicherung) bearbeiten.

Durch dieses Projekt wollen wir besser verstehen, wie man die Stärke von Croudsourcing nutzen kann - im allgemeinen und im speziellen um Metadaten aus historischen Landkarten zu gewinnen. Was ist hier der richtige Begriff von Effizienz und mit welchen algorithmischen Techniken können wir die Effizienz von interaktiven Ansätze steigern?

Projekttitel:Algorithmically-Guided User Interaction: Smart Crowdsourcing and the Extraction of Metadata from Old Maps
Forscher:Thomas van Dijk (PI), Alexander Wolff
Finanzierung:Deutsche Forschungsgemeinschaft (DFG)
Laufzeit:2016–2019