Theses & Practica
Diese Liste enthält einige unserer thematisch sortierten Praktika, Bachelor- und Masterarbeiten, auf Anfrage informieren wir gerne über weitere offene Themen. Die Themenstellung erfolgt in Absprache mit dem Studierenden; der Umfang der Arbeit richtet sich nach dem jeweils angestrebten Anschluss. Die Ansprechpartner für die jeweiligen Themenbereiche sind:
Bei hervorragender Leistung besteht außerdem bei allen der genannten Themen die Chance am Ende der Arbeit einen Artikel auf einer Informatikkonferenz einzureichen und so früh im Studium Co-Author auf einer wissenschaftlichen Veröffentlichung zu sein!
Active Learning Dashboard for Fraud Detection
Agent-based Simulation of Business Processes
Anomaly Detection and the modelling of normality
Privacy in Neural Network Models
Feature Learning für Orte im Kontext von Luftschadstoffmodellierung

Effiziente Feature- oder Informationsrepräsentationen sind wichtig für Machine Learning Modelle, unter anderem weil sie sonst schnell dazu neigen nicht zu generalisieren, sondern Trainingsbeispiele auswendig zu lernen. Der klassische Ansatz um gute Features für Machine Learning Modelle zu finden ist manuelles Feature Engineering. Alternativ gibt es eine Reihe von Verfahren zur automatischen Featuregenerierung, die unter den Begriff Feature Learning oder Representation Learning fallen.
In dieser Arbeit sollen verschiedene Feature Learning/Representation Learning Ansätze für die Vorhersage von Schadstoffkonzentrationen angewendet, verglichen und analysiert werden. Dabei sollen Rohinformationen über Orte wie z. B. Landnutzung (Industriegebiet, Wohngebiet, Straßen, etc.) oder geographische Eigenschaften effizient repräsentiert werden, sodass ein sog. Land-Use Regression Modell möglichst gut Schadstoffkonzentrationen für die Orte vorhersagen kann.
Betreuer: Michael Steininger
Luftschadstoff-Modellierung mit Graphen

Typische Luftschadstoff-Modelle sagen die Konzentration von Schadstoffen (z. B. NO2, PM10) auf Basis von Landnutzung (Industriegebiet, Wohngebiet, Straßen, etc.) vorher, wobei die Landnutzungsfeatures als einfache Skalare dargestellt werden (z. B. Abstand von einem Ort zur nächsten Autobahn in Meter). Die zugrundeliegenden räumlichen Vektordaten (z. B. von OpenStreetMap) lassen sich allerdings viel sinnvoller als Graphen repräsentieren. Bestehende Arbeiten haben erfolgreich gezeigt, dass solche Graph-Repräsentation für andere Aufgaben verwendet werden konnten (z. B. Klassifikation von Gebäudegruppen).
Ziel der Arbeit ist es, mit Graphen aus OpenStreetMap ein Luftschadstoffmodell zu bauen.
Betreuer: Michael Steininger
Semi-supervised regression using GANs

In vielen Anwendungsfällen von maschinellem Lernen ist es kostenintensiv und aufwendig Labels für große Mengen von Daten zu generieren. So müssen zum Beispiel bei Bodenmessungen tiefe Bohrungen durchgeführt werden, um die Zusammensetzung der Erde festzustellen. In solchen Fällen können Algorythmen verwendet werden, die aus einer relativ kleiner Anzahl an Beispielen mit Labels sowie einer großen Menge an ungelabelten Daten lernen (semi-supervised learning). Bei Klassifikationsaufgaben können dafür die sog. Generative Adversial Networks (GANs) benutzt werden, indem zwei neuronale Netze darauf trainiert werden neue Beispiele zu generieren. Dieser Ansatz wurde jedoch für Regressionaufgaben erst wenig untersucht.
Ziel der Arbeit ist es verschiedene GAN Modelle für die Vorhersage von Bodeneigenschaften anzuwenden und anhand dieser Aufgabe zu evaluieren und analysieren.
Betreuer: Andrzej Dulny
Lernen geeigneter Standorte für Bienenstöcke

Innerhalb des we4bee Projekts wurden Bienenstöcke mit Sensoren ausgestattet und an vornehmlich Bildungseinrichtungen verteilt. Ziel des Projekts ist es das Leben und Verhalten von Bienen zu analysieren.
Ziel dieser Arbeit ist es, mit Hilfe von Satellitendaten und Landnutzungsdaten (z.B: OpenStreetMap), die Eignung des Standorts für Bienenstöcke zu bestimmen. Dazu soll mit Hilfe von Machine Learning das Wachstum eines Bienenvolkes mit den Umgebungsdaten analysiert werden und damit geeignete Indikatoren für die Nutzung als Bienenstandort herausgearbeitet werden.
Betreuer/Ansprechpartner: Padraig Davidson
(Deep)Clustering von Bienendaten

Innerhalb des we4bee Projekts wurden Bienenstöcke mit Sensoren ausgestattet und an vornehmlich Bildungseinrichtungen verteilt. Ziel des Projekts ist es das Leben und Verhalten von Bienen zu analysieren.
Ziel dieser Arbeit ist es, unsupervised Clusteringverfahren im Hinblick auf ihre Qualität zur Gruppierung von Daten aus Bienenstöcken zu analysieren. Diese Cluster können dann als Vorsortierung zur Erstellung eines annotierten Datensatzes in Zusammenarbeit mit der Biologie genutzt werden.
Betreuer/Ansprechpartner: Padraig Davidson
Korrektur wechselseitiger Abhängigkeiten von Features

Innerhalb des we4bee Projekts wurden Bienenstöcke mit Sensoren ausgestattet und an vornehmlich Bildungseinrichtungen verteilt. Ziel des Projekts ist es das Leben und Verhalten von Bienen zu analysieren.
Einige dieser Sensoren weisen gegenseitige Abhängigkeiten auf und beeinflussen so die Messgrößen von anderen Sensoren. Prominentes Beispiel ist die Temperaturabhängigkeit der Waage in den Bienenstöcken. Ziel dieser Arbeit ist es, Modelle zu entwickeln und gegeneinander zu evaluieren und diese wechselseitigen Abhängigkeiten zu korrigieren.
Betreuer/Ansprechpartner: Padraig Davidson