piwik-script

Deutsch Intern
    Data Science Chair

    Environmental Science

    The Data Science Chair works with environmental data to contribute to the ongoing climate research. Based on low-cost sensors, map and geographical data, we develop novel approaches to environmental questions. These questions include "What is the air pollution at a given spot on earth?" and "What type of wine should I grow on my land given the development in climate in the next few decades?". While answering such questions is one concern of our research, the other objective is to raise awareness for the environment in the society.

    The following staff member have open topics for practica, bachelor and master theses:

    EEG Classification, NIR Calibration, Neural Architecture Search Florian Buckermann
    Dynamical Systems, Fluid Simulation, Semi-supervised learning
       Andrzej Dulny
    Imbalanced Regression, ML for climate science, Air pollution modelling Michael Steininger
    Semi-unsupervised Learning, Bee-Behavior Padraig Davidson

     

    In the case of excellent performance there is also the chance to submit the thesis as an article to a computer science conference and to be co-author on a scientific publication early in your studies!

    Open Topics:

    Feature Learning für Orte im Kontext von Luftschadstoffmodellierung

    Effiziente Feature- oder Informationsrepräsentationen sind wichtig für Machine Learning Modelle, unter anderem weil sie sonst schnell dazu neigen nicht zu generalisieren, sondern Trainingsbeispiele auswendig zu lernen. Der klassische Ansatz um gute Features für Machine Learning Modelle zu finden ist manuelles Feature Engineering. Alternativ gibt es eine Reihe von Verfahren zur automatischen Featuregenerierung, die unter den Begriff Feature Learning oder Representation Learning fallen.

    In dieser Arbeit sollen verschiedene Feature Learning/Representation Learning Ansätze für die Vorhersage von Schadstoffkonzentrationen angewendet, verglichen und analysiert werden. Dabei sollen Rohinformationen über Orte wie z. B. Landnutzung (Industriegebiet, Wohngebiet, Straßen, etc.) oder geographische Eigenschaften effizient repräsentiert werden, sodass ein sog. Land-Use Regression Modell möglichst gut Schadstoffkonzentrationen für die Orte vorhersagen kann.

    Betreuer: Michael Steininger

    Wettermodelierung mittels Graph Neural Networks

    Datengetriebene Modelierungsansätze, insbesondere Deep Learning, haben sich in vielen Anwendungsbereichen als besonders effizient und genau ausgewiesen. Im Bereich der Wettervorhersage zeigen sich hingegen die numerischen Ansätze weiterhin den Deep Learning Modellen überlegen. In den letzten Jahren wurden jedoch mehrere vielversprechende Modelierungsansätze vorgestellt die bisher nicht für die Wettermodelierungsaufgabe angewendet wurden. Ein prominentes Beispiel davon sind sog. Message Passing Graph Neural Networks, die erfolgreich für das Modelieren von Fluiden und anderen physikalischen Systemen angewendet wurden.

    Ziel dieser Arbeit ist es existierende Ansätze zur Modelierung dynamischer Systeme (insb. sog. Message Passing Graph Neural Networks) für datengetriebene Wettervorhersage anzuwenden.

    Betreuer: Andrzej Dulny

    (Deep)Clustering von Bienendaten

    Innerhalb des we4bee Projekts wurden Bienenstöcke mit Sensoren ausgestattet und an vornehmlich Bildungseinrichtungen verteilt. Ziel des Projekts ist es das Leben und Verhalten von Bienen zu analysieren.

    Ziel dieser Arbeit ist es, unsupervised Clusteringverfahren im Hinblick auf ihre Qualität zur Gruppierung von Daten aus Bienenstöcken zu analysieren. Diese Cluster können dann als Vorsortierung zur Erstellung eines annotierten Datensatzes in Zusammenarbeit mit der Biologie genutzt werden.

    Betreuer/Ansprechpartner: Padraig Davidson

    Semi-(un)supervised Learning mit vortrainierten Netzen

    In der Bildklassifikation und im Bereich des NLP gibt es eine Vielzahl vortrainierter Netze. Bei Bildern zählen VGG und ResNET in ihren verschiedenen Ausprägungen zu den Bekanntesten.

    Ziel dieser Arbeit (BA/MAP) ist es, vortrainierte Netze im Bereich des semi-supervised und semi-unsupervised learnings zu analysieren. Das bedeutet, dass innerhalb der Klassifikation nur sehr wenige Labels für jede Klasse (semi-supervised) oder für manche Klassen gar keine (semi-unsupervised) zur Verfügung stehen. Es sollen dabei einige bekannte Netze untereinander verglichen werden, mit besonderem Augenmerk auf die erzielte Genauigkeit bei reduzierter Labelanzahl und Anzahl der Operationen, die für das Nachtraining nötig sind.

    Betreuer/Ansprechpartner: Padraig Davidson

    Unbiased characterization of tremor disorders using Deep Learning for time series analysis

    Massive time series feature extraction is a powerful tool to examine oscillating biological signals (Fulcher and Jones, 2017) such as tremor disorders. Tremor is defined as the involuntary, rhythmical, sinusoidal movement of a limb, such as for example in Parkinson´s disease or essential tremor.  The exact phenomenological study of tremor movements has been shown to predict the response to non-invasive stimulation of an individual tremor (Schreglmann et al., 2021). This study is aiming to extend an existing analytical pipeline examining higher-dimensional mathematical features extracted from accelerometer time-signals recorded over the tremulous limb. In addition, we intend to utilize deep learning approaches, such as long-short term networks (LSTMs) and Convolutional Neural Networks (CNNs). The pipeline will be used to differentiate tremor causes, response to treatment and explore tremor disorders in a more mechanistic way.

    Fulcher BD, Jones NS. hctsa: A Computational Framework for Automated Time-Series Phenotyping Using Massive Feature Extraction. Cell systems 2017; 5: 527-531.e3.

    Schreglmann SR, Wang D, Peach RL, Li J, Zhang X, Latorre A, et al. Non-invasive suppression of essential tremor via phase-locked disruption of its temporal coherence. Nat Commun 2021; 12: 36

     

    Requirements

    • Experience programming with Python (or Matlab)
    • (Beneficial) Experience with Pytorch or Tensorflow
    • (Beneficial) Interest in data-driven neuroscience.

    Betreuer: Anna Krause