piwik-script

Intern
    Data Science Chair

    Recommender Systems

    At the Data Science Chair we're researching various topics within the field of recommender system. From classic applications like presenting relevant products to users in an e-commerce setting or recommending tags in our own social bookmarking system BibSonomy, to systems predicting medical examination or decisions in games. We utilize different machine learning algorithms, including deep learning in our work.

    The following staff member have open topics for practica, bachelor and master theses:

    HypTrails, Recommendation, Graph Networks for publication data, Regio Tobias Koopmann
    recommendation in ecommerce, adidas Elisabeth Fischer
    Mathematical Pattern Mining, Representation Learning, Recommender Systems Sebastian Wankerl
    Medical and Healthcare Recommendation Daniel Schlör

     

    In the case of excellent performance there is also the chance to submit the thesis as an article to a computer science conference and to be co-author on a scientific publication early in your studies!

    Open Topics:

    Implementation of Automatic HypTrails Framework

    The goal of this work is to implement a Python framework, which automatically creates all possible hypothesis and calculates their respective evidences according to HypTrail[1]. The input for this framework is supposed to be an attributed multigraph[2] and some distance measures for each attribute of the nodes.

    Possible thesis: BA, MP, MA 

    Betreuer: Tobias Koopmann

    [1] Singer, P., Helic, D., Hotho, A. & Strohmaier, M. (2015). HypTrails: A Bayesian Approach for Comparing Hypotheses About Human Trails on the Web. Proceedings of the 24th International Conference on World Wide Web (p./pp. 1003--1013), New York, NY, USA: ACM. ISBN: 978-1-4503-3469-3 

    [2] Espín-Noboa, L., Lemmerich, F., Strohmaier, M. et al. JANUS: A hypothesis-driven Bayesian approach for understanding edge formation in attributed multigraphs. Appl Netw Sci 2, 16 (2017). https://doi.org/10.1007/s41109-017-0036-1

     

    Analysis of Transformer Networks with respect to Layer Dropout and Dataset Splits

    Recent work hast proposed the transformer architecture. Other work analysed this architecture regarding its sensitivity on dataset splits with respect to the dataset length.
    The main task of this work is to evaluate the transformer and/or BERT architecture with respect to dataset splits not only dependant of the length.  

    Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... & Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems30.

    Csordás, R., Irie, K., & Schmidhuber, J. (2021). The devil is in the detail: Simple tricks improve systematic generalization of transformers. arXiv preprint arXiv:2108.12284.

    Options: Ba Thesis, Ma Thesis

    Betreuer: Tobias Koopmann

    Recommendation of Co-Authorship using Hypergraph Networks

    Recently a new field of Graph Neural Networks has been revealed, which takles the field of Hypergraph networks. These networks use hyperedges, which can connect mutiple vertexes. A bibliometric dataset contains authors as vertices and co-occurences on publications as hyperedges. Given this dataset and the method of Hypergraph networks, we can now train a network to predict co-authorship.

    Feng, Y., You, H., Zhang, Z., Ji, R., & Gao, Y. (2019, July). Hypergraph neural networks. In Proceedings of the AAAI Conference on Artificial Intelligence (Vol. 33, No. 01, pp. 3558-3565).

    Options: Ma Praktika, Ma Thesis

    Betreuer: Tobias Koopmann

     

    Empfehlungssystem zur Unterstützung von Studienanfänger:innen in Vorkursen

    Empfehlungssysteme spielen in den letzten Jahres auch im Bereich des E-Learnings eine zunehmend größere Rolle. Dort können sie z.B. helfen, den Lernenden entsprechend ihres persönlichen Lernfortschritts und ihrer Wissenslücken passende Lernelemente wie Texte und Übungsaufgaben zur Verfügung zu stellen.

    In unserem Setting möchten wir Studienfänger:innen in den Ingenieurswissenschaften individuell passende Mathematikaufgaben auf dem Niveau von Mathematikvorkursen vorschlagen.

    Eine Herausforderung hierbei ist die verhältnismäßig geringe Anzahl an Nutzerinteraktionen, die für das Training des Empfehlungssystem zur Verfügung stehen. Es ist also folglich sinnvoll, weitere Informationen über die Lernelemente einzubinden.

    Ziel der Arbeit ist es, ein Recommender System zu verbessern, das in oben beschriebenem Setting eingesetzt werden kann. Hierfür liegen bereits ein Prototyp sowie ein Datensatz vor und können als Ausgangspunkt für die Arbeit genutzt werden.

     

    Betreuer: Sebastian Wankerl

    Sequence-to-sequence models for recommendation in e-commerce (adidas)

    Empfehlungssysteme im E-Commerce Bereich werden meist verwendet um personalisierte Produktempfehlungen auf Basis der letzten Interaktionen eines Benutzers mit einem System zu generieren. Interaktionen können sich auf Seiten oder konkrete Produkte beziehen. Häufig werden nur Produktinteraktionen betrachtet.

    In dieser Arbeit soll ein Sequence-to-Sequence Modell entwickelt werden, welches eine Sequenz von Produkt- und Seiteninteraktionen in eine Sequenz von Produktempfehlungen überträgt. Die Empfehlungsgenerierung soll somit als Übersetzung der Interaktionen in  Empfehlungen interpretiert werden. 

    Gegebenenfalls lässt sich die Arbeit auch als Kooperation mit unserem Projektpartner adidas gestalten.

    Betreuer/Ansprechpartner: Elisabeth Fischer

    Language Modelle für Recommender Systeme

    Das Verständnis von Text ist auch ein wichtiger Bestandteil von Recommender Systemen, wenn sie auf Grundlage von textuellen Informationen Vorschläge generieren. Es hat sich gezeigt, dass Sprachmodelle/Language Modelle, die auf einem großen Korpus von Text trainiert wurden, leicht für andere Aufgaben umtrainiert werden können.

    In dieser Arbeit soll evaluiert werden inwiefern an die Domäne angepasste Language Modelle in Recommendation Tasks integriert die Vorhersage verbessern können. Mögliche Anwendungsbereiche finden sich beispielsweise in der Medizin oder bei der Empfehlung wissenschaftlicher Publikationen.

    Betreuer/Ansprechpartner: Daniel Schlör