Intern
    Data Science Chair

    Seminar: Ausgewählte Themen des Machine Learning

    Veranstalter: Prof. Dr. Andreas Hotho, Alexander Dallman, TBA

    Bei Fragen oder zur Reservierung eines Themas/Platzes nutzen Sie bitte die Adresse lsx-seminar@informatik.uni-wuerzburg.de.
    Falls ihr euch ein Thema reservieren wollt, bitte gebt immer euren Studiengang und eure Matrikelnummer mit an.

    PS: Ihr könnt euren Platz im Seminar bereits reservieren, bevor wir die Themen bekannt geben. So habt ihr ein Thema bereits sicher. 

    WueCampus-Kurs:  Seminar: Ausgewählte Themen des Machine Learning (Selbsteinschreibung möglich)

    BibSonomy Gruppe: uw_ws20_ml 

    Vorbesprechung: 02.11.2020 11:00 Uhr

    Die Vorbesprechung wird über Zoom stattfinden. Weitere Informationen, wie Meeting ID,  werden im WueCampus Kurs angekündigt. 

    Erste Abgabe:      14.12.2020
    Review Abgabe:  21.12.2020
    Finale Abgabe:    am letzten Vortragstag (wird noch festgelegt)

    Zusammenfassung jeweils eine Woche vor dem Vortrag abgeben!
    Vorträge:               11.01.2021 - 23.01.2021 (genaue Blocktermine werden noch bekannt gegeben)

    Corona News

    Aufgrund der aktuellen Umstände wird das Seminar auf Online-Lehre umgestellt.
    Sie finden alle aktuellen Informationen der Veranstaltung auf WueCampus2.
    Bitte schreiben Sie sich über den obigen Link frühzeitig in WueCampus2 ein, um Zugriff auf den Kurs, sowie E-Mails von wichtigen Ankündigungen erhalten zu können. 

    Nach der Erstbesprechung werden wir die Themen fest an Studenten vergeben. Danach werden voraussichtlich Studenten ohne Thema ausgeschrieben und die Selbsteinschreibe-Option ausgeschaltet. 

    Alle Besprechungen und Vorträge werden nach aktuellem Stand über ZOOM veranstaltet. Wir bitten um eine funktionierende Kamera. 

    ZOOM
    ZOOM benötigt einen vorinstallierten Client, der unter https://zoom.us/download verfügbar ist. Ein Account wird zur Teilnahme allerdings nicht benötigt. ZOOM ist außerdem auch auf Android und IOS verfügbar.
    (ZOOM funktioniert auch im Browser. Diese Variante können wir aber aufgrund der schlechteren Performance nicht empfehlen.)

    Aktuelle Details werden im Ankündigungsforum des WueCampus2 Kurses geteilt.
    Bleiben Sie gesund!

    Themenvergabe und Vorbesprechung

    Themen können schon vor dem Vorbesprechungstermin reserviert werden. Die Themen werden einige Zeit vor der Vorbesprechung hier auf dieser Seite bekannt gegeben.

    Bei der Vorbesprechung werden die Themen - so nicht schon vergeben - an die anwesenden Seminarteilnehmer verteilt. Grundsätzlich besteht Anwesenheitspflicht. Teilnehmer, die bereits ein Thema bearbeiten, aber ohne Absprache fehlen, verlieren den Anspruch auf ihr Thema/ihren Platz

    Konzept und Ablauf des Seminars

    Im Zentrum dieses Seminars steht ein wissenschaftlicher Artikel und ein darin verwendetes Konzept. Ein Beispiel wäre das Paper 

    MixedTrails: Bayesian hypothesis comparison on heterogeneous sequential data von Martin Becker, Florian Lemmerich, Philipp Singer, Markus Strohmaier, Andreas Hotho

    In dem folgendes Konzept eine zentrale Rolle spielt:  Bayes Factor 

    Im Rahmen des Seminars soll nun das Konzept aufgearbeitet und verwandte Literatur gesucht werden. Das Ziel ist es, in Ausarbeitung und dem Vortrag des Seminars das gegebene Konzept unter Verwendung entsprechender Referenzen verständlich einzuführen und zu erklären und die Methode des wissenschaftlichen Artikels vorzustellen. Außerdem sollen eine Erweiterung der Methode oder die Übertragung auf eine andere Domäne aus anderen Artikeln beleuchtet werden.

    Der Ablauf des Seminar ist wie folgt:

    • Zuerst wird die Ausarbeitung angefertigt. 
    • Dann wird die Arbeit abgegeben und begutachtet. Diese Begutachtung erfolgt durch den Betreuer und anonym durch zwei andere Seminarteilnehmer. Das heisst, jeder Seminarteilnehmer, muss je zwei Beurteilungen für andere Seminarteilnehmer anfertigen. Die Begutachtungen gehen zurück an den Autor, der dann die Möglichkeit hat, seine Ausarbeitung zu überarbeiten.  
    • Dann wird zeitgleich der Vortrag (20 Minuten Vortrag, 10 Minuten Fragen) und eine kurze Zusammenfassung (~1000 Zeichen) vorbereitet.
    • Der Vortrag wird dann in Blockveranstaltungen gehalten. Bei den Blockveranstaltungen besteht Anwesenheitspflicht. 

    Themen

    Die Grundlage zu den Vorträgen bilden wissenschaftliche Aufsätze (Papers). Jedes hier aufgeführte Paper entspricht einem Thema.

    • themenrelevante Paper sind mit dem Tag thema versehen
    • die einzelnen Themen werden anhand der Tags thema:x, thema:y, etc. unterschieden
    • Ziel des Seminars ist es NICHT den Inhalt des Papers zusammenzufassen, sondern das Thema, das durch das Tag thema:x gegeben ist, aufzuarbeiten.
    • die Tags findet man auf BibSonomy in der entsprechenden Gruppe (siehe oben)

    Die Themen für das Wintersemester 2020 werden erst kurze Zeit vor Vorlesungsbeginn veröffentlicht. 

    Bei der Erstbesprechung werden übrige bzw. wieder frei gewordene Themen an anwesende Studenten verteilt. Wer möchte kann sich dafür auch auf eine Warteliste eintragen lassen (Anwesenheit trotzdem erforderlich). 

    Offene Themen

    Bereits vergebene Themen

    • Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation. Liu, Chenxi; Chen, Liang-Chieh; Schroff, Florian; Adam, Hartwig; Hua, Wei; Yuille, Alan L.; Fei-Fei, Li. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2019.
    • Transformer-XL: Attentive Language Models beyond a Fixed-Length Context. Dai, Zihang; Yang, Zhilin; Yang, Yiming; Carbonell, Jaime G.; Le, Quoc Viet; Salakhutdinov, Ruslan. In ACL (1), A. Korhonen, D. R. Traum, L. Màrquez (reds.), bll 2978–2988. Association for Computational Linguistics, 2019.
    • BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer. Sun, Fei; Liu, Jun; Wu, Jian; Pei, Changhua; Lin, Xiao; Ou, Wenwu; Jiang, Peng. In CIKM, W. Zhu, D. Tao, X. Cheng, P. Cui, E. A. Rundensteiner, D. Carmel, Q. He, J. X. Yu (reds.), bll 1441–1450. ACM, 2019.
    • ERNIE: Enhanced Language Representation with Informative Entities. Zhang, Zhengyan; Han, Xu; Liu, Zhiyuan; Jiang, Xin; Sun, Maosong; Liu, Qun. In ACL (1), A. Korhonen, D. R. Traum, L. Màrquez (reds.), bll 1441–1451. Association for Computational Linguistics, 2019.
    • Convolutional 2D Knowledge Graph Embeddings. Dettmers, Tim; Minervini, Pasquale; Stenetorp, Pontus; Riedel, Sebastian. In AAAI 2018. 2018.
    • Personalized Top-N Sequential Recommendation via Convolutional Sequence Embedding. Tang, Jiaxi; Wang, Ke. In Proceedings of the Eleventh ACM International Conference on Web Search and Data Mining. 2018.
    • Graph Attention Networks. Velickovic, Petar; Cucurull, Guillem; Casanova, A.; Romero, A.; Li{ò}, P.; Bengio, Yoshua. In ArXiv, abs/1710.10903. 2018.
    • Self-Attentive Sequential Recommendation. Kang, Wang-Cheng; McAuley, Julian J. In ICDM, bll 197–206. IEEE Computer Society, 2018.
    • Learning to Monitor Machine Health with Convolutional Bi-Directional LSTM Networks. Zhao, Rui; Yan, Ruqiang; Wang, Jinjiang; Mao, Kezhi. In Sensors, 17(2), bl 273. 2017.
    • A Data-Driven Soft Sensor Modeling Method Based on Deep Learning and its Application. Yan, Weiwu; Tang, Di; Lin, Yujun. In IEEE Trans. Ind. Electron., 64(5), bll 4237–4245. 2017.
    • Discriminative Unsupervised Feature Learning with Exemplar Convolutional Neural Networks. Dosovitskiy, Alexey; Fischer, Philipp; Springenberg, Jost Tobias; Riedmiller, Martin A.; Brox, Thomas. In IEEE Trans. Pattern Anal. Mach. Intell., 38(9), bll 1734–1747. 2016.
    • Session-based Recommendations with Recurrent Neural Networks. Hidasi, Balázs; Karatzoglou, Alexandros; Baltrunas, Linas; Tikk, Domonkos. 2015.
    • Hierarchical semantic indexing for large scale image retrieval. Deng, Jia; Berg, Alexander C.; Li, Fei-Fei. In CVPR, bll 785–792. IEEE Computer Society, 2011.
    • Dimensionality Reduction by Learning an Invariant Mapping. Hadsell, Raia; Chopra, Sumit; LeCun, Yann. In CVPR (2), bll 1735–1742. IEEE Computer Society, 2006.

    Leistungsnachweis

    Zum Ablauf der oben angegebenen Bearbeitungsfristen sind jeweils per Email als PDF dem Betreuer abzugeben:

    • eine genau 6-seitige LaTeX-Ausarbeitung im hier beschriebenen Format (doppelspaltig, inklusive Bibliographie) 
      • eine erste Version zur Begutachtung
      • die finale Version 
    • die zwei Begutachtungen anderer Arbeiten
    • eine Zusammenfassung der Arbeit (~1000 Zeichen)
    • der Foliensatz

    Vorherige Absprachen mit dem Betreuer sind ausdrücklich erwünscht. Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in http://www.bibsonomy.org in der entsprechenden Gruppe (relevant for) mit den Tags des jeweiligen Themas und weiteren sinnvollen Tags zu versehen.

    Die Vortragsdauer beträgt verbindlich 20 Minuten, nach dem Vortrag besteht Gelegenheit zur Diskussion (ca. 10 Minuten). Der Vortrag (inkl. Folien und Abstract) geht mit 30% in die Endnote ein, die Ausarbeitung ebenfalls mit 30%. Die angefertigeten Reviews gehen 20% in die Note ein. Die letzten 20% bewerten die Eigenständigkeit der Ausarbeitung, Einhaltung von Terminen, Beteiligung am Seminar etc.

    Bearbeitungshinweise

    Als Richtlinie für die Erstellung einer guten Seminararbeit (inkl. Vortrag und Ausarbeitung) wird das Buch

    Markus Deininger and Horst Lichter and Jochen Ludewig and Kurt Schneider. Studien-Arbeiten: ein Leitfaden zur Vorbereitung, Durchführung und Betreuung von Studien-, Diplom- Abschluss- und Doktorarbeiten am Beispiel Informatik. 5. Auflage. vdf Hochschulverlag, Zürich, 2005. 

    empfohlen, welches beim Betreuer des Seminars (Prof. Dr. Andreas Hotho) ausliegt. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann. Die Benotung der Seminararbeit erfolgt in Anlehnung an das dort auf Seite 77 angegebene Schema, angepasst auf die Erfordernisse einer Seminararbeit.