Data Mining
Die Vorlesung gibt einen Überblick über die Wissensgewinnung aus (strukturierten) Daten. Dazu gehören unter anderem:
- Vorverabeitungstechniken
- OLAP-Analyse & Data-Warehousing
- Clustering (k-means, k-medoids, DBSCAN, OPTICS)
- Klassifikation (k-Nearest-Neighbor, Bayes, Entscheidungsbaum, Support Vector Machine; Bagging, Boosting, z. B. Random Forest, AdaBoost)
- Regressionsanalyse (Linear Regression, Logistic Regression)
- Assoziationsregellernen (Aprioiri, FP-Growth)
- Einführung in Deep Learning
Organisatorisches
Bitte Beachten:
Aufgrund der aktuellen Umstände wird die Vorlesung Data Mining auf Online-Lehre umgestellt.
Sie finden alle aktuellen Informationen der Veranstaltung auf WueCampus2.
Bitte schreiben Sie sich über den obigen Link frühzeitig in WueCampus2 ein, um Zugriff auf den Kurs, aber auch E-Mails mit wichtigen Ankündigungen erhalten zu können.
- Vorlesung
Die Vorlesung wird Mo, 10:15 - 11:45 über ZOOM gehalten.
Links zur Teilnahme an jedem Vorlesungstermin werden rechtzeitig in WueCampus2 bereitgestellt. Bitte stellen Sie sicher dass ZOOM auf Ihrem System funktioniert (siehe unten), damit Sie ohne Probleme an der Erstveranstaltung am 12.04. teilnehmen können.
In der Erstveranstaltung werden wir einige Zeit damit verbringen die Technik des Systems zu testen, um einen korrekten Ablauf der kommenden Vorlesungen sicherzustellen, sowie alle wichtigen organisatorischen Informationen für den Ablauf des Semesters teilen. - Übungen
Do, 14:15 - 15:45
Do, 16:15 - 17:45
Fr 14:15 - 15:45
Der Übungsbetrieb wird auch über ZOOM stattfinden. Bitte stellen Sie für eine bessere Betreuung sicher, dass Sie eine Kamera zur Verfügung haben (ggf über Handy). Das genaue Übungsformat wird wie gehabt während der Erstveranstaltung bekanntgegeben. - Prüfung
Es wird am Ende des Semesters eine Prüfung stattfinden. Form, Ablauf und genauer Zeitpunkt müssen allerdings noch erarbeitet werden, und werden baldmöglichst über WueCampus2 bekannt gegeben. - ZOOM
ZOOM benötigt einen vorinstallierten Client. Ein Account wird zur Teilnahme allerdings nicht benötigt. ZOOM ist außerdem auch auf Android und IOS verfügbar.
(ZOOM funktioniert auch im Browser. Diese Variante können wir aber aufgrund der schlechteren Performance nicht empfehlen.) - Aktuelle Details werden im Ankündigungsforum des WueCampus2 Kurses geteilt.
Bleiben Sie gesund!
Literatur
Weitere Literatur zur Vorlesung
-
Sequential minimal optimization: A fast algorithm for training support vector machines (1998).
-
OPTICS: Ordering Points To Identify the Clustering Structure (1999). 49–60.
- [ BibTeX ]
-
On End-to-End Program Generation from User Intention by Deep Neural Networks. in CoRR (2015). abs/1510.07211
-
Mining Frequent Patterns without Candidate Generation in SIGMOD Conference, W. Chen, J. F. Naughton, P. A. Bernstein (reds.) (2000). 1–12.
-
Maximum likelihood from incomplete data via the {EM} algorithm in Journal of the Royal Statistical Society: Series B (1977). 39 1–38.
-
Experiments with a New Boosting Algorithm in International Conference on Machine Learning (1996). 148–156.
-
Experimental evidence of massive-scale emotional contagion through social networks in Proceedings of the National Academy of Sciences (2014). 111(24) 8788–8790.
-
Data Science and Prediction in Commun. ACM (2013). 56(12) 64–73.
-
Data Science and its Relationship to Big Data and Data-Driven Decision Making in Big Data (2013). 1(1) 51–59.
- [ BibTeX ]
-
Clustering by means of medoids (I. D. Y; editor, reds.) (1987). 405–416.
- [ BibTeX ]
-
Bagging, Boosting, and C4.5 in AAAI/IAAI, Vol. 1, W. J. Clancey, D. S. Weld (reds.) (1996). 725–730.
-
Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications in Proceedings of the ACM SIGMOD Int’l Conference on Management of Data, Seattle, Washington (1998). 94–105.
- [ BibTeX ]
-
A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise in Proc. of 2nd International Conference on Knowledge Discovery and (1996). 226–231.
- [ BibTeX ]