Data Mining
Die Vorlesung gibt einen Überblick über die Wissensgewinnung aus (strukturierten) Daten. Dazu gehören unter anderem:
- Vorverabeitungstechniken
- OLAP-Analyse & Data-Warehousing
- Clustering (k-means, k-medoids, DBSCAN, OPTICS)
- Klassifikation (k-Nearest-Neighbor, Bayes, Entscheidungsbaum, Support Vector Machine; Bagging, Boosting, z. B. Random Forest, AdaBoost)
- Assoziationsregellernen (Aprioiri, FP-Growth)
- Subgruppenentdeckung
Organisatorisches
- Vorlesung:
Di, 12:15 - 13:45
Informatik - Übungsraum II
Erster Veranstaltungstag: 14.04.2015 - Übung:
Do, 14:15 - 15:45
Informatik - Übungsraum II
Erster Veranstaltungstag: 23.04.2015 - WueCampus-Kurs:
Kurs - Anmeldung: Eine Anmeldung vor der ersten Vorlesung ist nicht nötig! Die genauen Einschreibemodalitäten werden in der ersten Vorlesungssitzung bekannt gegeben.
- Prüfung SS 2015: 22.07.2015 10:15
- Prüfung WS 2015/16: 05.10.2015 10:15 (schriftlich) oder 05./06.10.2015 mündlich, je nach Teilnehmerzahl. Anmeldung über sb@home
Literatur
Weitere Literatur zur Vorlesung
-
Sequential minimal optimization: A fast algorithm for training support vector machines (1998).
-
OPTICS: Ordering Points To Identify the Clustering Structure (1999). 49–60.
- [ BibTeX ]
-
On End-to-End Program Generation from User Intention by Deep Neural Networks. in CoRR (2015). abs/1510.07211
-
Mining Frequent Patterns without Candidate Generation in SIGMOD Conference, W. Chen, J. F. Naughton, P. A. Bernstein (eds.) (2000). 1–12.
-
Maximum likelihood from incomplete data via the EM algorithm in Journal of the Royal Statistical Society: Series B (1977). 39 1–38.
-
Experiments with a New Boosting Algorithm in International Conference on Machine Learning (1996). 148–156.
-
Experimental evidence of massive-scale emotional contagion through social networks in Proceedings of the National Academy of Sciences (2014). 111(24) 8788–8790.
-
Data Science and Prediction in Commun. ACM (2013). 56(12) 64–73.
-
Data Science and its Relationship to Big Data and Data-Driven Decision Making in Big Data (2013). 1(1) 51–59.
- [ BibTeX ]
-
Clustering by means of medoids (I. D. Y; editor, eds.) (1987). 405–416.
- [ BibTeX ]
-
Bagging, Boosting, and C4.5 in AAAI/IAAI, Vol. 1, W. J. Clancey, D. S. Weld (eds.) (1996). 725–730.
-
Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications in Proceedings of the ACM SIGMOD Int’l Conference on Management of Data, Seattle, Washington (1998). 94–105.
- [ BibTeX ]
-
A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise in Proc. of 2nd International Conference on Knowledge Discovery and (1996). 226–231.
- [ BibTeX ]