Big Data
Typ | Vorlesung mit integrierter Übung |
Dozent | H. Martin Bücker, Johannes Schoder |
Credit points | 6 ECTS = 4 SWS |
Friedolin | Search in Friedolin |
Beschreibung
Das Thema "Big Data" ist nicht erst seit der Diskussion um die systematische Erfassung von personenbezogenen Daten aus allen Lebensbereichen durch internationale Nachrichtendienste und global operierenden Internet-Firmen in aller Munde. Die Analyse von großen und heterogenen Datenmengen etabliert sich in der modernen Wissensgesellschaft zunehmend als eine der methodischen Kernkompetenzen von Informatik und Mathematik. Ziel dieser Lehrveranstaltung sind jedoch nicht die zugrundeliegenden Methoden der Datenanalyse, sondern der praktische Umgang mit Systemen, mit denen solche Analysen heute durchgeführt werden. Insbesondere werden die parallelen Programmiermodelle MapReduce und Spark vorgestellt und in praktischen Übungen vertiefend behandelt. Ziel der Lehrveranstaltung ist neben dem Erlernen der Programmierung solcher Big-Data-Systeme vor allem die Fähigkeit, die versteckten Performance-Engpässe von solchen Programmen erkennen zu können und durch geeignete Mittel umgehen zu können.
Studiengänge
Diese einführende Vorlesung ist geeignet für Studierende zu Beginn des Masterstudiums, kann aber auch am Ende eines Bachelorstudiums gehört werden. Kenntnisse in serieller Programmierung werden vorausgesetzt. Dagegen sind Kenntnisse in traditionellen parallelen Programmiermodellen (MPI, OpenMP, CUDA) nicht notwendig und auch nicht wirklich hilfreich.
M.Sc. Computational and Data Science | Pflichtbereich |
M.Sc. Informatik (V2016) | Wahlpflichtbereich Informatik und Vertiefung Informatik |
M.Sc. Informatik (V2021) | High-Performance Computing I-V (6 LP) |
Die Veranstaltung ist auch geeignet für Studierende aus Mathematik und anderen naturwissenschaftlichen Fachrichtungen.