MENUMENU
MENUMENU

Statistical Computing (DLBDBSC01)

Kursnummer:

DLBDBSC01

Kursname:

Statistical Computing

Gesamtstunden:

150 h

ECTS Punkte:

5 ECTS

Kurstyp: Pflicht

Kursangebot: WS, SS

Course Duration: Minimaldauer 1 Semester

Zugangsvoraussetzungen:

keine

Kurskoordinator(en) / Dozenten / Lektoren:

Siehe aktuelle Liste der Tutoren im Learning Management System

Bezüge zu anderen Modulen:

Siehe Modulbeschreibung

Beschreibung des Kurses:

Das Statistical Computing verbindet die Konzepte und Methoden der Statistik mit den Werkzeugen aus der Informatik. Das Ergebnis sind unter anderem Statistik-Programme und -Programmiersprachen, die viele nützliche Funktionen zur Analyse von digital verfügbaren Datenquellen bieten. In diesem Kurs wird den Studierenden die Programmiersprache R vermittelt, um damit anschließend statistische Verfahren (z. B. Regressionsanalyse, Varianzanalyse) anwenden zu können. Im Rahmen einer Fallstudie sollen die erworbenen Kompetenzen eingesetzt werden, um Zusammenhänge aus komplexen Datenquellen zu gewinnen und graphisch darzustellen.

Kursziele:

Nach erfolgreichem Abschluss des Kurses sind die Studierenden in der Lage,

  • den Begriff Statistical Computing einzuordnen und abzugrenzen.
  • sich eine PC-Arbeitsumgebung zu schaffen, mit der Aufgaben aus dem Themengebiet Statistical Computing bearbeitet werden können.
  • einfache Programme mit der Programmiersprache R zu schreiben.
  • mit R Daten zu importieren und zu exportieren.
  • mit R verschiedene statistische Verfahren anzuwenden, von der deskriptiven Statistik über die Inferenzstatistik bis hin zur Varianz- und Regressionsanalyse.

Lehrmethoden:

Die Lehrmaterialien enthalten Skripte, Video-Vorlesungen, Übungen, Podcasts, (Online-) Tutorien und Fallstudien. Sie sind so strukturiert, dass Studierende sie in freier Ortswahl und zeitlich unabhängig bearbeiten können.

Inhalte des Kurses:

1. Einstieg in das Statistical Computing

1.1 Begriffsbestimmung und Abgrenzung

1.2 Statistik-Programm vs. Statistik-Programmiersprache

1.3 Einrichtung der Arbeitsumgebung

2. Grundlagen der Programmierung mit R

2.1 R als Taschenrechner

2.2 Zuweisungen

2.3 Logik

2.4 Objekte

2.5 Variablen

2.6 Funktionen

2.7 Datentypen und Datenstrukturen

3. Auf Daten zugreifen

3.1 Daten importieren, speichern und exportieren

3.2 Auf Objekte zugreifen

3.3 Daten sortieren, auswählen, entfernen

4. Deskriptive Statistik

4.1 Univariate deskriptive Statistik

4.2 Bivariate deskriptive Statistik

5. Inferenzstatistik

5.1 Verteilungen

5.2 Stichproben

5.3 t-Tests

6. Varianzanalyse

6.1 Grundlagen und Abgrenzung zum t-Test

6.2 Einfaktorielle Varianzanalyse

6.3 Zweifaktorielle Varianzanalyse

7. Regressionsanalyse

7.1 Lineare Regression

7.2 Korrelation

7.3 Weitere Modelle und Verfahren

Literatur:

  • Ligges, U. (2008): Programmieren mit R. 3. Auflage. Springer, Heidelberg. ISBN 978-3-540-79997-9
  • Luhmann, M. (2015): R für Einsteiger: Einführung in die Statistiksoftware für die Sozialwissenschaften. Beltz, Weinheim, Basel. ISBN 978-3621282499
  • Toomey, D. (2017): Jupyter for Data Science: Exploratory analysis, statistical modeling, machine learning, and data visualization with Jupyter. Packt Publishing, Birmingham, UK. ISBN 978-1785880070
  • Vanderplas, J. (2017): Data Science mit Python: Das Handbuch für den Einsatz von Ipython, Jupyter, NumPy, Pandas, Matplotlib, Scikit-Learn. mitp, Frechen. ISBN 9783958456976
  • Wollschläger, D. (2015): Grundlagen der Datenanalyse mit R: Eine anwendungsorientierte Einführung. Springer Spektrum, Berlin Heidelberg. ISBN 978-3662455067

Prüfungszugangsvoraussetzung:

  • Kursabhängig: Begleitende Online-Lernkontrolle (max. 15 Minuten je Lektion, bestanden / nicht bestanden)
  • Kursevaluation

Prüfungsleistung:

Schriftliche Ausarbeitung: Fallstudie

Zeitaufwand Studierende (in Std.): 150

Selbststudium (in Std.): 110
Selbstüberprüfung (in Std.): 20
Tutorien (in Std.): 20