Academy

Programmieren & Datenanalyse

Grundlegende Programmierung in R

4-10 Teilnehmer | 2 Tage

Dieser Kurs wendet sich an Personen, die keinerlei Erfahrung im Umgang mit R haben. Hier lernen Sie das Programm von der Pike auf kennen.

Termine und Buchung

Mit Zahlen umgehen

  • R als Taschenrechner & Simulator
  • Objekte verstehen
  • Exotische Zahlenwerte: NA, NaN, Inf
  • Vektoren verstehen
  • Mit Vektorfunktionen arbeiten

Logik & Text

  • Mit logischen Vektoren arbeiten
  • Logische Indizierung verstehen und verwenden
  • Text-Verarbeitung
  • Zahlen formatieren
  • Mit Faktoren umgehen
  • Texte aufbereiten und analysieren

Erweiterte Vektoren

  • Datumskonzepte verstehen & verwenden
  • Zeitreihen erzeugen und verwenden
  • Mit Matrizen arbeiten
  • Mit Feldern (arrays) umgehen

Datensätze & Listen

  • Funktionen erstellen
  • Argumente richtig verwenden
  • Rückgabeobjekte gestalten
  • Methoden verstehen

Funktionen

  • Einfache Verzweigungen mit if & switch
  • Verzweigungen auf Vektoren anwenden
  • Schleifen programmieren
  • Schleifen vermeiden: Apply & Co.

Ablaufkontrolle

  • Objekte lesen und schreiben
  • Textdateien verarbeiten
  • Codeskripte & Pakete einbinden
  • Excel-Dateien verarbeiten
  • Datenbanken anbinden & verwenden

Professionelle Programmierung in R

4-10 Teilnehmer | 2 Tage

Dieser Kurs wendet sich an Personen, die schon regelmäßig mit R programmieren. Hier lernen Sie vertiefende Funktionen für Ihren täglichen Umgang kennen.

Termine und Buchung

Import/Export von Daten

  • Objekte lesen und schreiben
  • Textdateien verarbeiten
  • Codeskripte & Pakete einbinden
  • Excel-Dateien verarbeiten
  • Datenbanken anbinden & verwenden

Entwickeln und testen

  • Styleguide und Konventionen
  • xUnit Testing, das Paket testthat
  • Testgetrieben entwickeln
  • Testabdeckung fachliche Qualittssicherung
  • Entwurfsmuster
  • Dokumentation

Pakete entwickeln und verwalten

  • Der Weg vom Script zum Package
  • Design des Paketes und Ergebnistypen
  • Code: robust und schnell
  • Daten und Beispiele
  • Test, Dokumentation, Veröffentlichung
  • Pakete und Abhängigkeiten verwalten

Funktionale Programmierung

  • Funktionale Programmiersprachen verstehen
  • Anonyme Funktionen einsetzen
  • Closures und Funktionsfabriken
  • Listen von Funktionen
  • Funktionale Funktionsoperatoren

Objektorientierte Programmierung

  • Grundlagen
  • S3-Klassen verstehen und anwenden
  • S4-Klassen verstehen und anwenden
  • Referenzklassen (RC) verstehen
  • Standard-RC-Klassen einsetzen
  • R6-Referenzklassen verwenden

Performance und Speicher

  • Die Struktur von R
  • R Interpreter auswählen
  • Code optimieren
  • Speicherverwaltung
  • Code parallelisieren

Datenanalyse in R

4-10 Teilnehmer | 2 Tage

Dieser Kurs wendet sich an Personen, die hauptsächlich den Umgang mit R als Werkzeug für interaktive Datenanalyse erlernen wollen.

Termine und Buchung

Daten grafisch darstellen

  • Die Grafiksysteme von R kennenlernen
  • Mit den Basisfunktionen arbeiten
  • Eine Grafik publikationsreif machen
  • Daten zum Leben erwecken: das paket lattice
  • Die Sprache der Bilder sprechen: das Paket ggplot2

Schätzen & Testen

  • Schätzen und Testen
  • Punktschätzung
  • Intervallschätzung
  • Die Qualität von Schätzverfahren beurteilen
  • Tests verstehen und einsetzen
  • Qualität von Tests: Operationscharakteristik und Power-Analyse
  • Nullhypothesen formulieren

Mathematische Grundlagen visualisieren

  • Zufallsvariablen und -verteilungen darstellen und charakterisieren
  • Beziehungen zwischen Zufallsvariablen darstellen
  • Die Normalverteilung und den zentralen Grenzwertsatz simulieren
  • Spezialverteilungen verstehen: Chi-Quadrat-, t- und F-Verteilung
  • Konfidenzintervalle visualisieren und simulieren
  • Hypothesentests visualisieren und simulieren

Lineare Regression

  • Die Regressions-Familie kennenlernen
  • Hypothesenbildung und goldene Regeln
  • Das Prinzip der kleinsten Quadrate verstehen
  • Diagnose: Anpassungsgüte sowie Residuen untersuchen
  • Nichtlineare, polynomiale und multiple Regression
  • Zweiwertige Daten verstehen: Logistische Regression

Datenqualität

  • Fehlende Daten: Zufällig oder systematisch?
  • Klassische Methoden: Löschen, Intra- und Extrapolation, Regression
  • Moderne Methoden: Maximum-Likelihood- und Multiple Imputation
  • Ausreißer: Ungewöhnliche Werte
  • Ungewöhnliche Formen und Parameter

Ihre Trainer

 

Karl-Kuno Kunze

Karl-Kuno Kunze

Karl-Kuno Kunze erwarb Diplome in Physik und in Wirtschaftsphysik, ein DEA de Physique des Liquides der Universität Paris und ein MSc in Mathematical Finance der Universität Oxford.

Er promovierte zunächst in theoretischer Physik, dann in Wirtschaftswissenschaften.

Nach mehr als fünfzehn Jahren Praxis in der Anwendung quantitativer Modelle in der Finanzwirtschaft, leitet er heute daqana und lehrt als Professor für Wirtschaftsmathematik und -statistik an der Ostfalia Hochschule in Wolfsburg.

Mirjam Rehr

Mirjam Rehr

Mirjam Rehr erwarb ihr Diplom in Statistik an der LMU in München und arbeitete danach als wissenschaftliche Mitarbeiterin am Institut für Geoinformatik, WWU Münster sowie am Institut für Medizinische Informatik, UKM/WWU Münster.

Für das Joint Research Center der EU (Ispra) war sie an der Konzeption und Leitung des Kurses „Statistische Modellierung in R“ beteiligt.

Umfangreiche, praktische Erfahrung in der Auswertung größerer Datensätze sammelte sie u.a. durch ihre Projektarbeit für das European Topic Center on Air Pollution and Climate Change Mitigation.

Ralf Stubner

Ralf Stubner

Ralf Stubner erwarb ein Diplom in Physik und promovierte danach in theoretischer Physik.

Er hat über zehn Jahre Erfahrung in Entwurf und Entwicklung datengetriebener Systeme sowie in der Nutzung der Daten für quantitative Modelle in der Finanzwirtschaft.

Daneben hat er mehrere technische Schulungen konzipiert und geleitet.