R-Intro

Tobi & Lukas

Stand: 08. May 2018 @ 22:14 Uhr

Na, auch hier?

Wer sind wir

Tobi


Lukas

Was machen wir hier?

Wir stellen euch R vor.

https://r-intro.tadaa-data.de

Ziele des Kurses

  • Ihr wisst was R ist und habt RStudio einsatzbereit auf eurem Rechner
  • Umgang mit RStudio
  • Vermittlung grundlegenden Vokabulars
  • Anwendung von Funktionen und rudimentären Statistiken
  • Erweiterung des Funktionsumfangs mit Hilfe von Paketen

Fahrplan

  • Was ist R überhaupt und wozu brauchen wir das?
  • Installation
  • RStudio: die Arbeitsoberfläche
  • R: ein glorifizierter Taschenrechner?
  • Die Open Source Community: Pakete & Hilfe bei Problemen

Was ist R?

In erster Linie…

ist R eine Programmiersprache…

…zur statisischen Datenanalyse (und zunehmend auch Machine Learning).

Genauer gesagt

  • R ist kostenlos
  • Löst seit ~2010 gängige Alternativen ab
  • Top-Notch in Analyse und grafischer Darstellung
  • Anfangs leider etwas schwierig, danach allerdings wesentlich flexibler und schneller als die Alternativen
  • Quasi endlos erweiterbar

Verbreitung in 2016

Quelle: http://r4stats.com/ (bearbeitet)
Quelle: http://r4stats.com/ (bearbeitet)

Änderungsrate von 2015 zu 2016

Quelle: http://r4stats.com/ (bearbeitet)
Quelle: http://r4stats.com/ (bearbeitet)

Aber… aber… Psychologie!

Menschen, Denken, all das…! Warum sollte ich das können?

  • Diese Statistik lässt euch die nächsten 5 Jahre nicht los
  • Es wird komplizierter werden als
    \(\bar{x} = \frac{1}{n} \sum_{i=1}^{n} {x_i}\) und \(\sigma = \frac{1}{n}\sum_{i=1}^n \sqrt{({x_i} - \bar{x})^2}\)
  • SPSS kostet viele viele Euros; niemand (erst recht nicht die Uni) möchte für schlechte Ware gutes Geld ausgeben
  • Für Psychos:
    • Ihr dürft weder Tabellen noch Grafiken aus SPSS in euren Berichten & Arbeiten benutzen
    • Die neuen Profs benutzen alle R

Aber… programmieren…? =C

Klingt schlimmer als es ist. Hauptsächlich, weil ihr schreiben statt klicken werdet.

Das heißt zu Anfang:

# Mittelwert berechnen:
mean(x)

# Median:
median(x)

# Standardabweichung:
sd(x)

Voodoo

…und später dann:

mtcars %>%
  mutate(am = factor(am, levels = c(0, 1), labels = c("Automatik", "Manuell")),
         consumption = 235 / mpg) %>%
  ggplot(data = ., aes(x = hp, y = consumption, color = am)) +
  geom_smooth(aes(group = 1), method = lm, se = F, color = "gray") +
  geom_point(size = 3, alpha = .7) +
  scale_color_brewer(palette = "Set1") +
  labs(title = "Kraftstoffverbrauch",
       subtitle = "Verbrauch verschiedene PKW nach Leistung und Schaltung",
       x = "Leistung (PS)", y = "Verbrauch (L/100km)", color = "Schaltung")

… Aber Schön

“Motivier doch mal mit Beispielen”

Man könnte ja…

But then…

There came SCIIEEENCE!

Installation

Vorbereitung

Siehe auch:
https://r-intro.tadaa-data.de/book/installation.html

  • Windows-Leute: ANTIVIRUS DEAKTIVIEREN!

Schritt 1: R selbst

https://cran.r-project.org/

Je nach Betriebssystem sieht’s anders aus

für Windows:


für Mac:

Schritt 2: RStudio

Die Basisinstallation von R ist notwendig, benutzen werden wir allerdings die Software RStudio.

Muss aber natürlich auch erst installiert werden.

Zurück ins Internet!

https://www.rstudio.com/

“Download RStudio” \(\rightarrow\) “FREE License” (ganz links)


Gleiches Spiel: Betriebssysteme

Remember…

Wir arbeiten nicht mit base R


…sondern mit RStudio:

Sobald ihr das richtige Icon gelöscht und RStudio über das andere geöffnet habt, geht es in die Übung!

Doch zuerst:
Kurze Installationspause!

Für später:

Die Datensätze: https://data.tadaa-data.de