-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy path02_daten.R
45 lines (31 loc) · 1.17 KB
/
02_daten.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
# Richtige Daten ----
# Der ngo-Datensatz liegt im Ordner "data" als .rds-Datei, einmal einlesen...
ngo <- readRDS("data/ngo.rds")
# Und die ersten paar Zeilen anzeigen
head(ngo)
# Umgang mit Daten ----
# das Objekt ngo ist jetzt ein "data.frame" - Jede Spalte ist ein Vektor, so wie vorher
# Auf einzelne Spalten greifen wir so zu:
ngo$stunzahl
# Das sind jetzt alle Werte der Spalte stunzahl ("Stunden pro Woche")
# Damit können wir wieder Statistiken berechnen...
mean(ngo$stunzahl)
# Oder Häufigkeitstabellen:
table(ngo$jahrgang)
# In Jahrgang 11: 100 Leute, in 12: 100, in 13: 50
# Oder relative Häufigkeiten?
# Häufigkeitstabelle speichern als "tabelle"...
tabelle <- table(ngo$jahrgang)
# ... und dann in prop.table() stecken:
prop.table(tabelle)
# Was, wenn wir filtern wollen? z.B alle weiblichen Schüler?
ngo_w <- subset(ngo, geschl == "Weiblich")
head(ngo_w)
# Das sind jetzt nur noch weibliche Schüler
# Dasselbe für männliche
ngo_m <- subset(ngo, geschl == "Männlich")
# So können wir zB einfach Gruppen Vergleichen
mean(ngo_m$leistung)
mean(ngo_w$leistung)
# Oder einfacher, wenn auch etwas schwieriger nachzuvollziehen:
tapply(ngo$leistung, ngo$geschl, mean)