Sommerkurs Statistik

Übungen

Author

Alexander Hirner

Übungen

Grundlagen, Notation, beschreibende Statistik, Lineartransformationen

  1. Thema: Übungen zur Summen- und Produktnotation. Gegeben ist folgende Datenmatrix mit n=5 Beobachtungen und k=2 Variablen:
\(X_{i, \,1}\) \(X_{i, \, 2}\)
\(X_{1, \, j}\) 20 2200
\(X_{2, \, j}\) 30 2400
\(X_{3, \, j}\) 55 3640
\(X_{4, \, j}\) 19 1700
\(X_{5, \, j}\) 40 4800

Berechnen Sie (vereinfachen Sie ggfs. vor der Berechnung):

    1. \(\displaystyle \sum_{i=1}^{5} x_{i, \, 1}=\)
    1. \(\displaystyle\sum_{i=1}^{2} x_{i , \, 1} \cdot x_{i, \, 2}=\)
    1. \(\displaystyle\sum_{i=1}^{4} 2 \cdot x_{i, \, 1}=\)
    1. \(\displaystyle\frac{1}{4}\sum_{i=1}^{4} x_{i, \, 1}=\)
    1. \(\displaystyle \sum_{i=1}^{5}\sum_{j=1}^{2} x_{i, \, j} =\)
    1. \(\displaystyle \prod_{i=1}^{3} x_{i,\, 2} =\)
    1. Erklären Sie mit eigenen Worten die Bedeutung der errechneten Kennzahl aus Aufgabe d.
Lösung
# a)
20+30+55+19+40
[1] 164
# b)
20*2200 + 30*2400
[1] 116000
# c)
2 * (20 + 30 + 55 + 19)
[1] 248
# d)
1/4 * (20 + 30 + 55 + 19)
[1] 31
# e)
20+2200+30+2400+55+3640+19+1700+40*4800
[1] 202064
# f)
2200*2400*3640
[1] 19219200000
# g)
# arithmetisches Mittel der ersten vier Beobachtungen
  1. Thema: Deskriptivstatistik. Als Qualitätssicherungsbeauftragter kontrollieren Sie die Länge von n=16 Schrauben und erhalten folgende Ergebnisse:

    Messwerte (in mm): 21, 20, 18, 20, 18, 20, 19, 19, 20, 21, 20, 21, 20, 20, 20, 21.

    Erstellen Sie eine Tabelle mit den absoluten (\(f_j\)), relativen (\(r_j\)) und kumulativen relativen Häufigkeiten (\(r_j^+\)).

screws <- c(21, 20, 18, 20, 18, 20, 19, 19, 20, 21, 20, 21, 20, 20, 20, 21)
summarytools::freq(screws, report.nas=FALSE)
Frequencies  
screws  
Type: Numeric  

              Freq        %   % Cum.
----------- ------ -------- --------
         18      2    12.50    12.50
         19      2    12.50    25.00
         20      8    50.00    75.00
         21      4    25.00   100.00
      Total     16   100.00   100.00
  1. Thema: Maße der zentralen Tendenz. Verwenden Sie die Daten aus Aufgabe 2 und berechnen Sie (auf alle drei äquivalenten Arten) das arithmetische Mittel.
Lösung
screws <- c(21, 20, 18, 20, 18, 20, 19, 19, 20, 21, 20, 21, 20, 20, 20, 21)
mean(screws)
[1] 19.875
  • Mit den Rohdaten: \(\displaystyle \frac{1}{n} \sum_{i=1}^n x_i = \frac{1}{16} \cdot (21 + 20 + 18 + \cdots + 21) = 19.875\)
  • Mit den absoluten Häufigkeiten: \(\displaystyle \frac{1}{n} \sum_{i=j}^k f_j \cdot x_j = \frac{1}{16} \cdot (2 \cdot 18 + 2 \cdot 19 + 8 \cdot 20 + 4 \cdot 21)=19.875\)
  • Mit den relativen Häufigkeiten: \(\displaystyle \sum_{i=j}^k r_j \cdot x_j = 0.125 \cdot 18 + 0.125 \cdot 19 + 0.5 \cdot 20 + 0.25 \cdot 21 =19.875\)
  1. Thema: Boxplot. Bestimmen Sie für die Daten aus Aufgabe 2 Minimum und Maximum, das erste und dritte Quartil sowie den Median und erstellen Sie damit ein Boxplot. Hinweis: Die errechneten Kennzahlen sind bekannt als Tukey’s Five-number summary nach dem Statistiker John W. Tukey (1915-2000).
summary(screws)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  18.00   19.75   20.00   19.88   20.25   21.00 
boxplot(screws, horizontal=TRUE)

  1. Thema: Geometrisches Mittel. Ein Guthaben wird im ersten Jahr zu 2%, im zweiten Jahr zu 3% und im dritten Jahr wieder zu 2% verzinst. Berechnen Sie das geometrische Mittel (gleichwertige Fragestellung: Welcher konstante Zinssatz p (in Prozent) hätte den selben Endwert ergeben?)
Lösung
xg <- (1.02 * 1.03 * 1.02)^(1/3)
zinsen <- (xg-1)*100

cat("Geom. Mittel: ", xg, " das entspricht folgendem jährlichen Zinssatz: ", zinsen, "% p. A.", sep="")
Geom. Mittel: 1.023322 das entspricht folgendem jährlichen Zinssatz: 2.33225% p. A.

Wiederholung Kombinatorik und einfache Wahrscheinlichkeitsrechnung

  1. Thema: Kombinatorik. Bei einem Test zum Thema Allgemeinbildung in einem Assessment-Center sind 10 Aufgaben zu lösen, wobei mindestens 7 gelöst werden müssen um den Test zu bestehen. Auf wie viele verschiedene Arten kann diese Minimalforderung (genau 7 wurden gelöst) realisiert werden?
Lösung

\(\binom{10}{7}\)

cat(choose(10,7), "Möglichkeiten")
120 Möglichkeiten
  1. Thema: Kombinatorik. Aus 15 Hobbysportlern sollen für ein Vereinsfest drei ausgewählt werden (die dann “gleichberechtigt” beim Getränkeauschank mithelfen). Wie viele Möglichkeiten gibt es hier?
Lösung

\(\binom{15}{3}\)

cat(choose(15,3), "Möglichkeiten")
455 Möglichkeiten
  1. Thema: Kombinatorik. Leider haben Sie (als Datenbankadministrator der Kundendatenbank Ihrer Firma) das Passwort vergessen. Sie erinnern sich allerdings noch, dass es aus 12 Zeichen bestand, davon vier mal dem Buchstaben “X”, sieben mal dem Rufzeichen (“!”) sowie der Ziffer 7. Wie viele Möglichkeiten der Eingabe benötigen Sie hier “schlimmstenfalls” (vorausgesetzt, das DBMS erlaubt Ihnen eine entsprechend hohe Anzahl an Fehlversuchen)?
Lösung

\(\frac{12!}{4! \cdot 7! \cdot 1!}\)

x <- factorial(12)/(factorial(4)*factorial(7)*factorial(1))
cat(x, "verschiedene Passwörter")
3960 verschiedene Passwörter
  1. Thema: Kombinatorik. Weisen Sie die Eigenschaften des Binomialkoeffizienten auf Seite 4 im zweiten Foliensatz (Teil_02.pdf) nach (Hinweis: Einsetzen und Vereinfachen).
Lösung

\(\binom{a}{b} = \frac{a!}{b! \cdot (a-b)!}\)

Aufgabe 1)

zu zeigen: \(\binom{n}{0} = 1\). Setze a=n, b=0.

\(\binom{n}{0} = \frac{n!}{0! \cdot (n-0)!} = \frac{\not{n!}}{\not{n!}} = 1\) (Hinweis: 0! = 1)

Aufgabe 2)

zu zeigen: \(\binom{n}{n} = 1\). Setze a=n, b=n.

\(\binom{n}{n} = \frac{n!}{n! \cdot (n-n)!} = \frac{\not{n!}}{\not{n!}} = 1\) (Hinweis: 0! = 1)

Aufgabe 3)

zu zeigen: \(\binom{n}{k} = \binom{n}{n-k}\).

linke Seite: \(\binom{n}{k} = \frac{n!}{k! (n-k)!}\) (nach Definition!)

rechte Seite: \(\binom{n}{n-k} = \frac{n!}{(n-k)! (n - (n-k))!} = \frac{n!}{(n-k)! (\not{n} -\not{n}+k))!} = \frac{n!}{k! (n-k)!}\)

Also “linke Seite = rechte Seite”.

  1. Thema: Wahrscheinlichkeitsrechnung. Drei Fachleute versuchen unabhängig voneinander ein gewisses IT-Problem zu lösen. Das Problem wird gelöst, wenn mindestens einer der drei die Lösung findet. Die Lösungswahrscheinlichkeiten betragen jeweils 70%, 45% sowie 60%. Mit welcher Wahrscheinlichkeit wird das Problem gelöst? Hinweis: Baumdiagramm, Gegenwahrscheinlichkeit.
Lösung
wskt <- 1 - 0.3*0.55*0.4
cat("Lösungswahrscheinlichkeit:", wskt)
Lösungswahrscheinlichkeit: 0.934
  1. Thema: Wahrscheinlichkeitsrechnung. Sie bereiten sich auf eine Prüfung in Arbeitsrecht vor. Es gibt einen Katalog mit 25 Prüfungsfragen, von welchen Sie 21 vorbereitet haben. Bei der Prüfung werden aus dem Fragenkatalog zwei Fragen (natürlich ohne Zurücklegen) gezogen. Mit welcher Wahrscheinlichkeit…
      1. schaffen Sie die Prüfung mit Auszeichnung, weil beide gezogenen Fragen von Ihnen vorbereitete Fragen waren?
      1. bestehen Sie die Prüfung gerade noch, weil sie eine vorbereitete und eine nicht vorbereitete Frage ziehen?
      1. fallen Sie durch, da unglücklicherweise beide gezogenen Fragen von Ihnen nicht vorbereitet wurden?
Lösung

Hinweis: Zeichne ein Baumdiagramm!

# ad a)
21/25 * 20/24
[1] 0.7
# ad b)
21/25 * 4/24 + 4/25 * 21/24
[1] 0.28
# ad c) 
4/25 * 3/24 
[1] 0.02

Satz von Bayes, totale Wahrscheinlichkeit

  1. Thema: Bayes, totale Wskt. Ihr Unternehmen stellt Alarmanlagen her. Diese sind so empfindlich, dass sie bei einem Einbruch mit einer Wahrscheinlichkeit von 99% Alarm geben. Andere Ereignisse (Erschütterungen, eindringende Tiere) lösen mit 0,5% einen Fehlalarm aus. Die Wahrscheinlichkeit für einen Einbruch in einem gegebenen Zeitraum betrage 10%. Wie groß ist die Wahrscheinlichkeit, dass es sich bei einem Alarm um keinen Fehlalarm handelt?
Lösung

A… Alarm

Ereignis \(B_j\) \(P(B_j)\) Alarm \(P(A|B_j)\)
Einbruch \(B_1\) 0.1 0.99
kein Einbruch \(B_2\) 0.9 0.005

\(P(A) = 0.1 \cdot 0.99 + 0.9 \cdot 0.005\)

0.1*0.99 + 0.9*0.005
[1] 0.1035

\(P(B_1|A) = \frac{0.1 \cdot 0.99}{0.1 \cdot 0.99 + 0.9 \cdot 0.005}\)

0.1*0.99/(0.1*0.99 + 0.9*0.005)
[1] 0.9565217
  1. Thema: Bayes, totale Wskt. In einem Betrieb werden Milchflaschen von vier Maschinen (\(M_1\), \(M_2\), \(M_3\) und \(M_4\)) befüllt. Der Anteil der Gesamtproduktion beträgt 10%, 20%, 30% sowie 40% für die Maschinen 1 bis 4. Die Fehlerquoten (Füllmenge einer Milchflasche wird unterschritten) beträgt jeweils 2%, 1%, 4% sowie 2%. Als Qualitätssicherungsbeauftrager ziehen Sie zufällig eine Milchflasche. - Mit welcher Wahrscheinlichkeit wird die Füllmenge unterschritten? - Vorausgesetzt, die Füllmenge wurde unterschritten - mit welcher Wahrscheinlichkeit wurde diese Flasche von Maschine \(M_3\) befüllt?
Lösung

A… Füllmenge unterschritten

Maschine \(B_j\) \(P(B_j)\) Alarm \(P(A|B_j)\)
\(M_1\) 0.1 0.02
\(M_2\) 0.2 0.01
\(M_3\) 0.3 0.04
\(M_4\) 0.4 0.02
0.1 * 0.02 + 0.2 * 0.01 + 0.3 * 0.04 + 0.4 * 0.02
[1] 0.024

\(P(A)= 0.1 \cdot 0.02 + 0.2 \cdot 0.01 + 0.3 \cdot 0.04 + 0.4 \cdot 0.02 = 0.024\)

0.3 * 0.04/(0.1 * 0.02 + 0.2 * 0.01 + 0.3 * 0.04 + 0.4 * 0.02)
[1] 0.5

\(P(B_3|A) = \frac{0.3 \cdot 0.04}{0.1 \cdot 0.02 + 0.2 \cdot 0.01 + 0.3 \cdot 0.04 + 0.4 \cdot 0.02} = 0.5\)

  1. Thema: Bayes, totale Wskt. An insurance company believes that people can be divided into two classes: those who are accident prone and those who are not. The company’s statistics show that an accident-prone person will have an accident at some time within a fixed 1-year period with probability 0.4, whereas this probability decreases to 0.2 for a person who is not accident prone. If we assume that 30 percent of the population is accident prone, what is the probability that a new policyholder will have an accident within a year of purchasing a policy? (Aus: Sheldon Ross: A First Course in Probability, 8. Aufl., Pearson, Upper Saddle River 2010.; Seite 66.)
Lösung

U … Unfall

Ereignis \(B_j\) \(P(B_j)\) Unfall \(P(U|B_j)\)
accident prone \(B_1\) 0.3 0.4
not accicent prone \(B_2\) 0.7 0.2
0.3*0.4 + 0.7*0.2
[1] 0.26

Binomialverteilung und Hypergeometrische Verteilung

  1. Thema: Binomialverteilung Bei einer Produktpräsentation bei einem Messestand gibt es die Möglichkeit, Preise zu gewinnen. Jeder Kunde darf fünf mal an einem Glücksrad drehen. Das Glücksrad ist in fünf gleich große Sektoren aufgteteilt, wobei genau ein Sektor gewinnt (die anderen zählen als “Nieten”). Wir bezeichnen mit X die Anzahl der Gewinne eines Kunden bei den fünf Durchgängen.

    • Was ist hier \(\Omega_X\), also der Ereignisraum für X (welche Werte kann X theoretisch annehmen)?
    • Welcher Verteilung folgt die Zufallsvariable X und warum?
    • Berechne die Wahrscheinlichkeit, dass ein Kunde…
      • genau einen Gewinn erzielt
      • maximal einen Gewinn erzielt
      • nicht mehr als zwei Gewinne erzielt.
Lösung
  • \(\Omega_X = \{0, 1, 2, 3, 4, 5\}\)
  • Binomialverteilung; n=5 unabhängige Experimente mit je zwei Ausgängen (Gewinn und Niete), Gewinnwahrscheinlichkeit immer gleich (20%).
  • Wahrscheinlichkeiten
    • \(P(X=1) = \binom{5}{1} \cdot 0.2^1 \cdot 0.8^4=40.96\%\)
    • \(P(X\leq 1) = \binom{5}{0} \cdot 0.2^0 \cdot 0.8^5 + \binom{5}{1} \cdot 0.2^1 \cdot 0.8^4 =73.728\%\)
    • \(P(X\leq 2) = \binom{5}{0} \cdot 0.2^0 \cdot 0.8^5 + \binom{5}{1} \cdot 0.2^1 \cdot 0.8^4 + \binom{5}{2} \cdot 0.2^2 \cdot 0.8^3 =94.208\%\)
dbinom(x=1, size=5, p=0.2)
[1] 0.4096
dbinom(x=0, size=5, p=0.2) + dbinom(x=1, size=5, p=0.2)
[1] 0.73728
dbinom(x=0, size=5, p=0.2) + dbinom(x=1, size=5, p=0.2) + dbinom(x=2, size=5, p=0.2)
[1] 0.94208
  1. Thema: Hypergeom. Verteilung Als Qualitätssicherungsbeauftragter untersuchen Sie eine Produktionsmenge von 20 Transistoren. Von diesen 20 Transistoren sind 3 defekt. Sie entnehmen der Stichprobe 4 Transistoren (ohne Zurücklegen). Mit welcher Wahrscheinlichkeit ist darin
    1. genau ein defekter Transistor?
    2. nicht mehr als ein defekter Transistor?
Lösung
    1. \(\frac{\binom{3}{1} \cdot \binom{17}{3}}{\binom{20}{4}} \approx 42.1\%\)
    1. \(\frac{\binom{3}{0} \cdot \binom{17}{4}}{\binom{20}{4}} + \frac{\binom{3}{1} \cdot \binom{17}{3}}{\binom{20}{4}}\approx 91.23\%\)
  1. Thema: Binomialverteilung Eine Maschine füllt Milchflaschen ab. Die Wahrscheinlichkeit, dass hierbei eine Milchflasche zu Bruch geht, beträgt für jede Flasche konstant 1%. Wie groß ist die Wahrscheinlichkeit, dass bei 20 abgefüllten Flaschen
    1. keine zu Bruch geht
    1. mehr als zwei zu Bruch gehen?
Lösung

Aufgabe a)

\(P(X=0) = \binom{20}{0} \cdot 0.01^0 \cdot 0.99^{20}=81.79069\%\)

dbinom(x=0, size=20, prob=0.01)
[1] 0.8179069

Aufgabe b)

\(1 - (\binom{20}{0} \cdot 0.01^0 \cdot 0.99^{20} + \binom{20}{1} \cdot 0.01^1 \cdot 0.99^{19} + \binom{20}{2} \cdot 0.01^2 \cdot 0.99^{18})= 0.1003576\%\)

1 - (dbinom(x=0, size=20, prob=0.01) + dbinom(x=1, size=20, prob=0.01) + dbinom(x=2, size=20, prob=0.01))
[1] 0.001003576

Normalverteilung

  1. Thema: Normalverteilung An expert witness in a paternity suit testifies that the length (in days) of human gestation is approximately normally distributed with parameters \(\mu\) = 270 and \(\sigma^2\) = 100. The defendant in the suit is able to prove that he was out of the country during a period that began 290 days before the birth of the child and ended 240 days before the birth. If the defendant was, in fact, the father of the child, what is the probability that the mother could have had the very long or very short gestation indicated by the testimony? (Aus: Sheldon Ross: A First Course in Probability, 8. Aufl., Pearson, Upper Saddle River 2010.; Seite 203.)
Lösung

Berechne \(P(X > 290) + P(X < 240)\)

pnorm(290, mean=270, sd=10, lower.tail=FALSE) + pnorm(240, mean=270, sd=10, lower.tail=TRUE)
[1] 0.02410003

also etwa 2.41%.

  1. Thema: Normalverteilung Fruchtsaft wird von einer Maschine so abgefüllt, dass der Erwartungswert der Füllmenge \(\mu = 101\) cl beträgt bei \(\sigma = 0.5\) cl. Mit welcher Wahrscheinlichkeit befindet sich in einer Packung weniger als 1 Liter?
Lösung

Transformation \(\displaystyle z=\frac{100-101}{0.5} = -2\) Wahrscheinlichkeit laut Tabelle: 2.28%.

pnorm(100, mean=101, sd=0.5, lower.tail=TRUE)
[1] 0.02275013
  1. Thema: Normalverteilung Bei der Herstellung von Nägeln treten naturgemäß Abweichungen auf. Die Länge der Nägel (X) ist normalverteilt mit \(\mu=80\) mm und \(\sigma\) = 4 mm, d.h. \(X \sim N(80, 4)\). Mit welcher Wahrscheinlichkeit ist ein Nagel
      1. kürzer als 78 mm?
      1. länger als 85 mm?
      1. zwischen 80 und 85 mm?
Lösung

Aufgabe a)

Transformation \(\displaystyle z=\frac{78-80}{4} = -0.5\) Wahrscheinlichkeit laut Tabelle: 30.85%.

# a)
x <- pnorm(78, mean=80, sd=4, lower.tail=TRUE)
cat("Aufgabe a: ", x*100, "%", sep="")
Aufgabe a: 30.85375%

Aufgabe b)

Transformation \(\displaystyle z=\frac{85-80}{4} = 1.25\) Wahrscheinlichkeit laut Tabelle: 89.44%, wir benötigen die Gegenwahrscheinlichkeit: 10.56%.

# b)
x <- pnorm(85, mean=80, sd=4, lower.tail=FALSE)
cat("Aufgabe b: ", x*100, "%", sep="")
Aufgabe b: 10.56498%

Aufgabe c)

Transformation \(\displaystyle z=\frac{85-80}{4} = 1.25\) Wahrscheinlichkeit laut Tabelle: 89.44%, subtrahiere noch 50%, erhalte: 39.44%.

# c)

x <- 1- 0.5 - pnorm(85, mean=80, sd=4, lower.tail=FALSE)
cat("Aufgabe c: ", x*100, "%", sep="")
Aufgabe c: 39.43502%