Sommerkurs Statistik

Zusatzübungen zur Prüfungsvorbereitung

Autor

Alexander Hirner

1 Kombinatorik und Wahrscheinlichkeit, Bayes

1.1 Aufgabe 1 💿

A musician is planning to bring out a new album and has recorded ten songs but she is contemplating about the order in which the songs should be arranged on the CD. If the total playing time for the album is 47 minutes, how long will it take her to listen to all the possible arrangements of the ten songs?

Lösung

\(10! \cdot 47 = 170553600\) Minuten

minuten <- factorial(10)*47
cat("Gesamtspieldauer: ", minuten, " Minuten", sep="")
Gesamtspieldauer: 170553600 Minuten

1.2 Aufgabe 2 🚗

Ein Fahrzeughersteller erhält die Klimaanlagen für die produzierten PKWs von drei unterschiedlichen Zulieferern. Nachfolgende Tabelle gibt für jeden Zulieferer den jeweiligen Anteil und die Anzahl defekter Klimaanlagen wieder:

Zulieferer Anteil (%) % defekte
\(Z_1\) 20% 6%
\(Z_2\) 30% 4%
\(Z_3\) 50% 9%
Summe 100%
  • Mit welcher Wahrscheinlichkeit hat ein Auto eine defekte Klimaanlage?
  • Falls die Klimaanlage defekt ist - mit welcher Wahrscheinlichkeit stammt diese von Zulieferer \(Z_2\)?
Lösung
totwskt <- 0.2*0.06 + 0.3*0.04 + 0.5*0.09
cat("P(defekte Klimaanlage): ", round(totwskt*100, 2), "%", sep="")
P(defekte Klimaanlage): 6.9%
bedwskt <-  0.3*0.04/totwskt
cat("P(Z2|defekt): ", round(bedwskt*100, 2), "%", sep="")
P(Z2|defekt): 17.39%

2 Verteilungen

2.1 Aufgabe 3 🎲

Ein fairer Würfel wird fünf Mal geworfen. Mit welcher Wahrscheinlichkeit erhalten Sie genau zwei 6er bei diesen fünf Würfen?

Lösung

\(P(X=2)=\binom{5}{2} \cdot \left( \frac{1}{6} \right)^2 \cdot \left( \frac{5}{6} \right)^3 \approx 16.8\%\)

dbinom(x=2, size=5, prob=1/6)
[1] 0.160751
# oder auch:
choose(5,2)*(1/6)^2 * (5/6)^3
[1] 0.160751

2.2 Aufgabe 4 🍕

Im Kühlregal eines Supermarkts befinden sich 20 Pizzen, von denen leider bei 5 das Mindesthaltbarkeitsdatum bereits deutlich überschritten wurde. Da Sie einen Filmabend mit Freunden planen, kaufen Sie (ohne auf das Ablaufdatum zu achten) 4 Pizzen. Berechnen Sie die Wahrscheinlichkeit, dass bei keiner der 4 gekauften Pizzen das Mindesthaltbarkeitdatum überschritten wurde.

Lösung

\(\frac{\binom{5}{0} \cdot \binom{15}{4}}{\binom{20}{4}} \approx 28.17\%\)

choose(5,0)*choose(15,4)/choose(20,4)
[1] 0.2817337

2.3 Aufgabe 5 📊

An insurance sales representative sells policies to 5 men, all of identical age and in good health. According to the actuarial tables, the probability that a man of this particular age will still be alive in 30 years is \(\frac{2}{3}\). Find the probability that in 30 years exactly 4 men will be alive.

Lösung

\(\binom{5}{4} \cdot \left( \frac{2}{3} \right)^4 \cdot \left( \frac{1}{3} \right)^1 \approx 32.92\%\)

dbinom(x=4, size=5, prob=2/3)
[1] 0.3292181

2.4 Aufgabe 6 🔩

At a hardware store, 4 out of 17 screwdrivers are of inferior quality. You purchase two screwdrivers from that store. Find the probability for one defective screwdriver.

Lösung

\(\frac{\binom{4}{1} \cdot \binom{13}{1}}{\binom{17}{2}} \approx 38.24\%\)

choose(4,1)*choose(13,1)/choose(17,2)
[1] 0.3823529

2.5 Aufgabe 7 📻

The time required to assemble an electronic device is normally distributed with a mean of 12 minutes and a standard deviation of 1.5 minutes. Find the probability (using the z-table) that a particular assembly takes…

    1. less than 14 minutes
    1. more than 8 minutes
Lösung

Aufgabe a)

\(Z = \frac{14-12}{1.5}=1.33\)

Wahrscheinlichkeit laut Tabelle 90.82%

pnorm(14, mean=12, sd=1.5, lower.tail=TRUE)
[1] 0.9087888

Aufgabe b)

\(Z = \frac{8-12}{1.5}=-2.67\)

Wahrscheinlichkeit laut Tabelle 0.38%, mit Gegenwahrscheinlichkeit also ca. 99.62%

pnorm(8, mean=12, sd=1.5, lower.tail=FALSE)
[1] 0.9961696

2.6 Aufgabe 8 🍸

Die Füllmenge X von Edelspirituosen unterliegt produktionsbedingt natürlichen Schwankungen. Diese Füllmenge sei normalverteilt mit \(\mu=51\) cl und \(\sigma=1\) cl, also \(X \sim N(51,1)\). Berechnen Sie die Wahscheinlichkeit, dass eine Füllmenge von 48.75 cl unterschritten wird.

Lösung

Aufgabe a)

\(Z = \frac{48.75-51}{1}=-2.25\)

Wahrscheinlichkeit laut Tabelle 1.22%

pnorm(48.75, mean=51, sd=1, lower.tail=TRUE)
[1] 0.01222447

2.7 Aufgabe 9 ✔️

Als Qualitätsbeauftragter für Milchprodukte in einem Supermarkt für regionale Spezialitäten wissen Sie, dass von 20 Bechern mit Fruchtjoghurt 4 bereits abgelaufen sind. Da ein unsympathischer Kunde den Markt betritt, entsorgen Sie die abgelaufenen Becher nicht. Wie groß ist die Wahrscheinlichkeit, dass genau zwei abgelaufene Joghurts dabei sind falls der Kunde 3 Becher kauft.

Lösung

\(\frac{\binom{4}{2} \cdot \binom{16}{1}}{\binom{20}{3}} \approx 8.42\%\)

choose(4,2)*choose(16,1)/choose(20,3)
[1] 0.08421053

3 Statistisches Testen (Binomialtest, \(\chi^2\)-Test)

3.1 Aufgabe 10 🏭

Von einer Maschine werden 75% der erzeugten Bauteile von der Qualitätskontrolle akzeptiert. Eine Änderung des Produktionsprozesses (in der Hoffnung, diese Rate zu erhöhen) liefert nun in einer Stichprobe von 30 Bauteilen 28 ohne Beanstandung der Qualität. Handelt es sich hierbei um eine signifikante Verbesserung? Testen Sie die Hypothese bei \(\alpha\) = 5% mit einem Binomialtest. Entscheiden Sie sich für oder gegen die Änderung des Produktionsprozesses?

Lösung
binom.test(x=28, n=30, p=0.75, alternative="greater")

    Exact binomial test

data:  28 and 30
number of successes = 28, number of trials = 30, p-value = 0.0106
alternative hypothesis: true probability of success is greater than 0.75
95 percent confidence interval:
 0.804674 1.000000
sample estimates:
probability of success 
             0.9333333 

\(H_0\) wird verworfen, die Maschine sollte angeschafft werden.

Händisch: Berechne die Wahrscheinlichkeit für 28 oder mehr “Treffer” unter Annahme der 75%igen “Erfolgswahrscheinlichkeit” - das ist genau der p-Wert.

p28 <- choose(30, 28) * 0.75^28 * 0.25^2
p29 <- choose(30, 29) * 0.75^29 * 0.25^1
p30 <- choose(30, 30) * 0.75^30 * 0.25^0

p28+p29+p30
[1] 0.01059587

3.2 Aufgabe 11 🛀

Sie beraten einen Hersteller von Seifenprodukten bei der Wahl eines ansprechenden Verpackungsdesigns. Sie bieten alle drei Designs in einem Drogeriefachhandel an. Der Hersteller beschäftigt sich mit der Frage, ob die Farbe der Verpackung Auswirkungen auf die Verkaufszahlen hat. Hierzu prüfen Sie die Hypothese, dass alle Farben gleich beliebt sind (\(\alpha=5\%\)). Nach der Einführungsphase erhalten Sie die Tabelle mit folgenden Verkaufszahlen:

anzahl <- c(116, 83, 101)
names(anzahl) <- c("weiß", "beige", "zitronengelb")
print(anzahl)
        weiß        beige zitronengelb 
         116           83          101 
chisq.test(anzahl, p=c(1/3, 1/3, 1/3), correct=F)

    Chi-squared test for given probabilities

data:  anzahl
X-squared = 5.46, df = 2, p-value = 0.06522
  • Formulieren Sie die Null- sowie die Alternativhypothese.
  • Zu welcher finalen Testentscheidung kommen Sie? (\(H_0\) beibehalten oder verwerfen?)
  • Beschreiben Sie kurz, wie Sie ohne Softwareeinsatz vorgehen würden, nachdem Sie den \(\chi^2\)-Wert von 6.1266 errechnet haben.
Lösung
  • \(H_0\): Die Verpackungsdesigns sind gleich beliebt, \(H_1\): Die Verpackungsdesigns sind nicht gleich beliebt.
  • Nullhypothese \(\alpha=5\%\) kann hier (knapp) nicht verworfen werden.
  • Berechne die Teststatistik \(\chi^2 = \frac{(116-100)^2}{100} + \frac{(83-100)^2}{100} + \frac{(101-100)^2}{100}=5.46\). Kritischer Wert der Tabelle (bei \(\alpha=5\%\) und df=2) = 5.991
  • Entscheidung: Verwirf \(H_0\) nicht, da der kritische Wert nicht überschritten wird.

3.3 Aufgabe 12 🎁

Sie beraten ein Unternehmen im Waldviertel, welches Mohnspezialitäten herstellt und diese in Geschenkboxen als Mitbringsel für Touristen verkauft. Sie wollen wissen, ob unterschiedliche Verpackungsdesigns bei den Touristen unterschiedlich beliebt sind. Folgende Designs werden angeboten: A: Geschenkkorb, B: Geschenkbox aus Fichtenholz, C: Plastikbox, D: Jutesäckchen).

Sie erhalten folgende Daten (Verkaufszahlen nach einer Woche):

Design Design A Design B Design C Design D
Stück verkauft 110 115 75 100

Testen Sie die Nullhypothese “alle Designs sind gleich beliebt” bei \(\alpha=\) 5%.

Lösung
  • \(H_0\): Die Verpackungsdesigns sind gleich beliebt, \(H_1\): Die Verpackungsdesigns sind nicht gleich beliebt.
  • Berechne die Teststatistik \(\chi^2 = \frac{(110-100)^2}{100} + \frac{(115-100)^2}{100} + \frac{(75-100)^2}{100} + \frac{(100-100)^2}{100}=9.5\)
x <- c(110, 115, 75, 100)
names(x) <- c("A", "B","C","D")
x
  A   B   C   D 
110 115  75 100 
chisq.test(x, p=rep(0.25, 4), correct=FALSE)

    Chi-squared test for given probabilities

data:  x
X-squared = 9.5, df = 3, p-value = 0.02333

Entscheidung: Verwirf \(H_0\). (Bei händischer Rechnung: Weil der kritische Wert von 7.815 (Tabelle, df=3, \(\alpha=5\%\) überschritten wird).

4 Lineare Regression, Korrelation

4.1 Aufgabe 13 📊

Versuchen Sie bei einigen Durchgängen, die Korrelation zu erraten:

Guess the Correlation