Ein Gärtner besitzt zwei Sorten von Tomatensamen. Es ist bekannt, dass Sorte A eine Keimwahrscheinlichkeit von \(70\,\%\) hat, während Sorte B eine Keimwahrscheinlichkeit von \(30\,\%\) aufweist. Die Beschriftung der Samentüten ist verloren gegangen. Um die Sorte zu bestimmen, sät der Gärtner \(40\) Samen einer Tüte aus. Gehe davon aus, dass die Keimung der einzelnen Samen voneinander unabhängig ist.
a) Berechne für beide Sorten jeweils die Wahrscheinlichkeit dafür, dass mehr als die Hälfte bzw. weniger als die Hälfte der ausgesäten Samen keimen.
b) Der Gärtner legt eine Entscheidungsregel fest: Er entscheidet sich für Sorte A, wenn mindestens \(k\) Samen keimen. Bestimme den kleinstmöglichen Wert für \(k\) so, dass die Wahrscheinlichkeit, Sorte B fälschlicherweise für Sorte A zu halten, höchstens \(5\,\%\) beträgt.
c) Wie groß ist bei der in Teilaufgabe b) ermittelten Regel die Wahrscheinlichkeit, dass Sorte A fälschlicherweise als Sorte B eingestuft wird?
d) Erläutere, warum es in dieser Situation (Wahl zwischen zwei gleichwertigen Alternativen) problematisch sein kann, eine der beiden Sorten als Nullhypothese zu bevorzugen.
Denkanstöße
- Überlege dir, welche Verteilung hier vorliegt und welche Parameter \(n\) und \(p\) jeweils gegeben sind.
- Was bedeutet „mehr als die Hälfte“ bei 40 Samen mathematisch für die Zufallsgröße?
- Denke bei der Entscheidungsregel daran, welche Sorte fälschlicherweise angenommen wird und welche Wahrscheinlichkeit daher für die Berechnung von \(k\) relevant ist.
- Was passiert mit der Irrtumswahrscheinlichkeit, wenn du die Grenze \(k\) verschiebst?
- Erinnere dich an den Unterschied zwischen einem Signifikanztest und einer einfachen Wahl zwischen zwei Hypothesen.
Lösung
1. Berechnung für Teilaufgabe a): Sei \(X\) die Anzahl der keimenden Samen. Es gilt \(n = 40\).
Für Sorte A (\(p = 0{,}7\)):
\(P(X > 20) = 1 - P(X \le 20) \approx 1 - 0{,}0063 = 0{,}9937\)
\(P(X < 20) = P(X \le 19) \approx 0{,}0024\)
Für Sorte B (\(p = 0{,}3\)):
\(P(X > 20) = 1 - P(X \le 20) \approx 1 - 0{,}9976 = 0{,}0024\)
\(P(X < 20) = P(X \le 19) \approx 0{,}9937\)
2. Bestimmung von \(k\) für Teilaufgabe b): Gesucht ist das kleinste \(k\), sodass unter der Annahme von Sorte B (\(p = 0{,}3\)) gilt: \(P(X \ge k) \le 0{,}05\).
Dies ist äquivalent zu \(1 - P(X \le k-1) \le 0{,}05\) bzw. \(P(X \le k-1) \ge 0{,}95\).
Laut Tabelle der Binomialverteilung für \(n = 40, p = 0{,}3\) ist \(P(X \le 16) \approx 0{,}9367\) und \(P(X \le 17) \approx 0{,}9680\).
Somit muss \(k-1 = 17\) gelten, woraus \(k = 18\) folgt.
3. Berechnung für Teilaufgabe c): Ein Fehler unter Sorte A tritt auf, wenn \(X < 18\).
\(P(X \le 17)\) für \(p = 0{,}7\):
\(P(X \le 17) \approx 0{,}000275\).
4. Begründung für Teilaufgabe d): Die Wahl einer Nullhypothese bewirkt im statistischen Test eine Asymmetrie, da die Wahrscheinlichkeit für den Fehler 1. Art (\(\alpha\)) kontrolliert und klein gehalten wird, während der Fehler 2. Art (\(\beta\)) meist nicht direkt kontrolliert wird. Da hier beide Sorten „gleichberechtigt“ nebeneinanderstehen und keine Sorte als Standard oder gesicherte Annahme (Status Quo) fungiert, ist die einseitige Festlegung einer Nullhypothese willkürlich und benachteiligt eine der beiden Fehlentscheidungen.
Antwort
a) Sorte A: \(P(X > 20) \approx 99{,}37\,\%\), \(P(X < 20) \approx 0{,}24\,\%\). Sorte B: \(P(X > 20) \approx 0{,}24\,\%\), \(P(X < 20) \approx 99{,}37\,\%\).
b) Der kleinstmögliche Wert ist \(k = 18\).
c) Die Wahrscheinlichkeit beträgt ca. \(0{,}0275\,\%\).
d) Ein Signifikanztest schützt die Nullhypothese einseitig. Da hier beide Fälle symmetrisch sind, ist die Priorisierung einer Sorte als \(H_0\) ohne sachlichen Grund willkürlich.