Einführung
Wiedergabe stellt eine Verbindung zu YouTube her.
Die eingehenden Emails in unserem Konto werden durch einen Spamfilter vorsortiert.
Bedingte Wahrscheinlichkeiten sind uns bei der Betrachtung von Baumdiagrammen schon begegnet, wir haben sie dort nur noch nicht so genannt. Wir führen sie hier aber dennoch ganz von vorne und Schritt für Schritt ein.
Neben Baumdiagrammen sind Vierfeldertafeln eine weitere Möglichkeit, Daten übersichtlich darzustellen. Als Beispiel sehen wir uns die Verteilung der Schülerinnen und Schüler einer Stufe in den Mathe-GKs dem LK an:
Wir sehen hier, dass in den GKs insgesamt Schülerinnen und Schüler sind. Im LK sind es Schülerinnen und Schüler.
Das („Sigma“) ist das Zeichen für „Summe“. In der entsprechenden Zeile bzw. Spalte steht also jeweils die Gesamtzahl.
In dieser ersten Vierfeldertafel haben wir die absoluten Anzahlen betrachtet. Stattdessen kann man aber auch die relativen Anzahlen oder auch Anteile betrachten:
So die bei den relativen Häufigkeiten erhalten wir sie, indem wir einfach die Anzahlen durch die Gesamtzahl (in diesem Fall ) teilen.
Es bietet sich nun an, diese Zahlen in einem Baumdiagramm darzustellen:
Machen wir uns noch einmal klar, welche Bedeutungen die Zahlen im Diagramm haben. Wir können sie einerseits als relative Häufigkeiten interpretieren aber andererseits auch als Wahrscheinlichkeiten.
Wählen wir zufällig eine Person aus dieser Stufe aus, dann ist die mit einer Wahrscheinlichkeit von in einem Mathe-GK und mit einer Wahrscheinlichkeit von im Mathe-LK:
Die Zahlen ganz rechts können wir so interpretieren:
D.h. zum Beispiel, dass unsere zufällig gewählte Person mit einer Wahrscheinlichkeit von weiblich und in einem GK ist.
In unserem Diagramm fehlen allerdings noch ein paar Zahlen. Die Beschriftungen der 2. Stufe fehlen, da wir die zugehörigen Werte nicht im der Vierfeldertafel vorfinden.
Diese fehlen Zahlen lassen sich aber recht leicht berechnen. Wir müssen lediglich die Wahrscheinlichkeit ganz rechts (z.B. ) durch die Wahrscheinlichkeit der 1. Stufe (z.B. ) teilen:
Diese von uns ergänzten Zahlen sind Beispiele für bedingte Wahrscheinlichkeiten. Warum man sie so nennt, wird uns klar, wenn wir uns deren Bedeutung bewusst machen.
Wenn wir nur aus den Schülerinnen und Schülern der GKs zufällig einen wählen, dann ist dieser mit einer Wahrscheinlichkeit von weiblich und mit einer Wahrscheinlichkeit von männlich.
Wenn wir hingegen nur aus den Schülerinnen und Schülern des LK zufällig einen wählen, dann ist dieser mit einer Wahrscheinlichkeit von weiblich und mit einer Wahrscheinlichkeit von männlich.
Dass wir diese unterschiedlichen Gruppen betrachten, schreiben wir so:
Die Bedingung, dass wir nur die GKs oder nur den LK betrachten, schreiben wir klein direkt unten an das .
Umgekehrte Baumdiagramme
Wiedergabe stellt eine Verbindung zu YouTube her.
In unserem Baumdiagramm von oben haben wir in der 1. Stufe zwischen männlich und weiblich unterschieden und in der 2. Stufe zwischen GK und LK. Wir hätten aber ebenso diese beiden Merkmale in umgekehrter Reihenfolge betrachten können:
Die Anteile von männlichen und weiblichen Schülern und die Zahlen ganz rechts entnehmen wir wieder sofort der Vierfeldertafel. Die vier bedingten Wahrscheinlichkeiten
berechnen wir anschließend wieder, indem wir die Zahl ganz rechts durch die in der 1. Stufe teilen.
Stellen wir noch einmal das erste Baumdiagramm und das umgekehrte Baumdiagramm gegenüber:
Beide Baumdiagramme enthalten zwar dieselben Informationen, allerdings sind die bedingten Wahrscheinlichkeiten, die man unmittelbar ablesen kann, verschieden. Daher ist es in vielen Situationen wichtig, zunächst zu überlegen, welches der beiden Diagramme man anfertigen sollte.
Möchten wir aus einem Baumdiagramm das umgekehrte erstellen, kann es hilfreich sein, als Zwischenschritt eine Vierfeldertafel anzufertigen (falls diese nicht ohnehin schon vorliegt). Möchten wir diesen Schritt vermeiden, können wir die Zahlen ganz rechts einfach übernehmen, wobei wir aufpassen müssen, welcher Wert zu welchem Pfad gehört. Die Wahrscheinlichkeiten der 1. Stufe erhalten wir mit der Pfadadditionsregel. Z.B. finden wir im rechten Baumdiagramm durch diese Rechnung:
Die zugehörigen Werte sind in der Abbildung gelb eingekreist.
Definition von bedingter Wahrscheinlichkeit
Wiedergabe stellt eine Verbindung zu YouTube her.
Mithilfe der Baumdiagramme haben wir gelernt, was unter bedingten Wahrscheinlichkeiten im Sachkontext zu verstehen ist. Zum Beispiel ist die Wahrscheinlichkeit dafür, dass man bei zufälliger Wahl eines Mathe-GKlers eine Schülerin erwischt. Im Baumdiagramm haben wir diese Wahrscheinlichkeit so berechnet:
Genau diese Rechnung steht Modell für die allgemeine Definition / Regel:
Die bedingte Wahrscheinlichkeit , dass Ereignis eintritt, unter der Voraussetzung, dass bereits eingetreten ist, ist gegeben durch . |
Statt „und“ verwendet man oft auch das Symbol für Ereignisse. Dies ist möglicherweise auch beim im Unterricht verwendeten Buch der Fall. Dieses Zeichen stammt aus der Mengenlehre.
Stochastische Unabhängigkeit
Einführung
Wiedergabe stellt eine Verbindung zu YouTube her.
Manchmal fragt man sich, ob bei einem mehrstufigen Zufallsexperiment das Ergebnis in der 1. Stufe den weiteren Verlauf beeinflussen kann. Sehen wir uns ein Beispiel an, bei dem dies deutlich wird:
Wir betrachten eine Urne mit 2 grünen und 3 roten Kugeln. Aus dieser werden 2 Kugeln gezogen.
Legen wir die erste Kugel wieder zurück, dann hat die erste Kugel natürlich keinen Einfluss auf die Wahrscheinlichkeiten beim zweiten Ziehen. Legen wir sie aber nicht zurück, dann hat die erste Kugel sehr wohl einen Einfluss. Das sehen wir daran, dass die Wahrscheinlichkeiten in der 2. Stufe im rechten Diagramm verschieden sind, je nachdem ob zuerst Rot oder zuerst Grün gezogen wurde.
Bei diesem Beispiel war es von vorneherein klar, ob das Ergebnis der 1. Stufe die 2. Stufe beeinflusst. In vielen Situationen ist dies aber gar nicht klar, sondern kann erst anhand von gegebenen Zahlen berechnet werden.
Nehmen wir dazu an, wir wollen prüfen, ob die Wahl eines LKs vom Sternzeichen Löwe abhängt. Das ist etwas absurd, soll aber deutlich machen, dass dies mit Logik allein nicht zu begründen wäre – wir brauchen Daten, mit denen wir rechnen können.
Die Auswertung an einer Schule hat vielleicht dies hier ergeben:
Das steht dabei für „Sternzeichen Löwe“. Hier ist es so, dass die Wahl eines Mathe-LKs nicht von diesem Sternzeichen abhängt. Die Wahl eins Deutsch-LKs hingegen schon.
Man sagt, dass die Merkmale Sternzeichen Löwe und Mathe-LK stochastisch unabhängig voneinander sind. Die Merkmale Sternzeichen Löwe und Deutsch-LK sind aber stochastisch abhängig voneinander.
Formale Definition
Wiedergabe stellt eine Verbindung zu YouTube her.
In der Stufe 10 und oder in einem Grundkurs dürfte die Erklärung von oben, was unter stochastischer Unabhängigkeit zu verstehen ist, eigentlich genügen.
Für alle, die etwas neugieriger sind, sehen wir uns noch etwas striktere und formalere Definition an:
Zwei Ereignisse und heißen stochastisch unabhängig voneinander, falls . |
Mit der folgenden Überlegung können wir uns einen groben Eindruck davon machen, warum dies eine geeignete formale Definition ist.
Wir gehen zunächst davon aus, dass ist, d.h., Ereignis ist nicht das unmögliche Ereignis. Sind nun und stochastisch unabhängig voneinander, gilt , was wir umformen können zu .
Der Bruch ist aber genau die bedingte Wahrscheinlichkeit . D.h., wir erhalten insgesamt . Das Eintreten von verändert also die Wahrscheinlichkeit für das Eintreten von nicht, wenn wir stochastische Unabhängigkeit im Sinne der formalen Definition voraussetzen. Mit ein paar weiteren Umformungen kann man auch zeigen, dass dann auch gilt. Das spiegelt genau unsere Einführung von oben wieder, in der wir gesagt haben, dass die Teilbäume der zweiten Stufe gleich beschriftet sein müssen.
Der Satz von Bayes
Wiedergabe stellt eine Verbindung zu YouTube her.
Nehmen wir an, wir haben ein Baumdiagramm gegeben und kennen alle Wahrscheinlichkeiten, die man dort angeben kann:
Wir möchten aber leider die bedingte Wahrscheinlichkeit bestimmen, die ausgerechnet nicht in diesem Baumdiagramm zu finden ist, sondern nur im umgekehrten.
Der Satz von Bayes, den wir nun herleiten, liefert uns eine Formel, diese Wahrscheinlichkeit aus den gegebenen Wahrscheinlichkeiten zu berechnen ohne das gesamte umgekehrte Baumdiagramm zu erstellen.
Um den Satz aber erst einmal herzuleiten, müssen wir uns nochmal das umgekehrte Baumdiagramm vor Augen führen:
Die gesuchte Wahrscheinlichkeit steht ganz oben an der 2. Stufe. Würden wir das Baumdiagramm erstellen, würden wie sie berechnen durch:
Die Wahrscheinlichkeit müssen wir beim umkehren des Baumdiagramm aber auch zunächst bestimmen, indem wir die Wahrscheinlichkeiten der zwei Pfade im ursprünglichen Diagramm, die in enden addieren:
Fügen wir nun die beide Gleichungen zusammen, erhalten wir den Satz von Bayes:
Letztlich stellt er eigentlich nur eine Zusammenfassung der Rechnung dar, die man automatisch durchführt, wenn man das umgekehrte Baumdiagramm erstellt.
Übungsaufgabe
Wiedergabe stellt eine Verbindung zu YouTube her.
Die eingehenden Emails in einem Konto werden durch einen Spamfilter in die beiden Ordner „verdächtig“ und „Eingang“ vorsortiert. Wir betrachten die folgenden Ereignisse:
- : Eine Email landet im Ordner „verdächtig“.
- : Eine Email landet im Ordner „Eingang“.
- : Eine Email ist tatsächlich Spam.
- : Eine Emal ist kein Spam.
Die im Baumdiagramm gegebenen Wahrscheinlichkeiten sind bekannt:
- Berechne die fehlenden Werte in diesem Diagramm.
- Bestimme mit dem Satz von Bayes .
- Erstelle das umgekehrte Baumdiagramm.
- Stelle die zugehörige Vierfeldertafel auf.
- Ermittle, ob und voneinander stochastisch unabhängig sind.
Die Lösungen gibt es im Clip!