WEBVTT

00:00.000 --> 00:04.120
Ganz herzlich willkommen zu diesem Video über Bernoulli-Versuche.

00:04.660 --> 00:06.640
Es geht um sogenannte Runs.

00:07.080 --> 00:09.080
Ich werde gleich sagen, was ein Run ist.

00:09.520 --> 00:12.360
Und wir werden einige interessante Dinge entdecken.

00:13.160 --> 00:15.040
Die Situation ist die folgende.

00:15.420 --> 00:19.960
Wir haben eine Folge stochastisch unabhängiger Zufallsvariablen, die

00:19.960 --> 00:22.240
alle die gleiche Verteilung besitzen.

00:23.160 --> 00:27.160
Jedes xj nimmt mit Wahrscheinlichkeit p den Wert 1 und mit

00:27.160 --> 00:33.220
Wahrscheinlichkeit 1-p den Wert 0 an, wobei ich 1-p immer durch q

00:33.220 --> 00:33.940
abkürze.

00:34.720 --> 00:39.200
Das gilt für jedes j und ich setze voraus, dass p größer als 0 und

00:39.200 --> 00:40.420
kleiner als 1 ist.

00:41.300 --> 00:45.880
Deuten wir die 1 als Treffer und die 0 als Niete, so haben wir es also

00:45.880 --> 00:49.280
mit unabhängigen Bernoulli-Versuchen mit Trefferwahrscheinlichkeit p

00:49.280 --> 00:49.840
zu tun.

00:50.620 --> 00:51.820
Was ist nun ein Run?

00:52.480 --> 00:56.640
Ein deutsches Wort hierfür ist Iteration, aber auch im Deutschen hat

00:56.640 --> 00:58.460
sich der Begriff Run durchgesetzt.

00:59.100 --> 01:03.500
Ein Run ist eine Sequenz maximaler Länge von Einsen bzw.

01:03.820 --> 01:04.200
Nullen.

01:05.100 --> 01:09.160
Was uns in diesem Video interessiert, sind die zufälligen Längen des

01:09.160 --> 01:13.840
ersten und des zweiten Runs und ich setze dafür kurz L1 bzw.

01:14.140 --> 01:14.720
L2.

01:15.920 --> 01:18.340
Machen wir zum Verständnis ein einfaches Beispiel.

01:19.160 --> 01:25.640
Wenn die Folge der Bernoulli-Versuche mit 0 0 1 1 1 0 beginnt, so ist

01:25.640 --> 01:31.000
L1 gleich 2, denn die beiden ersten Symbole sind gleich und danach

01:31.000 --> 01:34.340
geschieht ein Wechsel, das heißt der zweite Run beginnt.

01:34.900 --> 01:38.820
Und da sieht man drei gleiche Symbole, bevor es wieder wechselt.

01:39.460 --> 01:41.260
L2 ist also gleich 3.

01:42.400 --> 01:46.140
Ich gebe jetzt einmal die formalen Definitionen der Längen des ersten

01:46.140 --> 01:47.600
und des zweiten Runs an.

01:48.200 --> 01:51.680
Beide hängen von der Folge der Zufallsvariablen xj ab.

01:51.680 --> 01:56.400
Ich werde die Definitionen aber nicht ausführlich kommentieren, da wir

01:56.400 --> 01:59.560
sie in der Folge nicht benötigen und sie nicht zum Verständnis

01:59.560 --> 02:00.240
beitragen.

02:00.960 --> 02:06.040
L1 ist die größte natürliche Zahl n, so dass entweder das Produkt der

02:06.040 --> 02:11.300
xj über j von 1 bis n gleich 1 ist oder das entsprechende Produkt der

02:11.300 --> 02:12.460
1 minus xj.

02:13.460 --> 02:18.700
Bei L2 ist es die größte Zahl n, so dass entweder dieses Produkt

02:18.700 --> 02:21.080
gleich 1 ist oder dieses.

02:21.940 --> 02:26.220
Man beachte bei L2 die Indizes der Zufallsvariablen, die die

02:26.220 --> 02:27.800
jeweiligen Produkte bilden.

02:28.200 --> 02:31.200
Sie laufen ab dem Index L1 plus 1.

02:32.340 --> 02:36.440
Auf der nächsten Folie möchte ich das Ergebnis einer Simulation

02:36.440 --> 02:37.080
vorstellen.

02:37.740 --> 02:42.540
Ich habe dazu 80 Mal im Computer Bernoulli-Versuche simuliert, wobei

02:42.540 --> 02:45.500
die Trefferwahrscheinlichkeit p gleich 0,1 ist.

02:45.500 --> 02:51.200
Für die 80 Längen der jeweils ersten Runs haben sich dabei diese Werte

02:51.200 --> 02:51.640
ergeben.

02:52.680 --> 02:57.340
Man sieht, dass die Werte stark schwanken, sie liegen zwischen 1 und

02:57.340 --> 02:57.880
70.

02:58.620 --> 03:02.860
Das arithmetische Mittel, also der Durchschnitt dieser Werte, ist auf

03:02.860 --> 03:06.100
zwei Nachkommastellen genau gleich 9,69.

03:07.260 --> 03:12.820
Ich zeige jetzt die Längen der jeweils zweiten Runs und da zunächst

03:12.820 --> 03:16.160
alle Fälle, bei denen die Länge gleich 1 ist.

03:17.220 --> 03:21.180
Was auf den ersten Blick überrascht ist, dass die Länge des zweiten

03:21.180 --> 03:26.900
Runs sehr häufig nämlich 68 Mal gleich 1 ist und nur in zwölf Fällen

03:26.900 --> 03:28.140
größer als 1.

03:28.760 --> 03:31.160
Diese zwölf Werte habe ich rot markiert.

03:32.380 --> 03:37.920
Das Mittel über alle Längen des zweiten Runs ist 1,93 und damit

03:37.920 --> 03:41.720
deutlich kleiner als der Mittelwert der Längen des ersten Runs.

03:42.660 --> 03:43.640
Woran kann das liegen?

03:45.380 --> 03:49.480
Nun, der erste Run beginnt mit Wahrscheinlichkeit 0,9 mit einer Niete,

03:49.640 --> 03:53.920
also mit dem Symbol 0 und mit großer Wahrscheinlichkeit werden sich

03:53.920 --> 03:55.820
danach weitere Nieten einstellen.

03:56.500 --> 04:00.460
Wenn aber der Wechsel zum zweiten Run erfolgt, hat man einen Treffer

04:00.460 --> 04:01.120
beobachtet.

04:02.120 --> 04:05.580
Ein weiterer Treffer tritt aber nur mit der kleinen Wahrscheinlichkeit

04:05.580 --> 04:10.940
von 0,1 auf und so beträgt die Wahrscheinlichkeit 0,9, dass der zweite

04:10.940 --> 04:15.980
Run nur die Mindestlänge 1 besitzt, wenn er mit einer 1 startet.

04:16.780 --> 04:21.100
Wir werden uns jetzt mit der Verteilung der Zufallsgrößen L1 und L2

04:21.100 --> 04:25.080
beschäftigen und unter anderem die interessante Entdeckung machen,

04:25.560 --> 04:30.180
dass der Erwartungswert von L2 ganz unabhängig von p immer gleich 2

04:30.180 --> 04:30.540
ist.

04:31.540 --> 04:35.400
Für die Verteilung von L1 müssen wir Folgendes beachten.

04:36.500 --> 04:42.760
Das Ereignis L1 gleich k tritt genau dann ein, wenn entweder k mal ein

04:42.760 --> 04:48.620
Treffer und dann eine Niete oder k mal eine Niete und dann ein Treffer

04:48.620 --> 04:49.120
auftreten.

04:50.040 --> 04:53.540
Da sich diese beiden Fälle ausschließen, ist die Wahrscheinlichkeit,

04:53.540 --> 05:01.240
dass L1 den Wert k annimmt, gleich p hoch k mal q plus q hoch k mal p

05:01.240 --> 05:03.360
und das für jedes k.

05:04.460 --> 05:08.840
Ein Stabdiagramm der Verteilung von L1 sieht im Fall p gleich ein

05:08.840 --> 05:09.940
Viertel so aus.

05:11.180 --> 05:14.800
Man sieht, dass der Wert k gleich 1 die größte Wahrscheinlichkeit

05:14.800 --> 05:18.620
besitzt, was auch aufgrund der hergeleiteten Formel klar wird.

05:18.620 --> 05:24.040
Diese Wahrscheinlichkeit ist 2 mal p mal q und damit höchstens gleich

05:24.040 --> 05:27.920
ein Halb, nämlich dann, wenn p gleich ein Halb ist.

05:29.120 --> 05:33.540
Eine Möglichkeit, den Erwartungswert von L1 zu erhalten, ist nach der

05:33.540 --> 05:37.760
Formel Summe aus Wert mal Wahrscheinlichkeit dieser Ausdruck.

05:38.360 --> 05:41.360
Man muss dann den Wert dieser unendlichen Reihe bestimmen.

05:42.860 --> 05:47.460
Klammert man p mal q aus, so kann man das Ganze als Summe zweier

05:47.460 --> 05:50.100
Reihen schreiben, was dann so aussieht.

05:51.180 --> 05:54.940
Diese Reihen sind jeweils Ableitungen der geometrischen Reihe mit

05:54.940 --> 05:59.220
bekannten Formeln und das verwende ich jetzt für das nächste

05:59.220 --> 06:00.300
Gleichheitszeichen.

06:03.400 --> 06:09.020
Da 1 minus p gleich q und 1 minus q gleich p ist, ergibt sich nach

06:09.020 --> 06:15.160
Kürzen diese Summe, die man nach Einführen des Hauptnenners auch so

06:15.160 --> 06:15.900
schreiben kann.

06:17.300 --> 06:20.380
Damit folgt nach direkter Rechnung diese Darstellung für den

06:20.380 --> 06:22.080
Erwartungswert von L1.

06:22.840 --> 06:27.340
Man sieht leicht ein, dass der kleinstmögliche Erwartungswert gleich 2

06:27.340 --> 06:31.840
ist und dieser Wert wird genau dann angenommen, wenn p gleich ein Halb

06:31.840 --> 06:32.120
ist.

06:33.200 --> 06:37.620
Setzen wir speziell p gleich 0,1, so ergibt sich auf zwei

06:37.620 --> 06:40.680
Nachkommastellen gerechnet der Wert 9,11.

06:42.080 --> 06:45.100
In der Simulation hatten wir aus 80 Wiederholungen den

06:45.100 --> 06:47.500
Durchschnittswert 9,69 erhalten.

06:48.260 --> 06:50.720
Diesen Durchschnittswert können wir als Schätzwert für den

06:50.720 --> 06:52.040
Erwartungswert ansehen.

06:52.920 --> 06:56.980
Ich möchte jetzt zeigen, dass man auch eleganter an den Erwartungswert

06:56.980 --> 07:01.920
von L1 kommen kann, und zwar durch eine Methode, die man als Bedingen

07:01.920 --> 07:06.360
nach x1, also dem Ergebnis des ersten der Bernoulli-Versuche,

07:06.500 --> 07:07.400
bezeichnen kann.

07:08.460 --> 07:12.340
Den Erwartungswert von L1 kann man nämlich nach einem allgemeinen

07:12.340 --> 07:16.900
Ansatz, der manchmal auch als Formel vom totalen Erwartungswert oder

07:16.900 --> 07:20.300
als Mittelwertsregel bezeichnet wird, so darstellen.

07:21.000 --> 07:25.800
Es ist der Erwartungswert von L1 gleich p mal den bedingten

07:25.800 --> 07:31.760
Erwartungswert von L1 unter der Bedingung x1 gleich 1 plus q mal den

07:31.760 --> 07:36.160
bedingten Erwartungswert von L1 unter der Bedingung x1 gleich 0.

07:37.600 --> 07:40.820
Was passiert aber unter der Bedingung x1 gleich 1?

07:41.320 --> 07:45.840
Dann besteht der erste Run aus Einsen und dieser Run wird beendet,

07:45.880 --> 07:47.020
wenn eine Niete auftritt.

07:47.680 --> 07:52.480
Man wartet also unter der Bedingung x1 gleich 1 auf die erste Niete.

07:52.480 --> 07:57.020
Das Warten auf die erste Niete führt auf die geometrische Verteilung,

07:57.380 --> 07:59.640
zu der ich ein eigenes Video gemacht habe.

08:00.560 --> 08:05.420
Die Länge des ersten Runs unter der Bedingung x1 gleich 1 ist also 1,

08:05.720 --> 08:10.520
denn wir haben ja schon eine 1 vorliegen, plus die Anzahl der Versuche

08:10.520 --> 08:14.920
bis zum ersten Treffer, wobei der Treffer jetzt de facto eine Niete

08:14.920 --> 08:17.340
ist und die Wahrscheinlichkeit q besitzt.

08:18.060 --> 08:21.580
Dieser bedingte Erwartungswert ist also 1 durch q.

08:22.900 --> 08:27.640
Unter Vertauschung der Rollen von p und q ist dann ganz analog der

08:27.640 --> 08:30.920
zweite bedingte Erwartungswert gleich 1 durch p.

08:31.860 --> 08:37.580
Einsetzen in die obige Gleichung ergibt dann p mal 1 durch q plus q

08:37.580 --> 08:42.360
mal 1 durch p, also das Resultat, was wir schon erhalten haben.

08:43.320 --> 08:46.960
Wir haben aber noch eine wichtige Einsicht in die Struktur der

08:46.960 --> 08:48.580
Verteilung von L1 erhalten.

08:48.580 --> 08:54.460
Wenn wir die Indikatorfunktion des Ereignisses, dass x1 gleich 1 ist,

08:54.800 --> 08:59.860
also der erste Versuch einen Treffer ergibt, mit u abkürzen, so nimmt

08:59.860 --> 09:04.240
u die Werte 1 und 0 an, und zwar mit den Wahrscheinlichkeiten p

09:04.240 --> 09:05.540
beziehungsweise q.

09:06.480 --> 09:10.920
Bezeichnen wir allgemein mit w tau die Anzahl der Versuche bis

09:10.920 --> 09:14.820
einschließlich zum ersten Treffer, bei Bennulli-Versuchen mit

09:14.820 --> 09:19.380
Trefferwahrscheinlichkeit tau, so gilt folgende Verteilungsgleichheit.

09:20.320 --> 09:25.600
Die Zufallsvariable L1 besitzt die gleiche Verteilung, das kennzeichne

09:25.600 --> 09:32.280
ich mit dieser Tilde, wie u mal wq plus 1 minus u mal wp, wobei die

09:32.280 --> 09:36.860
Zufallsvariablen u, wq und wp stochastisch unabhängig sind.

09:37.560 --> 09:38.640
Warum ist das so?

09:39.640 --> 09:45.420
Nun, da u nur die Werte 1 und 0 annimmt, ist de facto nur einer der

09:45.420 --> 09:48.040
Summanden rechts von der Tilde wirksam.

09:48.800 --> 09:53.540
Ist u gleich 1, so fällt der zweite Summand weg, und L1 hat die

09:53.540 --> 09:57.480
gleiche Verteilung wie die Anzahl der Versuche bis zur ersten Niete,

09:57.840 --> 10:01.940
die Trefferwahrscheinlichkeit ist hier gleich q, und im Fall u gleich

10:01.940 --> 10:06.140
0, in dem die Bennulli-Versuche mit einer 0 beginnen, ist nur der

10:06.140 --> 10:10.800
zweite Summand wirksam und hier wartet man auf den ersten Treffer und

10:10.800 --> 10:13.900
die zufällige Wartezeit hierfür ist wp.

10:14.920 --> 10:18.300
Die stochastische Unabhängigkeit dieser drei Zufallsgrößen folgt

10:18.300 --> 10:22.020
daraus, dass die xj alle stochastisch unabhängig sind.

10:22.860 --> 10:27.240
Man nennt übrigens eine solche Darstellung eine Verteilungsmischung.

10:28.040 --> 10:31.100
Man kann sich das Entstehen dieser Verteilung in zwei Stufen

10:31.100 --> 10:31.720
vorstellen.

10:31.720 --> 10:37.220
In der ersten Stufe gibt Meister Zufall das Ergebnis für u an, also 1

10:37.220 --> 10:40.660
oder 0, und dann gibt es zwei verschiedene Würfel.

10:41.200 --> 10:45.240
Würfel 1 zeigt mit Wahrscheinlichkeit q eine 6, Würfel 2 mit

10:45.240 --> 10:46.120
Wahrscheinlichkeit p.

10:46.700 --> 10:51.780
Im Fall u gleich 1 erhält man Würfel 1, im Fall u gleich 0 Würfel 2,

10:52.160 --> 10:55.720
und man wirft dann so lange, bis die erste 6 auftritt.

10:57.300 --> 11:02.240
Als unmittelbare Folgerung erhalten wir den Erwartungswert von L1 auf

11:02.240 --> 11:03.440
eine weitere Weise.

11:04.340 --> 11:10.220
Da die Zufallsgrößen L1 und u mal wq plus 1 minus u mal wp die gleiche

11:10.220 --> 11:13.880
Verteilung besitzen, haben sie auch den gleichen Erwartungswert.

11:14.840 --> 11:18.160
Da der Erwartungswert einer Summe von Zufallsgrößen gleich der Summe

11:18.160 --> 11:22.560
der Erwartungswerte der Summanden ist und der Erwartungswert des

11:22.560 --> 11:26.520
Produktes von unabhängigen Zufallsgrößen gleich dem Produkt der

11:26.520 --> 11:31.640
Erwartungswerte der einzelnen Faktoren ist der Erwartungswert von L1

11:31.640 --> 11:38.100
gleich dem Erwartungswert von u mal dem Erwartungswert von wq plus 1

11:38.100 --> 11:42.160
minus dem Erwartungswert von u mal dem Erwartungswert von wp.

11:42.160 --> 11:48.380
Und da der Erwartungswert von u gleich p ist, ist das gleich p mal 1

11:48.380 --> 11:52.360
durch q plus q mal 1 durch p, was wir schon wissen.

11:53.800 --> 11:57.740
Bevor wir weitermachen, sollte man sich Folgendes vor Augen halten.

11:58.620 --> 12:04.740
Da u nur die Werte 1 und 0 annimmt, gilt zum einen u² gleich u, aber

12:04.740 --> 12:07.860
auch u mal 1 minus u gleich 0.

12:09.120 --> 12:11.920
Wir kommen jetzt zur Varianz von L1.

12:12.520 --> 12:16.040
Hierzu möchte ich zunächst an einige Dinge erinnern, die wir hatten.

12:16.580 --> 12:21.760
Das ist zum einen diese Verteilungsgleichheit und zum anderen diese

12:21.760 --> 12:24.540
Darstellung für den Erwartungswert von L1.

12:25.400 --> 12:29.340
Das zweite Memo betrifft den Erwartungswert und die Varianz der mit w

12:29.340 --> 12:33.880
tau bezeichneten Anzahl von Bernoulli-Versuchen bis der erste Treffer

12:33.880 --> 12:38.420
auftritt, wobei tau die Trefferwahrscheinlichkeit ist und der Versuch,

12:38.480 --> 12:40.860
der den Treffer ergibt, mitgezählt wird.

12:41.520 --> 12:44.060
Diese Größen sind durch diese Formeln gegeben.

12:45.020 --> 12:48.280
Hier kann man sich etwa mein Video über die geometrische Verteilung

12:48.280 --> 12:48.780
ansehen.

12:49.840 --> 12:53.060
Wie kommt man möglichst einfach an die Varianz von L1?

12:53.940 --> 12:58.680
Die Varianz von L1 ist nach einem allgemeinen Sachverhalt gleich dem

12:58.680 --> 13:04.480
Erwartungswert von L1² vermindert um das Quadrat des Erwartungswertes.

13:05.000 --> 13:08.700
Da wir den Erwartungswert schon kennen, kommt es nur auf diesen

13:08.700 --> 13:09.720
Erwartungswert an.

13:10.940 --> 13:14.540
Wegen der Verteilungsgleichheit im ersten Memo gilt dieses

13:14.540 --> 13:18.520
Gleichheitszeichen und jetzt rechnen wir das Quadrat nach der

13:18.520 --> 13:19.940
binomischen Formel aus.

13:19.940 --> 13:26.840
Wegen u² gleich u ist u mal wq in Klammern zum Quadrat gleich u mal

13:26.840 --> 13:33.180
wq² und der gemischte Term fällt wegen u mal 1-u gleich 0 weg.

13:34.040 --> 13:39.800
Es gilt aber auch 1-u in Klammern zum Quadrat gleich 1-u und so bleibt

13:39.800 --> 13:43.120
noch 1-u mal wp² übrig.

13:44.040 --> 13:50.020
Da u, wq und wp stochastisch unabhängig sind, folgt nach den bekannten

13:50.020 --> 13:54.080
Rechenregeln über den Erwartungswert dieses Gleichheitszeichen.

13:55.820 --> 14:00.120
Und jetzt nutzen wir aus, dass der Erwartungswert von u gleich p ist

14:00.120 --> 14:05.040
und der Erwartungswert von wq² gleich der Summe dieser beiden

14:05.040 --> 14:05.980
Ausdrücke ist.

14:06.920 --> 14:10.640
Analog ergibt sich für den zweiten Summanden diese Darstellung.

14:12.620 --> 14:18.060
Nach dem zweiten Memo sind alle auftretenden Größen bekannt und wir

14:18.060 --> 14:19.640
erhalten dieses Gleichheitszeichen.

14:23.390 --> 14:27.590
Mit ein wenig Rechnung ergibt sich jetzt dieser Ausdruck für die

14:27.590 --> 14:28.970
Varianz von L1.

14:30.310 --> 14:34.510
Ein wenig Analysis zeigt, dass die Varianz immer mindestens gleich 2

14:34.510 --> 14:39.010
ist und diese untere Schranke genau dann angenommen wird, wenn p

14:39.010 --> 14:40.230
gleich ein Halb ist.

14:41.470 --> 14:46.710
Wir kommen jetzt zur Verteilung von L2 und betrachten für ein k größer

14:46.710 --> 14:49.710
gleich 1 das Ereignis L2 gleich k.

14:50.670 --> 14:55.170
Dieses zerlegen wir in die beiden sich ausschließenden Fälle, dass der

14:55.170 --> 14:58.890
erste Bernoulli-Versuch einen Treffer oder eine Niete ergibt.

15:00.210 --> 15:04.450
Die Wahrscheinlichkeit, dass der zweite Run die Länge k hat, ergibt

15:04.450 --> 15:07.370
sich damit als Summe von zwei Wahrscheinlichkeiten.

15:07.370 --> 15:11.650
Die Wahrscheinlichkeit, dass x1 gleich 1 ist, ist p.

15:12.570 --> 15:17.190
Irgendwann ist der erste Run beendet, auf dessen Länge kommt es hier

15:17.190 --> 15:21.130
nicht an und dann beginnt der zweite Run und zwar mit einer 0, da der

15:21.130 --> 15:23.090
erste Run mit einer 1 begonnen hat.

15:23.810 --> 15:29.930
Damit dieser zweite Run exakt die Länge k hat, müssen noch k-1 Nullen

15:29.930 --> 15:34.750
hinzukommen und danach muss ein Treffer auftreten, damit ein weiterer

15:34.750 --> 15:35.590
Run beginnt.

15:35.590 --> 15:41.050
Die Wahrscheinlichkeit hierfür ist q hoch k-1 mal p.

15:42.290 --> 15:47.130
Entsprechend argumentiert man nur unter Vertauschung von p und q für

15:47.130 --> 15:52.890
den zweiten Summanden, für den sich q mal p hoch k-1 mal q ergibt.

15:53.990 --> 15:57.110
Wir können das etwas kompakter hinschreiben und erhalten diesen

15:57.110 --> 15:59.510
Ausdruck für die Verteilung von L2.

16:01.570 --> 16:05.910
Ein Stabdiagramm dieser Verteilung sieht für p gleich ein Viertel so

16:05.910 --> 16:06.310
aus.

16:07.350 --> 16:11.310
Man erkennt die große Wahrscheinlichkeit dafür, dass der zweite Run

16:11.310 --> 16:17.610
die Länge 1 hat und das ist noch ausgeprägter, wenn p näher bei 0 oder

16:17.610 --> 16:21.470
1 liegt, denn nach obiger Formel ist diese Wahrscheinlichkeit gleich

16:21.470 --> 16:23.790
p² plus q².

16:24.950 --> 16:29.250
Den Erwartungswert von L2 kann man natürlich wieder analytisch über

16:29.250 --> 16:32.930
die Darstellungsformel Summe aus Wert mal Wahrscheinlichkeit erhalten.

16:33.790 --> 16:37.030
Auch hier kommt man beim Rechnen auf die Ableitung der geometrischen

16:37.030 --> 16:37.410
Reihe.

16:38.470 --> 16:43.010
Nach Aufspalten in zwei Summen und Vorziehen von p² bzw.

16:43.430 --> 16:46.430
q² ergibt sich dieser Ausdruck.

16:48.900 --> 16:55.360
Da 1-q gleich p ist und 1-p gleich q, folgt das schon angekündigte

16:55.360 --> 17:00.640
überraschende Resultat, dass der Erwartungswert von L2 unabhängig von

17:00.640 --> 17:02.120
p gleich 2 ist.

17:04.260 --> 17:07.540
Abschließend möchte ich zeigen, dass man den Erwartungswert von L2

17:07.540 --> 17:12.680
analog wie den von L1 auch auf eine andere Weise erhalten kann und

17:12.680 --> 17:15.900
auch relativ einfach zur Varianz von L2 gelangt.

17:15.900 --> 17:21.080
Ich nehme dazu einmal die verteilungsgleiche Darstellung von L1 auf

17:21.080 --> 17:25.140
die nächste Folie und der Innere an die Definition von u.

17:25.940 --> 17:31.080
Jetzt, und das ist ein interessanter Punkt, erhalten wir für L2 eine

17:31.080 --> 17:33.760
ganz analoge verteilungsgleiche Darstellung.

17:34.420 --> 17:39.940
Ich schreibe sie erst einmal hin, nämlich L2 ist verteilungsgleich mit

17:39.940 --> 17:43.880
u mal Wp plus 1-u mal Wq.

17:43.880 --> 17:45.620
Warum gilt das?

17:46.540 --> 17:50.260
Auch hier sieht man, dass nur einer der Summanden stochastisch wirkt.

17:50.900 --> 17:55.400
Ist u gleich 1, so steht auf der rechten Seite Wp, andernfalls Wq.

17:56.660 --> 18:00.800
Ist nämlich u gleich 1, so besteht der erste Run aus Einsen.

18:01.220 --> 18:05.240
Der zweite Run beginnt damit einer Null und insgesamt besteht er aus

18:05.240 --> 18:10.440
so vielen Nullen, wie man benötigt, um einen Treffer zu erzielen und

18:10.440 --> 18:11.860
damit den Run zu beenden.

18:11.860 --> 18:18.260
Diese Zufallsgröße besitzt aber die Verteilung von Wp, so wie wir Wp

18:18.260 --> 18:19.240
definiert haben.

18:19.860 --> 18:23.240
Genau so argumentiert man für den zweiten Summanden.

18:23.680 --> 18:28.400
Man sieht also, dass eine ganz analoge Darstellung wie für L1 gilt nur

18:28.400 --> 18:32.420
mit dem wichtigen Unterschied, dass p und q vertauscht sind.

18:33.360 --> 18:35.640
Wir können hieraus wichtige Folgerungen ziehen.

18:35.640 --> 18:39.800
Zum einen lässt sich der Erwartungswert einfach ausrechnen, denn

18:39.800 --> 18:44.120
dieses Gleichheitszeichen folgt aus obiger Verteilungsgleichheit und

18:44.120 --> 18:48.080
die schon verwendeten Rechenregeln für die Erwartungswertbildung

18:48.080 --> 18:54.940
liefern dann p mal 1 durch p plus q mal 1 durch q und das ist gleich

18:54.940 --> 18:58.080
2, wie wir schon auf anderem Wege erhalten haben.

18:58.720 --> 19:04.240
Um die Varianz zu bestimmen, gehen wir genauso vor wie bei L1 und

19:04.240 --> 19:07.260
bestimmen erst den Erwartungswert von L2².

19:08.000 --> 19:11.520
Mit obiger verteilungsgleichen Darstellung erhalten wir zunächst

19:11.520 --> 19:16.200
dieses Gleichheitszeichen und die binomische Formel liefert analog zu

19:16.200 --> 19:17.980
vorher diese Gleichheit.

19:18.920 --> 19:24.420
Da wir die Erwartungswerte von Wp² und Wq² kennen und schon verwendet

19:24.420 --> 19:26.880
haben, folgt dieser Ausdruck.

19:27.880 --> 19:35.220
Man beachte hier wieder die stochastische Unabhängigkeit von Wq und Wp

19:35.220 --> 19:39.840
und weiter ergibt sich diese Summe.

19:42.140 --> 19:46.880
Subtrahiert man jetzt das Quadrat des Erwartungswertes, also 4, so

19:46.880 --> 19:49.520
ergibt sich diese Darstellung für die Varianz.

19:50.390 --> 19:55.140
Auch hier zeigt ein wenig Analysis, dass diese Varianz mindestens

19:55.140 --> 19:59.660
gleich 2 ist, wobei die untere Schranke genau dann angenommen wird,

19:59.880 --> 20:01.540
wenn p gleich ½ ist.

20:02.080 --> 20:07.420
Außerdem ist die Varianz von L1 größer oder gleich der Varianz von L2,

20:07.800 --> 20:11.760
wobei das Gleichheitszeichen nur für p gleich ½ eintritt.

20:13.160 --> 20:17.320
Abschließend seien ohne Beweis noch einige weitere Eigenschaften von

20:17.320 --> 20:18.420
Runs angegeben.

20:18.420 --> 20:23.480
Die gemeinsame Verteilung von L1 und L2 ist durch diesen Ausdruck

20:23.480 --> 20:30.260
gegeben und die Kovarianz von L1 und L2 ist 4 minus 1 durch p mal q

20:30.260 --> 20:35.620
und das ist kleiner oder gleich 0 und gleich 0 nur für den Fall p

20:35.620 --> 20:36.320
gleich ½.

20:37.320 --> 20:42.100
Ferner sind L1 und L2 nur für den Fall p gleich ½ stochastisch

20:42.100 --> 20:42.840
unabhängig.

20:43.740 --> 20:48.380
Wenn man sich für weitere Runs interessiert, wird es langweilig, denn

20:48.380 --> 20:52.840
die Länge des dritten Runs hat die gleiche Verteilung wie L1 und die

20:52.840 --> 20:57.100
Länge des vierten Runs die gleiche Verteilung wie die von L2 und so

20:57.100 --> 20:57.440
weiter.

20:58.440 --> 21:03.360
Zu guter Letzt ist die Kovarianz zwischen L1 und L3 gerade das

21:03.360 --> 21:08.680
Negative der Kovarianz zwischen L1 und L2 und damit größer oder gleich

21:08.680 --> 21:08.920
0.

21:08.920 --> 21:15.480
L1 und L3 sind also positiv korreliert, was nach allen angestellten

21:15.480 --> 21:17.640
Überlegungen plausibel sein sollte.

21:19.240 --> 21:22.860
Ich bedanke mich ganz herzlich für das Anschauen des Videos.

21:23.760 --> 21:27.820
Wer hiermit Einsichten in Runs bei Bernoulli-Versuchen erhalten hat,

21:28.300 --> 21:31.560
kann dieses Video natürlich sehr gerne weiterempfehlen.

