WEBVTT

00:09.950 --> 00:13.470
Guten Morgen und das ist der Stand, den wir hatten beim letzten Mal.

00:13.550 --> 00:14.790
Die Folie war fast zu Ende.

00:14.970 --> 00:16.550
Wir haben also einiges schon bewiesen.

00:16.670 --> 00:17.390
Das waren die Punkte.

00:17.830 --> 00:19.250
Der letzte Punkt war noch nicht bewiesen.

00:19.310 --> 00:22.130
Da habe ich gesagt, wir machen das später, dass die Varianz der Summe

00:22.130 --> 00:23.350
gleich Summe der Varianzen ist.

00:23.690 --> 00:25.190
Jetzt kommt eine wichtige Folgerung.

00:25.650 --> 00:29.230
Die Folgerung ist die Minimaleigenschaft des Erwartungswertes in

00:29.230 --> 00:29.970
folgendem Sinn.

00:31.290 --> 00:34.650
Wenn Sie die Varianz haben, dann ist das nichts anderes als das

00:34.650 --> 00:40.230
Minimum der quadratischen Abweichungen von x, von t, also x-t in

00:40.230 --> 00:43.570
Klammern zum Quadrat, quadratische Abweichung, davon der

00:43.570 --> 00:45.290
Erwartungswert über alle t aus R.

00:46.190 --> 00:49.430
Das heißt, es wird dann minimal, wenn Sie für t den Erwartungswert

00:49.430 --> 00:49.930
einsetzen.

00:50.030 --> 00:53.430
Und das folgt direkt aus der Eigenschaft CE, wenn Sie dort in die

00:53.430 --> 00:54.430
zweite Zeile sehen.

00:54.610 --> 00:58.490
Der Beweis, wenn Sie das, was dort im Minuszeichen steht, in der

00:58.490 --> 01:01.490
zweiten Zeile rüberbringen auf die andere Seite, dann sehen Sie, es

01:01.490 --> 01:05.270
ist der Erwartungswert von x-t in Klammern zum Quadrat, das ist nichts

01:05.270 --> 01:06.830
anderes als die Varianz.

01:07.430 --> 01:10.470
Und dann kommt jetzt noch was dazu, was nicht negativ ist, nämlich

01:10.470 --> 01:13.970
gerade dieses Quadrat, e von x-t in Klammern zum Quadrat.

01:14.070 --> 01:17.790
Das heißt, die linke Seite ist auf jeden Fall immer größer gleich

01:17.790 --> 01:18.710
Varianz von x.

01:19.430 --> 01:22.610
Und es wird aber angenommen, dieses Minimum, wenn Sie ganz rechts

01:22.610 --> 01:24.590
einsetzen für t, den Erwartungswert.

01:25.090 --> 01:29.390
Damit fällt das zweite Glied weg, haben Sie 0, also e von x-e von x

01:29.390 --> 01:32.910
ist 0, zum Quadrat ist 0, das heißt, das wird wirklich angenommen.

01:32.910 --> 01:35.310
Das heißt, die Varianz hat diesen Minimalwert.

01:36.430 --> 01:39.070
Entschuldigung, die mittlere quadratische Abweichung hat diesen

01:39.070 --> 01:39.710
Minimalwert.

01:41.590 --> 01:45.470
Wir werden später für eine andere Größe, die wir bilden, das wird der

01:45.470 --> 01:48.410
Median sein, einer Verteilung, da werden wir eine andere Eigenschaft

01:48.410 --> 01:51.190
kennenlernen, die haben Sie auch schon kennengelernt bei Daten, wenn

01:51.190 --> 01:54.690
Sie den empirischen Median genommen haben, dann wurde die Summe der

01:54.690 --> 01:59.490
Beträge von Daten Minus, dann dieser Median Minimal der Beträge.

01:59.490 --> 02:02.710
Hier könnte ich natürlich auch sagen, anstelle des Quadrates nehme ich

02:02.710 --> 02:05.450
mal den Betrag, x-t Betrag.

02:06.810 --> 02:07.970
Wofür wird der denn Minimal?

02:08.050 --> 02:11.150
Da kommt was anderes raus, als eben der Erwartungswert.

02:11.230 --> 02:15.110
Hier haben wir die quadratische Abweichung und die wird Minimal, wenn

02:15.110 --> 02:17.030
c gleich dem Erwartungswert von x ist.

02:18.450 --> 02:26.230
Gut, jetzt möchte ich Ihnen zeigen, Indikatorsummen, die kamen häufig

02:26.230 --> 02:26.590
vor.

02:26.590 --> 02:29.490
Und wenn Sie die Varianz von so einer Indikatorsumme bestimmen wollen,

02:29.570 --> 02:31.290
brauchen Sie nicht notwendig die Verteilung.

02:32.470 --> 02:35.290
Manchmal sind Zufallsvarianten kompliziert und man ist froh, wenn man

02:35.290 --> 02:37.110
den Erwartungswert hat und die Varianz.

02:37.870 --> 02:40.950
Man kann damit schon einiges machen, die Verteilung kennt man

02:40.950 --> 02:41.710
vielleicht gar nicht.

02:42.070 --> 02:45.310
Und wenn Sie allgemeine Indikatorsumme haben, wir hatten viele Fälle,

02:45.790 --> 02:49.510
denken Sie an Anzahl der Rekorde in einer rein zufälligen Permutation,

02:49.870 --> 02:53.010
Anzahl von Treffern, Anzahl von roten Kugeln, die wir ziehen aus

02:53.010 --> 02:56.230
irgendeiner Urne, unter allen möglichen Ziehungsmechanismen werden

02:56.230 --> 02:57.370
immer Indikatorsummen.

02:57.890 --> 03:00.830
Die Varianz einer Indikatorsumme sieht so aus, wenn ich Ereignisse

03:00.830 --> 03:05.630
habe und x ist eben die Anzahl der eintretenden Ereignisse, Summe

03:05.630 --> 03:09.530
dieser Indikatorfunktionen, dann gilt folgende Aussage, die Varianz

03:09.530 --> 03:13.610
von x lässt sich so bestimmen, ich brauche von den Ereignissen, die

03:13.610 --> 03:17.010
jetzt kommen, nur die Wahrscheinlichkeiten zu kennen und ich muss die

03:17.010 --> 03:19.210
Wahrscheinlichkeiten kennen immer von Schnitten von 2.

03:19.210 --> 03:22.950
Die Formel sieht so aus, es ist einmal die Summe i von 1 bis n,

03:23.070 --> 03:27.070
Wahrscheinlichkeit von ai mal 1 minus Wahrscheinlichkeit von ai und

03:27.070 --> 03:31.370
dann kommt noch was dazu, im Allgemeinen jedenfalls, und zwar zweimal,

03:31.470 --> 03:35.490
jetzt sehen Sie Summe über alle 1 kleiner gleich i kleiner j kleiner

03:35.490 --> 03:36.090
gleich n.

03:36.650 --> 03:39.190
Ich hätte das auch anders schreiben können, ich hätte auch schreiben

03:39.190 --> 03:46.410
können Summe i ungleich j, also 1 kleiner gleich i ungleich j kleiner

03:46.410 --> 03:48.870
gleich n, dann hätte ich aber den Faktor 2 nicht schreiben dürfen.

03:48.990 --> 03:52.230
Was jetzt kommt, ist symmetrisch in i und j, das heißt, ich schreibe

03:52.230 --> 03:56.190
sehr gern zweimal und dann i kleiner j und was jetzt kommt, ist nichts

03:56.190 --> 03:59.290
anderes als die Wahrscheinlichkeit des Schnittes von 2 Ereignisse,

03:59.890 --> 04:03.730
vermindert um das Produkt der beiden Wahrscheinlichkeiten.

04:04.410 --> 04:07.270
Man sieht sofort, wenn die Ereignisse stochastisch unabhängig sind,

04:07.370 --> 04:09.730
dann ist die Wahrscheinlichkeit von diesem Schnitt, der da oben steht,

04:09.990 --> 04:13.150
gleich dem Produkt, das heißt, dann fängt dieser ganze Rattenschwanz

04:13.150 --> 04:16.470
weg mit der Doppelsumme für unabhängige Ereignisse und es bleibt nur

04:16.470 --> 04:20.670
noch über diese allererste Summe, Summe p von ai mal 1 minus p von ai.

04:21.250 --> 04:23.450
Stellen Sie sich vor, die Wahrscheinlichkeiten sind alle gleich und

04:23.450 --> 04:27.470
alle kleinen p, dann steht da p mal 1 minus p, n mal Aufsumme, da

04:27.470 --> 04:30.690
kommt raus n mal p mal 1 minus p und das kennt der ein oder andere

04:30.690 --> 04:31.430
schon aus der Schule,

04:35.180 --> 04:37.640
nämlich die Varianz der Binomialverteilung.

04:41.540 --> 04:44.440
Speziell, wenn die Ereignisse alle gleich wahrscheinlich sind, ich

04:44.440 --> 04:48.600
sage jetzt, p ist immer p von a1 und ich weiß auch noch, dass die

04:48.600 --> 04:52.560
Wahrscheinlichkeiten von Schnitten von 2 immer das gleiche ist, ganz

04:52.560 --> 04:56.940
egal, wie ich i und j wähle, ich kann obda i gleich 1 wählen und j

04:56.940 --> 05:02.580
gleich 2, solche Situation hatten wir auch, dann ist natürlich klar,

05:03.120 --> 05:06.220
dann ist jeder der Summanen da hinten gleich, nämlich p von ai

05:06.220 --> 05:09.980
geschnittener j ist immer der gleiche Wert und p von ai mal p von aj

05:09.980 --> 05:10.460
auch.

05:10.900 --> 05:13.320
Das heißt, ich muss nur noch zählen, wie viele Summanen ich habe in

05:13.320 --> 05:13.800
dieser Summe.

05:13.900 --> 05:17.740
Das ist die Anzahl der Möglichkeiten, aus n Dingen 2 auszuwählen,

05:17.900 --> 05:21.300
nämlich solche Indizes i und j mit i kleiner j, das sind n über 2.

05:21.940 --> 05:23.380
Vorne steht aber der Faktor 2.

05:23.380 --> 05:29.780
n über 2 ist n mal n minus 1 halbe mal 2 ist n mal n minus 1.

05:30.360 --> 05:34.200
Sie sehen also, dieser Rattenschwanz ist einfach n mal n minus 1 mal

05:34.200 --> 05:38.300
etwas und vorne, wenn die Wahrscheinlichkeiten alle gleich sind, dann

05:38.300 --> 05:41.040
haben sie natürlich n mal irgendetwas und deshalb kann ich ein n

05:41.040 --> 05:41.840
ausklammern.

05:42.580 --> 05:45.800
Das heißt, ich habe hier ein n, was ich ausklammern kann, dann bleibt

05:45.800 --> 05:51.020
über p von a1 mal 1 minus p von a1 und von der zweiten Summe, ich habe

05:51.020 --> 05:54.800
schon ein n ausgeklammert, es bleibt nur noch über ein n minus 1 und

05:54.800 --> 06:00.060
jetzt kann ich eben für i gleich 1 setzen, für j gleich 2 und für, ja,

06:00.840 --> 06:04.680
schreibe ich für j hier 1, das heißt, ich habe p von a1 geschnitten a2

06:04.680 --> 06:06.780
minus p von a1 zum Quadrat.

06:07.680 --> 06:12.020
So, diese Situation ist insbesondere gegeben, wenn sie Unabhängigkeit

06:12.020 --> 06:18.120
haben, dann ist ja sogar p von a1 geschnitten a2 gleich p von a1 mal p

06:18.120 --> 06:20.680
von a2 und wenn sie eben noch wissen, dass die Wahrscheinlichkeiten

06:20.680 --> 06:24.760
alle gleich sind, aber die Situation ist auch gegeben in anderen

06:24.760 --> 06:27.480
Situationen, zum Beispiel im polnischen Uhrenschema.

06:28.440 --> 06:30.520
Spezialfall ist das Ziehen ohne Zurücklegen.

06:31.100 --> 06:32.240
Das machen wir gleich als Beispiel.

06:33.140 --> 06:36.100
Um das jetzt zu beweisen, das Entscheidende ist diese erste Formel.

06:36.180 --> 06:39.140
Die zweite, die wir haben, die spezielle, die folgt aus der ersten,

06:39.260 --> 06:41.440
aber die erste Formel, wie beweisen wir die?

06:42.180 --> 06:46.700
Und die beweisen wir so, dass wir das x natürlich darstellen, oben als

06:46.700 --> 06:49.020
Indikatorsumme und wir nutzen diese Gleichung aus.

06:49.600 --> 06:52.660
Varianz von x ist e von x Quadrat minus e von x in Klammern zum

06:52.660 --> 06:53.000
Quadrat.

06:53.080 --> 06:56.740
Wir rechnen erst e von x Quadrat aus, rechnen dann e von x aus und

06:56.740 --> 06:59.580
quadrieren das und subtrahieren das, also eine direkte Rechnung.

07:00.360 --> 07:03.500
Das heißt, x Quadrat, sehen Sie sich an, wie x gebildet ist, ist eine

07:03.500 --> 07:07.300
Summe von Indikatoren dort oben, das heißt, ich habe diese Summe und

07:07.300 --> 07:08.160
muss sie quadrieren.

07:09.500 --> 07:12.140
Das kann ich aber so machen, dass ich die Summe als Doppelsumme

07:12.140 --> 07:12.600
schreibe.

07:12.600 --> 07:15.500
Das heißt, ich schreibe die Summe hin, so wie sie da steht und

07:15.500 --> 07:18.960
multipliziere sie mit sich selbst, wobei ich i durch j ersetze und

07:18.960 --> 07:20.860
dann wende ich das Driste-Boutif-Gesetz an.

07:21.140 --> 07:24.640
Dann kommt das raus, eine Doppelsumme, da steht immer Indikator ai mal

07:24.640 --> 07:25.500
Indikator aj.

07:27.040 --> 07:30.100
So, jetzt muss ich wissen, ein Produkt von zwei Indikatoren ist

07:30.100 --> 07:32.380
Indikator des Durchschnitts der beiden Ereignisse.

07:32.540 --> 07:34.840
Das ist alles, was ich jetzt beim nächsten Gleichheitszeichen mache.

07:35.280 --> 07:38.000
Das heißt, ich schreibe diese Doppelsumme nochmal hin und schreibe

07:38.000 --> 07:41.640
jetzt hier nur hin Indikator Schnitt von den beiden Ereignissen.

07:41.640 --> 07:43.260
Also ganz simpel.

07:44.020 --> 07:45.560
Ja, jetzt wird Folgendes gemacht.

07:45.640 --> 07:47.300
Sie sehen ja auch oben, ich habe eine Einfachsumme.

07:47.380 --> 07:48.700
Ich muss auf eine Einfachsumme kommen.

07:49.080 --> 07:52.580
Ich fasse jetzt erst diese Fälle, wo i gleich j ist, zusammen.

07:52.680 --> 07:56.420
Dann habe ich eine Einfachsumme und Indikator ai, geschnitten ai, ist

07:56.420 --> 07:57.660
natürlich Indikator ai.

07:57.820 --> 08:00.540
Das heißt, ich habe erst eine Einfachsumme, Summe Indikator ai.

08:01.040 --> 08:04.780
Was jetzt noch überbleibt, ist diese Soppel, die Doppelsumme mit i

08:04.780 --> 08:05.400
ungleich j.

08:05.560 --> 08:06.840
Die fehlt noch.

08:07.900 --> 08:09.300
Doppelsumme mit i ungleich j.

08:09.800 --> 08:11.840
Sie sehen natürlich, dass das symmetrisch ist.

08:12.020 --> 08:14.200
ai geschnitten ai, ist aj geschnitten ai.

08:14.420 --> 08:18.220
Aus dem Grunde fange ich jetzt an und führe diesen Faktor 2 ein und

08:18.220 --> 08:19.380
schreibe i kleiner j.

08:20.020 --> 08:23.220
Dann habe ich natürlich nichts anderes als Indikator ai, geschnitten

08:23.220 --> 08:24.060
Indikator aj.

08:24.900 --> 08:28.200
Das heißt, ich habe einfach mit der Summe gerechnet und erst mal gar

08:28.200 --> 08:29.040
nichts weiter gemacht.

08:29.260 --> 08:30.700
Ein bisschen mit Indikatoren gerechnet.

08:30.700 --> 08:32.860
Da schreiben wir mal oben hin als Memo.

08:33.080 --> 08:34.320
Also das haben wir bislang erhalten.

08:34.520 --> 08:35.480
x² ist das.

08:36.240 --> 08:36.460
Gut.

08:36.860 --> 08:38.920
Und jetzt kann ich natürlich den Erwartungswert ausrechnen.

08:39.000 --> 08:42.800
Ich nutze nur aus, dass der Erwartungswert additiv ist und dass ich

08:42.800 --> 08:43.980
Konstanten rausziehen kann.

08:44.080 --> 08:46.860
Das war die elementare Regeln für den Erwartungswert.

08:47.260 --> 08:49.420
Das bedeutet, ich kann die Summe nach vorne ziehen und der

08:49.420 --> 08:51.760
Erwartungswert des Indikators ist die Wahrscheinlichkeit.

08:52.260 --> 08:54.020
Das heißt, ich fange an mit Summe p von ai.

08:54.020 --> 08:57.680
Und dann habe ich den Faktor 2 und die Summe und jetzt habe ich den

08:57.680 --> 09:01.200
Erwartungswert dieses Indikators, ist nichts anderes als p von ai,

09:01.440 --> 09:02.120
geschnitten aj.

09:02.740 --> 09:03.520
Das habe ich auch.

09:04.280 --> 09:05.800
Ich glaube, mehr mache ich jetzt erst mal gar nicht.

09:06.500 --> 09:09.780
Und jetzt nehme ich den Erwartungswert von x².

09:10.600 --> 09:14.280
Nun, wir wissen, der Erwartungswert von x, x ist eine Indikatorsumme,

09:14.640 --> 09:15.940
ist Summe der Wahrscheinlichkeiten.

09:16.020 --> 09:16.820
Das haben wir schon gehabt.

09:17.360 --> 09:20.300
Das heißt, ich muss das Quadrat bilden dieser Summe der

09:20.300 --> 09:21.100
Wahrscheinlichkeiten.

09:21.800 --> 09:23.540
Auch das schreibe ich als Doppelsumme.

09:23.680 --> 09:28.620
Da steht Summe über i von 1 bis n, p von ai, gedanklich mal Summe über

09:28.620 --> 09:30.100
j von 1 bis n, p von aj.

09:30.300 --> 09:32.880
Das heißt, ich habe das, diese Doppelsumme.

09:34.460 --> 09:37.800
Auch hier die Fälle i gleich j, machen wir getrennt.

09:38.280 --> 09:40.300
Das heißt, ich habe erst die Summe i von 1 bis n.

09:40.960 --> 09:44.300
Da habe ich i gleich j, also p von ai mal p von ai, p von ai zum

09:44.300 --> 09:44.840
Quadrat.

09:44.840 --> 09:47.980
Und dann habe ich natürlich wieder zweimal i kleiner j.

09:48.900 --> 09:51.240
Und jetzt steht dann p von ai mal p von aj.

09:52.360 --> 09:55.060
So, und das muss ich natürlich von dem subtrahieren, was da oben

09:55.060 --> 09:55.680
drüber steht.

09:56.140 --> 09:59.620
Wenn Sie sich jetzt die Subtraktion ansehen, dann fällt das im Grunde

09:59.620 --> 10:04.120
alles in sich zusammen, denn man erkennt natürlich sofort, diese Summe

10:04.120 --> 10:06.300
hier, die muss ich von der da oben abziehen.

10:06.980 --> 10:09.680
Und da sehen Sie, können Sie p von ai ausklammern, ist die gleiche

10:09.680 --> 10:09.860
Summe.

10:09.920 --> 10:12.840
Dann haben Sie schon p von ai mal Klammer auf 1 minus p von ai.

10:13.460 --> 10:17.680
Und diese zweite Summe da, mit dem Faktor 2, müssen Sie davon

10:17.680 --> 10:18.140
abziehen.

10:18.260 --> 10:21.000
Und Sie sehen, es ist alles identisch, zweimal Summe, i kleiner j.

10:21.400 --> 10:25.420
Dann bleibt natürlich über p von ai geschnitten, aj minus p von ai mal

10:25.420 --> 10:25.940
p von aj.

10:26.100 --> 10:26.760
Und das war es schon.

10:26.960 --> 10:28.680
Das heißt, ich subtrahiere das ganz einfach.

10:29.120 --> 10:32.700
Variante ist das plus zweimal dem und das war das ganze Ergebnis.

10:33.200 --> 10:36.900
Also elementares Rechnen mit Erwartungswerten.

10:37.040 --> 10:39.840
Sie sehen, wie wichtig diese grundlegenden Techniken sind.

10:40.520 --> 10:43.060
Okay, gut, machen wir ein Beispiel.

10:43.620 --> 10:45.520
Beispiel Polya-Verteilung.

10:46.100 --> 10:47.680
Wo entstand die Polya-Verteilung?

10:47.920 --> 10:48.800
In welcher Situation?

10:49.040 --> 10:55.100
Es war dieses ominöse Uhrenmodell, bei dem wir r-rote Kugeln hatten,

10:55.260 --> 10:58.880
erst schwarze Kugeln, blind in die Urne gegriffen haben, eine Kugel

10:58.880 --> 11:03.160
rausgezogen haben, die wieder reingelegt haben und c weitere Kugeln

11:03.160 --> 11:04.820
der gleichen Farbe zusätzlich rein.

11:05.260 --> 11:06.860
Wobei c auch negativ sein kann.

11:06.860 --> 11:09.340
Das wurde dann wieder gut gemischt und wiederholt.

11:09.620 --> 11:11.220
Insgesamt wurde n mal gezogen.

11:11.660 --> 11:14.340
Die Zufallsvariable zählt die Zahl der roten Kugeln.

11:16.040 --> 11:19.100
Bei der Verteilung haben wir gesehen, wir haben das so modelliert.

11:19.320 --> 11:20.940
Treffer war immer 1 niete 0.

11:21.200 --> 11:23.780
Die Ergebnisse waren n Tupel aus Nullen und Einsen.

11:24.960 --> 11:29.140
Es kam für die Wahrscheinlichkeit eines Tupels nur auf die Anzahl der

11:29.140 --> 11:34.100
Einsen in dem Tupel an, nicht auf die Stellung der Einsen in dem

11:34.100 --> 11:34.480
Tupel.

11:35.340 --> 11:37.480
Wir hatten also eine gewisse Austauschbarkeit.

11:38.720 --> 11:41.780
Die führte zu folgenden Erkenntnissen.

11:42.340 --> 11:45.680
Falls x so eine Polya-Verteilung hat, so ist die Varianz.

11:45.700 --> 11:47.520
Ich schreibe einfach mal das Ergebnis erstmal hin.

11:47.980 --> 11:49.920
Das ist n mal p mal 1 minus p.

11:50.700 --> 11:51.840
Ich muss sagen, was p ist.

11:51.900 --> 11:55.060
p ist nichts anderes als r durch r plus s, der Anteil der roten Kugeln

11:55.060 --> 11:55.620
in der Urne.

11:55.720 --> 11:56.700
Werde ich gleich definieren.

11:57.400 --> 11:58.600
So, dann kommt ein Faktor mal.

11:58.600 --> 12:02.980
Die Urne sehen 1 plus n minus 1 mal c dividiert durch r plus s plus c.

12:03.440 --> 12:04.060
p ist das.

12:05.560 --> 12:09.300
Das bekommen Sie aus der Formel von eben raus, aus dem Spezialfall.

12:09.560 --> 12:12.680
Sie müssen natürlich nur wissen, was sind die Wahrscheinlichkeiten der

12:12.680 --> 12:15.800
ai und was ist die Wahrscheinlichkeit von ai geschnitten aj.

12:16.180 --> 12:19.220
Nur das brauchen wir, dann setzen wir das ein und rechnen aus.

12:19.920 --> 12:20.920
So, beachte hierzu.

12:21.100 --> 12:24.800
Wir haben gesehen, die Wahrscheinlichkeit, dass die j-Kugel rot ist,

12:24.800 --> 12:28.380
ist unabhängig von j, von der Nummer der Ziehung, immer r durch r plus

12:28.380 --> 12:28.660
s.

12:30.800 --> 12:33.300
Das habe ich gehofft, dass wir das intuitiv einsehen.

12:33.540 --> 12:36.300
Die Zusatzkugeln sind alle mit gleicher Wahrscheinlichkeit rot.

12:36.680 --> 12:39.220
Entweder ziehe ich eine der ursprünglichen oder ich ziehe eine

12:39.220 --> 12:39.860
Zusatzkugel.

12:41.500 --> 12:44.760
Das war das intuitive Argument, aber wir können das auch mit der

12:44.760 --> 12:46.580
Formel von der totalen Wahrscheinlichkeit machen.

12:49.510 --> 12:52.770
Die Wahrscheinlichkeit, dass die i- und die j-Kugel beide rot sind,

12:53.050 --> 12:56.350
jetzt kommt das Symmetrieargument, was ich gesagt hatte, es hängt nur,

12:56.990 --> 13:01.730
die Wahrscheinlichkeit von einem Tupel hängt nur von der Anzahl der

13:01.730 --> 13:04.210
Einsen ab, nicht von der Stellung der Einsen in dem Tupel.

13:04.310 --> 13:08.210
Aus dem Grunde können sie OBDA i gleich 1 setzen und j gleich 2.

13:10.110 --> 13:13.690
Die Wahrscheinlichkeit ist dann, dass die erste rot ist, ist r durch r

13:13.690 --> 13:14.150
plus s.

13:14.450 --> 13:16.870
Sie sehen, das ist der erste Faktor im Zähler, dividiert durch den

13:16.870 --> 13:17.790
ersten Faktor im Nenner.

13:18.450 --> 13:20.950
Und jetzt kommt die bedingte Wahrscheinlichkeit, dass die zweite rot

13:20.950 --> 13:22.330
ist, wenn die erste rot ist.

13:22.330 --> 13:26.430
Jetzt haben sie r plus c gute Kugeln, rote Kugeln.

13:26.510 --> 13:30.170
Sie legen ja c zusätzlich zurück und insgesamt in der Urne r plus s

13:30.170 --> 13:31.030
plus c Kugeln.

13:31.210 --> 13:32.530
Das ist der zweite Faktor.

13:32.890 --> 13:35.350
Das heißt, diese Wahrscheinlichkeit hängt nicht von i und j ab.

13:35.690 --> 13:38.630
Jetzt können sie in die spezielle Formel gehen, für die Varianz setzen

13:38.630 --> 13:40.150
das ein und erhalten das Ergebnis.

13:41.070 --> 13:45.110
Man sieht, die Varianz n mal p mal 1 minus p ist sozusagen völlig

13:45.110 --> 13:46.170
unabhängig von dem c.

13:46.850 --> 13:49.810
Das c geht nur ein da oben, da und da unten.

13:50.330 --> 13:52.790
Wenn wir jetzt die Spezialfälle uns mal ansehen, bei der

13:52.790 --> 13:56.610
Binomialverteilung lege ich die Kugel zurück, aber nichts weiter, da

13:56.610 --> 13:57.530
ist c gleich 0.

13:58.250 --> 14:01.030
Sie sehen, wenn c gleich 0 ist, fällt das da oben in dem Zähler weg.

14:02.030 --> 14:05.970
Und ich habe das, was vielleicht der ein oder andere schon kennt vom

14:05.970 --> 14:09.730
Gymnasium, die Varianz der Binomialverteilung ist n mal p mal 1 minus

14:09.730 --> 14:10.030
p.

14:10.430 --> 14:12.130
Dort heißt es meistens n mal p mal q.

14:12.410 --> 14:13.530
q ist immer 1 minus p.

14:14.210 --> 14:14.830
Das ist die Varianz.

14:15.470 --> 14:18.830
Wenn ich die hypergeometrische Verteilung habe, da ist c gleich minus

14:18.830 --> 14:19.350
1.

14:19.930 --> 14:24.650
Das heißt, wenn ich dort minus 1 einsetze, erhalte ich dieses

14:24.650 --> 14:25.130
Ergebnis.

14:25.450 --> 14:27.750
Vorne bleibt es n mal p mal 1 minus p.

14:27.870 --> 14:31.130
Und jetzt sehen Sie, in den Zähler oben ist c gleich minus 1.

14:31.810 --> 14:35.370
Und hier habe ich natürlich dann ein Minuszeichen minus n minus 1

14:35.370 --> 14:36.590
durch r plus s minus 1.

14:36.950 --> 14:39.910
Und diese Varianz ist kleiner als die der Binomialverteilung.

14:40.770 --> 14:43.470
Das hatten wir eingangs an den Bildern gesehen.

14:43.590 --> 14:46.410
Wir hatten hypergeometrische und eine Binomialverteilung.

14:46.410 --> 14:48.910
Einmal ziehen mit, einmal ohne zurücklegen.

14:49.010 --> 14:51.790
Wir haben gesehen, einmal konzentriert sich das stärker um den

14:51.790 --> 14:53.950
Erwartungswert und einmal weniger stark.

14:54.370 --> 14:56.410
Und das wird jetzt hierdurch begründet.

14:56.470 --> 14:57.850
Das sollte auch intuitiv klar sein.

14:57.890 --> 15:01.490
Wenn ich Kugeln rausnehme, verringere ich Variabilität.

15:02.050 --> 15:05.450
Lege ich Kugeln zusätzlich zurück, erhöhe ich Variabilität.

15:06.070 --> 15:09.610
Das heißt also, die Polya-Verteilung, die Varianz wächst mit dem c.

15:11.610 --> 15:13.370
Sollte auch intuitiv klar sein.

15:13.370 --> 15:16.410
Wir haben jetzt eine Formel für die Varianz einer Indikatorsumme

15:16.410 --> 15:17.010
hergeleitet.

15:17.630 --> 15:19.070
Ich mache mal noch ein zweites Beispiel.

15:20.490 --> 15:23.630
Hier ist erstmal die Frage, bevor ich weitermache, das muss man

15:23.630 --> 15:26.130
natürlich alles auch mit den Darstellungsformeln erhalten.

15:26.330 --> 15:28.790
Versuchen Sie mal die Varianz der Binomialverteilung, wäre der

15:28.790 --> 15:33.750
einfachste Fall, zu sagen, okay, ich rechne das mal nicht Varianz

15:33.750 --> 15:36.090
einer Indikatorsumme, sondern ich kenne die Verteilung ja.

15:36.290 --> 15:38.850
Ich weiß ja die Wahrscheinlichkeit, dass x den Wert k annimmt, das n

15:38.850 --> 15:41.950
über k mal p hoch k mal 1 minus p hoch n minus k.

15:43.790 --> 15:47.010
Und über diese Darstellungsformel muss ich die Varianz ausrechnen

15:47.010 --> 15:47.250
können.

15:48.130 --> 15:53.190
Das war ja Summe Wert minus Erwartungswert in Klammern zum Quadrat mal

15:53.190 --> 15:54.030
Wahrscheinlichkeit.

15:54.150 --> 15:57.330
Also Summe k von 0 bis n, die Werte sind die Werte k, der

15:57.330 --> 16:00.450
Erwartungswert ist n mal p, den kenne ich schon, in Klammern zum

16:00.450 --> 16:03.710
Quadrat mal Wahrscheinlichkeit, die ich eben nannte, muss auch n mal p

16:03.710 --> 16:04.990
mal 1 minus p rauskommen.

16:07.910 --> 16:11.390
Diese Formel zu benutzen für die Varianz einer Indikatorsumme ist

16:11.390 --> 16:12.750
natürlich eleganter.

16:14.110 --> 16:16.750
Man sieht, da braucht man dann weniger rechnen.

16:17.990 --> 16:18.470
Beispiel.

16:19.210 --> 16:21.710
Anzahl der Rekorde in einer rein zufälligen Permutation.

16:22.150 --> 16:23.530
Ich will Ihnen nochmal ein Bild zeigen.

16:23.750 --> 16:27.290
Also hier sind darunter die Zahlen von 1 bis 9 rein zufällig

16:27.290 --> 16:27.850
permutiert.

16:28.010 --> 16:30.710
Das ist ein Kartenspiel, wo die Zahlen von 1 bis 9 stehen.

16:31.470 --> 16:34.890
Die erste Karte, das könnte vielleicht die 5 sein oder auch die 2 oder

16:34.890 --> 16:35.410
die 7.

16:35.750 --> 16:38.350
Das ist einfach eine Permutation der Zahlen von 1 bis 9.

16:38.870 --> 16:42.350
Diese Karte ist immer, die decke ich als erste auf, die liefert mir

16:42.350 --> 16:43.650
einen Rekord, die ganz links.

16:43.810 --> 16:44.950
Die Wahrscheinlichkeit ist 1.

16:45.430 --> 16:47.710
Die Wahrscheinlichkeit, dass die nächste Karte rechts daneben einen

16:47.710 --> 16:49.730
Rekord liefert, ist ein Halb, haben wir uns überlegt.

16:49.990 --> 16:51.810
Mit Wahrscheinlichkeit 50 Prozent.

16:51.970 --> 16:53.890
Hat den größeren Wert als die links davor.

16:54.630 --> 16:56.270
Die nächste mit Wahrscheinlichkeit ein Drittel.

16:56.390 --> 17:00.410
Das heißt, wir haben hier eine Anzahl von Rekorden und Anzahl ist

17:00.410 --> 17:01.650
immer Indikatorsumme.

17:01.870 --> 17:05.890
Das bedeutet, wir arbeiten mit der Menge der Permutation, der Zahlen

17:05.890 --> 17:08.830
hier von 1 bis n, mit der Gleichverteilung darauf.

17:08.970 --> 17:11.010
Alle Permutationen sollen gleichwahrscheinlich sein.

17:11.130 --> 17:15.690
aj ist das Ereignis, dass an der j-Stelle ein Rekord steht.

17:16.150 --> 17:18.570
In dem Experiment, die j-Karte liefert mir einen Rekord.

17:18.690 --> 17:22.070
Das bedeutet, aj ist der größte Wert der ersten j.

17:22.990 --> 17:25.430
Und dann zählen wir die Anzahl der Rekorde.

17:25.550 --> 17:28.290
Also xn gibt die Anzahl der Rekorde an.

17:28.410 --> 17:29.510
Wir haben eine Indikatorsumme.

17:30.730 --> 17:32.910
Die Wahrscheinlichkeiten kennen wir, der aj.

17:32.910 --> 17:33.310
Das ist ein Rekord.

17:33.670 --> 17:36.030
Und auf dem Übungsplan sollen Sie sich überlegen, dass die Ereignisse

17:36.030 --> 17:37.390
stochastisch unabhängig sind.

17:41.010 --> 17:44.070
Überlegen Sie sich vielleicht auch, ob Sie das intuitiv einsehen,

17:44.270 --> 17:45.750
warum die stochastisch unabhängig sind.

17:47.370 --> 17:48.170
Intuitiv wäre z.B.

17:48.310 --> 17:49.030
folgendes Argument.

17:49.190 --> 17:52.790
Stellen Sie sich vor, die von links gesehen, die fünfte Karte, da die

17:52.790 --> 17:55.850
ganz in der Mitte liegt, würden Sie Informationen bekommen, das ist

17:55.850 --> 17:56.450
ein Rekord.

17:57.610 --> 17:58.590
Das Ereignis tritt ein.

18:01.450 --> 18:04.270
Sollen Sie unter dieser Bedingung vielleicht sagen, mit welcher

18:04.270 --> 18:07.030
Wahrscheinlichkeit ist denn die vierte aufgedeckte Karte ein Rekord?

18:07.230 --> 18:08.870
Also tritt dann auch h4 ein.

18:09.250 --> 18:12.270
Und wenn Sie wissen, die fünfte Karte ist die größte der ersten fünf,

18:12.390 --> 18:14.010
nur diese Info kriegen Sie, nur die Info.

18:14.070 --> 18:15.830
Die fünfte ist die größte der ersten fünf.

18:16.090 --> 18:19.010
Das sagt überhaupt nichts aus über die Reihenfolge der ersten vier

18:19.010 --> 18:19.390
Karten.

18:20.810 --> 18:21.750
Das ist das Entscheidende.

18:23.610 --> 18:26.470
Das heißt, die vierte kann die größte der ersten vier sein, die

18:26.470 --> 18:29.270
zweitgrößte, die drittgrößte oder die viertgrößte, die kleinste.

18:31.190 --> 18:32.350
Der Zufall ist blind.

18:32.350 --> 18:35.810
Das heißt, diese Info liefert Ihnen überhaupt nichts über die

18:35.810 --> 18:36.990
Reihenfolge der Karten davor.

18:37.870 --> 18:40.290
Sie sollen das natürlich auch formal abzählen mit Permutation.

18:41.790 --> 18:44.710
Aber Sie sollten auch immer ein intuitives Verständnis entwickeln,

18:44.910 --> 18:46.950
warum das eben dann auch unabhängig ist.

18:49.050 --> 18:49.230
Okay?

18:51.250 --> 18:53.270
Gut, die Wahrscheinlichkeiten kennen wir.

18:53.410 --> 18:54.410
Die sind alle 1 durch j.

18:54.810 --> 18:56.110
Das haben wir uns vorher überlegt.

18:56.330 --> 18:57.350
Und jetzt kommt die Varianz.

18:57.610 --> 19:00.230
Nun, jetzt fällt der ganze Rattenschwanz weg wegen der Unabhängigkeit.

19:00.230 --> 19:02.650
Ich habe nur Summe der Varianzen.

19:04.550 --> 19:08.990
Ja, und die Varianzen sind Summe dieser p von aj mal 1 minus p von aj.

19:09.150 --> 19:10.230
Ich trenne das jetzt.

19:10.730 --> 19:13.510
Summe p von aj, ja, ich trenne es jetzt noch nicht.

19:13.630 --> 19:16.570
Summe 1 durch j mal 1 minus 1 durch j, jetzt trenne ich es.

19:17.030 --> 19:20.230
Jetzt sage ich, das ist Summe 1 durch j minus Summe 1 durch j².

19:20.770 --> 19:23.630
Und diese beiden Summanen haben natürlich völlig unterschiedliche

19:23.630 --> 19:25.230
Größenordnungen, wenn jetzt n wächst.

19:25.450 --> 19:27.610
Lassen wir n gedanklich gegen unendlich gehen.

19:27.610 --> 19:31.470
Die erste Summe 1 durch j verhält sich im Wesentlichen wie Logarithmus

19:31.470 --> 19:31.670
n.

19:33.090 --> 19:36.350
Die zweite Reihe, wenn Sie n gegen unendlich gehen lassen,

19:36.490 --> 19:37.050
konvergiert.

19:37.370 --> 19:40.630
Der Grenzwert ist pi²⁶, also das geht gegen eine Konstante.

19:41.170 --> 19:44.310
Das bedeutet, für n gegen unendlich haben Sie das, Schlange,

19:44.710 --> 19:45.410
Logarithmus n.

19:45.490 --> 19:50.570
Das bedeutet, das, was links von der Schlange steht, ist eine

19:50.570 --> 19:54.690
Zahlenfolge, dividiert durch Logarithmus von n, konvergiert für n

19:54.690 --> 19:55.830
gegen unendlich gegen 1.

19:59.750 --> 20:02.370
Das sieht man eigentlich unmittelbar ein.

20:02.710 --> 20:05.610
Diese erste Summe 1 durch j, dividiert durch Logarithmus n,

20:05.710 --> 20:06.610
konvergiert gegen 1.

20:06.890 --> 20:09.910
Machen Sie eine einfache Integralabschätzung nach oben und unten.

20:10.870 --> 20:14.270
Und die zweite konvergiert ja, das heißt, dividiert durch Logarithmus

20:14.270 --> 20:15.030
n geht gegen 0.

20:16.450 --> 20:17.310
Also das ist die Größenordnung.

20:18.030 --> 20:21.010
Das war die gleiche Größenordnung wie beim Erwartungswert.

20:21.450 --> 20:25.310
Das bedeutet, für n gegen unendlich ist der Erwartungswert der Zahl

20:25.310 --> 20:28.330
der Rekorde, der ist ja ziemlich niedrig, also Logarithmus n wächst

20:28.330 --> 20:30.830
sehr, sehr langsam, aber die Varianz ist von der gleichen

20:30.830 --> 20:31.610
Größenordnung.

20:32.450 --> 20:35.510
Bis auf dieses, was man da subvariiert, Pi Quadrat Sechstel.

20:41.860 --> 20:43.540
Sind da noch Fragen zu?

20:44.380 --> 20:50.800
Das waren jetzt also zwei Beispiele zu Varianzen und Indikatorsummen.

20:51.120 --> 20:53.340
Wir können uns zum Beispiel mal in der Übungsaufgabe überlegen,

20:54.180 --> 20:56.080
Permutationen können auch Fixpunkte haben.

20:56.080 --> 20:59.560
Also eine Zahl wird auf sich selbst abgebildet, nennt man Fixpunkt.

21:00.740 --> 21:05.020
Wie ist die Verteilung der Fixpunkte, Anzahl der Fixpunkte, Varianz,

21:05.160 --> 21:08.040
Erwartungswert, Verteilung, vielleicht was passiert für n gegen

21:08.040 --> 21:08.640
unendlich.

21:12.670 --> 21:16.570
Gut, hier nochmal ein Memo, das ich jetzt aber noch nicht aufpoppen

21:16.570 --> 21:16.810
lasse.

21:16.970 --> 21:20.550
Wir haben jetzt erstmal einen neuen Begriff, Satz und Definition.

21:20.730 --> 21:22.950
Wir machen das dann an passender Stelle, wenn wir es brauchen.

21:23.730 --> 21:26.790
Und zwar, die Definition ist Standardisierung.

21:26.790 --> 21:30.690
Das ist also eine wichtige Operation mit einer Zufallsvariante.

21:31.270 --> 21:34.450
Stellen Sie sich vor, die habe positive Varianz, sei also nicht

21:34.450 --> 21:37.850
entartet, dass sie nur einen Wert mit Wahrscheinlichkeit 1 annimmt.

21:38.490 --> 21:42.790
Dann heißt X-Schlange, und Sie sehen, was jetzt passiert, das ist eine

21:42.790 --> 21:43.830
affine Transformation.

21:44.510 --> 21:48.090
Sie nehmen das X und subtrahieren den Erwartungswert von X.

21:48.770 --> 21:51.650
Und dann, wenn Sie das gemacht haben, dividieren Sie durch die

21:51.650 --> 21:54.610
Standardabweichung, durch die Wurzel aus der Varianz.

21:54.610 --> 21:59.110
Und diese Bildung nennt man die zu X standardisierte Zufallsvariante

21:59.110 --> 22:00.870
oder die Standardisierung von X.

22:01.090 --> 22:02.770
Das war die Definition.

22:03.610 --> 22:05.310
So, jetzt kommt der Satz, Teil.

22:06.610 --> 22:10.210
Der Übergang erstmal von X zu dieser neuen Zufallsvariante nennt man

22:10.210 --> 22:12.710
auch Standardisierung, das ist immer noch Definition.

22:13.830 --> 22:16.490
Und jetzt kommt der Satz, es gilt E von X-Schlange, und jetzt sehen

22:16.490 --> 22:17.510
Sie ein erstes Memo.

22:17.970 --> 22:20.910
Das war Rechnen mit Erwartungswerten, affine Transformation.

22:21.790 --> 22:23.970
Der Erwartungswert ist linear.

22:25.050 --> 22:27.610
Erwartungswert einer Konstanten ist die Konstante selbst.

22:28.190 --> 22:29.290
Jetzt sehen Sie, was Sie hier machen.

22:29.370 --> 22:31.490
Sie können das natürlich auch folgendermaßen sehr einfach sehen.

22:31.590 --> 22:32.430
Schauen Sie in den Zähler.

22:32.890 --> 22:34.450
Da steht X minus E von X.

22:35.370 --> 22:38.930
Und dann wird das durch etwas dividiert, eine Zahl.

22:39.270 --> 22:42.550
Nun, der Erwartungswert des Zählers, nur den Erwartungswert des

22:42.550 --> 22:46.510
Zählers an, da steht der Erwartungswert von einer Zufallsvariante

22:46.510 --> 22:47.890
minus einer Konstanten.

22:47.890 --> 22:50.910
Das ist nichts anderes als der Erwartungswert der Zufallsvariante X

22:50.910 --> 22:52.490
minus die Konstante.

22:52.670 --> 22:54.070
Die Konstante ist aber E von X.

22:54.510 --> 22:58.650
Also ist der Erwartungswert des Zählers E von X minus E von X und das

22:58.650 --> 22:59.070
ist 0.

23:00.070 --> 23:02.150
Das heißt, der Erwartungswert des Zählers ist 0.

23:02.630 --> 23:05.610
Und wenn Sie das multiplizieren mit 1 durch Wurzel aus Varianz von X,

23:05.890 --> 23:06.890
dann bleibt das 0.

23:07.510 --> 23:10.070
Das heißt, es geht ja nur als Faktor ein in den Erwartungswert.

23:10.350 --> 23:13.730
Das heißt, Sie erkennen, der Erwartungswert von X-Schlange ist nach

23:13.730 --> 23:14.490
Bildung 0.

23:15.270 --> 23:16.990
So, das ist die Varianz von X-Schlange.

23:16.990 --> 23:19.970
So, bei der Varianz von X-Schlange sehen Sie jetzt im Memo die

23:19.970 --> 23:21.190
Rechenregel für die Varianz.

23:21.790 --> 23:24.430
Eine additive Konstante beeinflusst die Varianz nicht.

23:24.730 --> 23:27.190
Aber ein Faktor geht quadratisch ein.

23:27.830 --> 23:28.850
So, jetzt schauen Sie sich wieder an.

23:29.250 --> 23:30.350
Schauen Sie erst auf den Zähler.

23:31.030 --> 23:32.970
Der Zähler ist X minus E von X.

23:33.290 --> 23:34.610
Was ist die Varianz des Zählers?

23:34.730 --> 23:36.990
Nun, E von X ist eine additive Konstante.

23:37.090 --> 23:37.730
Ich subtrahiere.

23:37.830 --> 23:39.430
E von X spielt keine Rolle für die Varianz.

23:39.670 --> 23:41.670
Die Varianz des Zählers ist Varianz von X.

23:44.470 --> 23:46.070
So, aber jetzt haben Sie diesen Faktor.

23:46.070 --> 23:50.270
Der Faktor, der da oben in dem Memo A ist, ist 1 durch Wurzelvarianz.

23:50.370 --> 23:51.610
Und der geht quadratisch ein.

23:51.710 --> 23:55.130
Das heißt, es geht ein 1 durch Wurzelvarianz mal Wurzelvarianz.

23:55.230 --> 23:56.510
Also 1 durch Varianz.

23:57.750 --> 23:59.210
Damit müssen wir die Varianz multiplizieren.

23:59.910 --> 24:01.550
Die Varianz des Zählers war Varianz von X.

24:01.670 --> 24:03.250
Dividiert durch Varianz von X ist 1.

24:03.650 --> 24:07.550
So, das bedeutet, die Varianz dieser standardisierten Zufallsvariante

24:07.550 --> 24:08.110
ist 1.

24:10.750 --> 24:12.090
Das ist eine wichtige Bildung.

24:12.170 --> 24:14.690
Man möchte manchmal Erwartungswert 0 und Varianz 1 haben.

24:14.690 --> 24:17.910
Und das kann man durch diesen einfachen Übergang dann erreichen.

24:19.490 --> 24:20.410
Also, Merkregel.

24:20.690 --> 24:22.930
Das ist der häufigste Fehler in Klausuren.

24:23.950 --> 24:26.510
Dann wird beim Standardisieren manchmal durch die Varianz geteilt.

24:26.630 --> 24:29.530
Nein, das heißt standardisieren, weil eben durch die

24:29.530 --> 24:31.150
Standardabweichung geteilt wird.

24:31.230 --> 24:34.690
Das ist dann die Eselsbrücke, damit man da keine Punkte einbüßt.

24:37.390 --> 24:37.850
Beispiel.

24:38.770 --> 24:42.690
X ist binomialverteilt mit N und P. Muss man nur wissen, naja, was ist

24:42.690 --> 24:43.510
jetzt das X-Schlange?

24:43.610 --> 24:47.290
Ich muss den Erwartungswert subtarieren und der ist N mal P. Und ich

24:47.290 --> 24:49.330
muss teilen, hier wichtig, Wurzeln.

24:49.430 --> 24:52.190
Die Varianz haben wir eben gesehen, ist N mal P mal 1 minus P. Das

24:52.190 --> 24:55.250
wäre das Beispiel eben einer binomialverteilten Zufallsvariante.

24:59.000 --> 25:02.960
Okay, jetzt kommt auch eine wichtige Ungleichung.

25:03.140 --> 25:06.640
Sie sehen, das soll eine Ungleichung sein zwischen Zufallsvariablen.

25:06.740 --> 25:11.400
Wenn eine Zufallsvariante U kleiner gleich V ist, elementweise auf

25:11.400 --> 25:15.320
Omega, das bedeutet U von kleinen Omega kleiner gleich V von kleinen

25:15.320 --> 25:18.840
Omega für jedes Omega, dann überträgt sich diese Ungleichung auf die

25:18.840 --> 25:19.720
Erwartungswerte.

25:20.240 --> 25:24.560
Der Erwartungswert ist nicht nur ein linearer Operator, sondern auch

25:24.560 --> 25:25.900
ein monotoner Operator.

25:27.160 --> 25:28.800
Das haben wir gehabt bei Erwartungswert.

25:29.520 --> 25:34.120
Und zweite Regel, Erwartungswertindikator eines Ereignisses A ist die

25:34.120 --> 25:35.080
Wahrscheinlichkeit von A.

25:35.760 --> 25:38.900
Soll man das jetzt beherzigen, dann ist das, was jetzt kommt, ganz

25:38.900 --> 25:39.280
einfach.

25:40.280 --> 25:44.740
Chebyshev -Ungleichung, russischer Mathematiker, wichtige allgemeine

25:44.740 --> 25:45.280
Ungleichung.

25:47.100 --> 25:51.300
Für jedes, das habe ich extra dazu geschrieben, normalerweise ist

25:51.300 --> 25:53.520
Epsilon immer klein und geht dann später gegen Null.

25:53.700 --> 25:58.260
Hier für jedes noch so große Epsilon, denken Sie jetzt ein großes

25:58.260 --> 26:05.020
Epsilon, gilt die Wahrscheinlichkeit, dass sich eine Zufallsvariable

26:05.020 --> 26:09.420
von ihrem Erwartungswert betragsmäßig um mindestens Epsilon

26:09.420 --> 26:10.440
unterscheidet.

26:11.840 --> 26:16.140
Diese Wahrscheinlichkeit können Sie nach oben abschätzen, durch die

26:16.140 --> 26:19.300
Varianz der Zufallsvariable, dividiert durch Epsilon-Quadrat.

26:21.400 --> 26:23.760
Hier sehen Sie natürlich, dass es keinen Sinn macht, zu kleine

26:23.760 --> 26:27.040
Epsilons zu betrachten, denn dann wird irgendwann mal die rechte Seite

26:27.040 --> 26:28.200
größer als 1.

26:28.200 --> 26:31.260
Aber die Wahrscheinlichkeit ist ja sowieso nur 1.

26:31.420 --> 26:34.620
Also die Ungleichung macht nur Sinn, wenn die rechte Seite klein ist.

26:34.720 --> 26:36.220
Die muss kleiner als 1 werden.

26:36.540 --> 26:40.580
Aber zum Beispiel, wenn die Varianz 1 ist und Sie setzen Epsilon

26:40.580 --> 26:43.500
gleich ein Zehntel, dann teilen Sie durch ein Hundertstel...

26:43.500 --> 26:46.080
Entschuldigung, Sie setzen Epsilon gleich 10.

26:46.160 --> 26:47.380
Ich will ein großes haben.

26:47.640 --> 26:49.840
Dann teilen Sie durch 10 Quadrat und das ist 100.

26:50.240 --> 26:54.000
Das heißt, diese Wahrscheinlichkeit ist höchstens ein Hundertstel.

26:55.660 --> 26:58.900
Man ist so gefangen bei diesem Epsilon, dass man immer nur an diese

26:58.900 --> 26:59.980
kleinen Epsilons denkt.

27:00.140 --> 27:02.880
Aber das ist der typische Buchstabe dieser Ungleichung.

27:02.980 --> 27:04.320
Deshalb noch so großes Epsilon.

27:05.060 --> 27:06.300
Okay, der Beweis.

27:06.940 --> 27:10.460
Also der Beweis wird hier im Wesentlichen durch scharfes Hingucken

27:10.460 --> 27:10.840
geführt.

27:10.980 --> 27:11.820
Ich mache mal ein Bild.

27:12.100 --> 27:14.180
In dem Bild sehen Sie, baut sich was auf.

27:14.260 --> 27:16.800
Sie sehen hier die reelle Achse, beschriftet mit X.

27:17.220 --> 27:20.120
Sie sehen hier den Erwartungswert von X und Epsilon ist positiv.

27:20.120 --> 27:24.520
Sie sehen hier E von X minus Epsilon und Sie sehen da E von X plus

27:24.520 --> 27:24.900
Epsilon.

27:25.080 --> 27:26.640
Also wir haben so ein symmetrisches Intervall.

27:27.900 --> 27:30.280
E von X in der Mitte plus minus Epsilon.

27:30.680 --> 27:31.480
So, was haben wir jetzt?

27:32.720 --> 27:35.260
Ja, jetzt müssen Sie das folgendermaßen interpretieren.

27:35.360 --> 27:36.960
Worauf ich hinaus will, ist folgendes.

27:37.000 --> 27:40.160
In dieser Chebyschev-Ungleichung steht rechts die Varianz.

27:40.820 --> 27:44.380
Die Varianz von X ist ja der Erwartungswert von irgendwie was.

27:44.420 --> 27:44.900
Das war das.

27:44.900 --> 27:47.740
X minus E von X in Klammern zum Quadrat.

27:48.480 --> 27:50.160
Durch Epsilon Quadrat.

27:50.680 --> 27:52.320
Das können wir sogar noch zusammenfassen.

27:52.600 --> 27:57.120
E von, Klammer auf, X minus E von X dividiert durch Epsilon, Klammer

27:57.120 --> 27:58.420
zu, zum Quadrat.

27:58.920 --> 28:02.880
Also auf der rechten Seite steht der Erwartungswert von irgendwas zum

28:02.880 --> 28:03.520
Quadrat.

28:04.360 --> 28:06.020
Auf der linken Seite steht eine Wahrscheinlichkeit.

28:06.580 --> 28:09.780
Aber oben im Memo sieht man die Wahrscheinlichkeit eines Ereignisses.

28:09.800 --> 28:12.940
Es ist auch ein Erwartungswert von einer Indikatorfunktion.

28:13.840 --> 28:15.820
Also führe ich jetzt zwei Funktionen ein.

28:16.360 --> 28:18.680
So, die eine Funktion, machen wir hier die Höhe 1.

28:19.180 --> 28:23.040
Das ist eine Parabel, die liegt auf, auf der X-Achse, in E von X.

28:23.420 --> 28:25.140
Und sie soll durch zwei Punkte gehen.

28:25.260 --> 28:28.480
Also ich nenne sie erstmal H von X als Funktion von X.

28:28.960 --> 28:33.280
Und dann sehen Sie hier eine 1 und Sie sehen da auch eine 1 und Sie

28:33.280 --> 28:34.000
sehen hier 0.

28:34.120 --> 28:36.660
Was hier entstehen soll, ist eine Indikatorfunktion.

28:37.040 --> 28:40.900
Das Entscheidende ist, die Parabel geht an der Stelle E von X plus Y

28:40.900 --> 28:41.980
durch den Punkt 1.

28:41.980 --> 28:45.960
Also hat die Höhe 1 und an der Stelle E von X minus Y hat sie auch die

28:45.960 --> 28:46.520
Höhe 1.

28:48.520 --> 28:51.580
Ansonsten, diese Indikatorfunktion, die nenne ich jetzt mal G von X,

28:52.340 --> 28:54.500
die nimmt nur die Werte 1 und 0 an.

28:54.840 --> 29:00.820
0 in dem Intervall E von X minus Y bis E von X plus Y und außerhalb

29:00.820 --> 29:01.500
den Wert 1.

29:02.760 --> 29:03.840
Jetzt können wir folgendes machen.

29:04.500 --> 29:06.140
Schreibe ich mal diese Ungleichung hin.

29:07.260 --> 29:10.620
So, diese Ungleichung ist jetzt eine Ungleichung von dem Typ, wie sie

29:10.620 --> 29:11.460
im Memo stehen.

29:11.620 --> 29:12.700
U kleiner gleich V.

29:13.720 --> 29:15.320
Das müssen Sie jetzt wie folgt lesen.

29:16.140 --> 29:18.220
Naja, das sind zwei Funktionen auf Omega.

29:19.060 --> 29:20.600
Links steht Indikator.

29:21.020 --> 29:24.600
Naja, das Argument kleinen Omega könnte ich bei dem X anbringen.

29:24.720 --> 29:28.860
X von Omega minus E von X betracht größer gleich Y.

29:29.360 --> 29:33.920
Und rechts steht dann X von Omega minus E von X dividiert durch Y in

29:33.920 --> 29:34.940
Klammern zum Quadrat.

29:34.940 --> 29:38.940
So, das X von Omega, diese Realisierung, ist natürlich ein klein X aus

29:38.940 --> 29:39.200
R.

29:41.140 --> 29:45.480
Und was man hier dann erkennt, was hier links steht, ist nichts

29:45.480 --> 29:48.140
anderes als diese Funktion G von X.

29:48.240 --> 29:49.640
Hier von G von Groß X.

29:49.680 --> 29:53.300
Ich schalte die Funktion G auf die Zufallswabe X drauf.

29:53.800 --> 29:58.040
Das ist nichts anderes als dieser Indikator, der 1 ist, wenn eben X

29:58.040 --> 30:02.060
minus E von X den Betrag nach größer gleich Y ist und dann sonst 0.

30:02.060 --> 30:04.680
0 ist eben, wenn ich in das Intervall falle.

30:05.460 --> 30:06.300
So, was ist rechts?

30:06.400 --> 30:08.820
Rechts ist nichts anderes als die Funktion H von X.

30:09.300 --> 30:10.800
Nämlich genau diese Parabel.

30:12.660 --> 30:15.340
Auch hier punktweise auf Omega.

30:15.940 --> 30:21.120
H von X an der Stelle Omega ist H von X von Omega und Groß X von Omega

30:21.120 --> 30:22.140
ist das klein X.

30:22.360 --> 30:24.860
Das sind die Realisierungen auf der reellen Achse.

30:25.720 --> 30:29.200
Sie können das also nochmal lesen, dass die rechte Seite ist als

30:29.200 --> 30:30.440
Quadrat nicht negativ.

30:30.440 --> 30:32.940
Sie müssen zeigen, größer gleich Indikator.

30:33.020 --> 30:34.780
Wenn der Indikator 0 ist, ist nichts zu zeigen.

30:34.920 --> 30:37.400
Da steht dann 0 kleiner gleich irgendwas, was nicht negativ ist.

30:37.640 --> 30:41.100
Sie müssen nur was zeigen, wenn der Indikator den Wert 1 annimmt.

30:41.580 --> 30:45.000
Dann haben Sie aber das Ereignis, dass X minus E von X den Betrag nach

30:45.000 --> 30:46.200
größer gleich Y ist.

30:46.800 --> 30:50.040
Teilen Sie durch Y, dann steht da X minus E von X dividiert durch Y

30:50.040 --> 30:52.480
ist den Betrag nach größer gleich 1.

30:53.020 --> 30:54.200
So, jetzt schauen Sie nach rechts.

30:54.640 --> 30:57.360
X minus E von X dividiert durch Y steht da.

30:57.360 --> 30:59.800
Das ist also dem Betrag nach größer gleich 1.

30:59.940 --> 31:01.720
Also ist das Quadrat auch größer gleich 1.

31:01.800 --> 31:03.360
Und schon haben Sie die Ungleichung.

31:04.200 --> 31:04.680
Das ist alles.

31:04.840 --> 31:07.600
Das heißt, wir wenden jetzt das an, was im Memo steht.

31:07.740 --> 31:10.440
Es gilt, der Erwartungswert G von X muss dann kleiner gleich dem

31:10.440 --> 31:11.880
Erwartungswert H von X sein.

31:12.260 --> 31:14.660
Der Erwartungswert von G von X ist der Erwartungswert von dem

31:14.660 --> 31:16.760
Indikator, ist die Wahrscheinlichkeit des Ereignisses.

31:17.180 --> 31:18.540
Steht links in der Chebyschev-Ungleichung.

31:19.320 --> 31:23.720
Auf der rechten Seite steht der Erwartungswert von H von X, nämlich X

31:23.720 --> 31:25.160
minus E von X zum Quadrat.

31:25.660 --> 31:27.440
Das ist nichts anderes als die Varianz.

31:27.740 --> 31:30.420
Dividiert durch Y Quadrat, das kann ich als Faktor rausziehen.

31:30.800 --> 31:31.540
Und da steht dem Nenner.

31:31.860 --> 31:32.880
Das war der ganze Beweis.

31:35.180 --> 31:38.180
Sie sehen eine sehr durchsichtige Ungleichung.

31:38.760 --> 31:41.560
Wenn ich Wahrscheinlichkeiten abschätzen will, zum Beispiel nach oben,

31:42.100 --> 31:46.100
dann, wenn ich das als Erwartungswert einer Indikatorfunktion sehe,

31:46.200 --> 31:49.360
dann muss ich die Indikatorfunktion durch eine geeignete Funktion nach

31:49.360 --> 31:50.060
oben abschätzen.

31:50.580 --> 31:53.140
Sie werden zum Beispiel auf dem Übungsblatt Gelegenheit haben,

31:54.080 --> 31:56.820
vielleicht eine Chebyschev-Ungleichung nach oben zu haben.

31:56.900 --> 31:58.560
Stellen Sie sich vor, ich hätte nicht den Betrag.

31:58.720 --> 32:01.760
Ich hätte nur die Wahrscheinlichkeit X minus E von X größer gleich Y.

32:01.900 --> 32:04.520
Das ist ein anderes Ereignis anstelle von Betrag.

32:05.280 --> 32:06.580
Und dann gibt es eine obere Schranke.

32:06.780 --> 32:10.300
Dann steht nicht Varianz von X durch Y Quadrat, sondern Varianz von X

32:10.300 --> 32:14.200
dividiert durch Varianz von X plus Y Quadrat.

32:14.380 --> 32:17.580
Also der Nenner wird größer, damit wird die Schranke besser.

32:19.020 --> 32:21.400
Das wäre eine einseitige Ungleichung.

32:21.400 --> 32:24.000
Wenn Sie das Prinzip hier verstanden haben, sollen Sie auch die

32:24.000 --> 32:24.900
Aufgabe lösen können.

32:27.040 --> 32:28.620
Also Chebyschev-Ungleichung.

32:28.880 --> 32:32.760
Spezialfall, wenn die Zufallswahl selbst schon standardisiert ist, ist

32:32.760 --> 32:36.480
die Varianz hier 1 und dann ist der Erwartungswert 0.

32:36.740 --> 32:40.200
Also steht dann einfach die Wahrscheinlichkeit X-Schlange, Betrag

32:40.200 --> 32:43.580
größer gleich Y, kleiner gleich 1 durch Y Quadrat.

32:43.880 --> 32:46.360
Also jetzt das Beispiel wieder Y gleich 10.

32:46.980 --> 32:49.240
Eine X-Schlange, Betrag größer gleich 10 ist höchstens ein

32:49.240 --> 32:49.820
Hundertstel.

32:55.180 --> 32:56.140
Okay, gut.

32:57.220 --> 32:59.980
Ja, jetzt möchte ich auf einen neuen Punkt kommen.

33:00.460 --> 33:03.500
Wir kennen diese Regel, Erwartungswert der Summe ist Summe der

33:03.500 --> 33:06.320
Erwartungswerte, immer vorausgesetzt, dass die Erwartungswerte alle

33:06.320 --> 33:07.040
existieren.

33:07.180 --> 33:11.060
Im Allgemeinen ist aber die Varianz einer Summe nicht die Summe der

33:11.060 --> 33:11.300
Varianzen.

33:12.960 --> 33:14.880
Das werden wir uns kurz überlegen, das geht ganz schnell.

33:15.480 --> 33:17.980
Ich versuche mal die Varianz der Summe auszurechnen, direkt.

33:18.160 --> 33:19.360
Ich mache das nach Definition.

33:19.360 --> 33:24.120
Die Definition besagt, okay, nimm den Erwartungswert, wovon, nimm

33:24.120 --> 33:28.420
diese Zufallsvariable, die heißt jetzt nur X plus Y, subtrahiere deren

33:28.420 --> 33:33.380
Erwartungswert, subtrahieren wir den mal, quadriere das und dann davon

33:33.380 --> 33:34.360
nimm den Erwartungswert.

33:34.440 --> 33:37.220
Das ist nach Definition die Varianz von X plus Y.

33:38.320 --> 33:41.340
Bilden Sie gedanklich X plus Y gleich Z, dann steht da Erwartungswert

33:41.340 --> 33:43.320
von Z minus E von Z in Klammern zum Quadrat.

33:44.680 --> 33:47.840
So, was wir jetzt machen, ich sortiere das ein bisschen um, der

33:47.840 --> 33:50.860
Erwartungswert ist additiv, Sie sehen, was ich abziehe, ist der

33:50.860 --> 33:54.560
Erwartungswert von X plus Y, der ist E von X plus E von Y, also kann

33:54.560 --> 33:58.040
ich sagen, ich nehme erstmal X minus E von X, dann nehme ich Y minus E

33:58.040 --> 33:59.580
von Y und das quadriere.

33:59.680 --> 34:00.860
Ich habe nur ein bisschen umsortiert.

34:02.160 --> 34:05.220
So, jetzt kommt die binomische Formel, Clim plus Bim in Klammern zum

34:05.220 --> 34:08.700
Quadrat, Clim Quadrat plus 2 Clim Bim plus Bim Quadrat, das heißt, wir

34:08.700 --> 34:11.160
machen nichts mit dem Erwartungswert, wir rechnen erstmal darunter

34:11.160 --> 34:11.580
aus.

34:11.700 --> 34:16.940
Also, das erste zum Quadrat plus zweimal das gemischte Glied plus Y

34:16.940 --> 34:19.320
minus E von Y zum Quadrat, Klammer zu.

34:21.000 --> 34:23.080
Jetzt wenden wir den Erwartungswert an.

34:24.100 --> 34:27.820
Erwartungswert ist linear, immer das gleiche Mantra, irgendwann kann

34:27.820 --> 34:30.260
man es nicht mehr hören, aber man muss einfach die Techniken wirklich

34:30.260 --> 34:30.860
verinnerlichen.

34:31.500 --> 34:33.500
So, das heißt, ist der Erwartungswert des Ersten.

34:33.940 --> 34:35.520
So, jetzt kommt dieser mittlere Term.

34:36.060 --> 34:38.860
Okay, ich suche nach konstanten Faktoren.

34:39.260 --> 34:40.520
Habe ich konstante Faktoren?

34:40.620 --> 34:41.440
Habe ich, habe ich.

34:41.440 --> 34:44.960
Okay, ich habe natürlich hier, super, ich habe die 2 als konstanten

34:44.960 --> 34:49.720
Faktor und ich habe noch, was habe ich denn noch als konstanten

34:49.720 --> 34:50.100
Faktor?

34:50.180 --> 34:52.360
Sonst habe ich, glaube ich, nichts als konstanten Faktor, nur die 2,

34:52.460 --> 34:52.780
nur die 2.

34:52.900 --> 34:54.880
Das ist ein bisschen wenig, aber nehmen wir die mal.

34:55.180 --> 34:56.140
Das heißt, was bleibt über?

34:56.400 --> 35:00.920
Es bleibt über der Erwartungswert noch von Y minus E von Y in Klammern

35:00.920 --> 35:01.560
zum Quadrat.

35:01.760 --> 35:02.620
Das heißt, wir haben das.

35:07.540 --> 35:07.740
Okay.

35:10.940 --> 35:11.920
Ja, wie geht es weiter?

35:13.060 --> 35:14.460
Ich sortiere jetzt ein bisschen um.

35:14.640 --> 35:17.620
Sie sehen, links steht eben der Erwartungswert von X minus E von X in

35:17.620 --> 35:18.320
Klammern zum Quadrat.

35:18.440 --> 35:20.140
Das ist die Varianz von X nach Definition.

35:20.920 --> 35:24.980
Ganz rechts, der Summand, ist die Varianz von Y nach Definition.

35:25.060 --> 35:25.940
Jetzt ziehe ich auch nach vorne.

35:26.400 --> 35:28.320
Und dann bleibt dieses über, was da steht.

35:28.380 --> 35:29.740
Und das färbe ich jetzt mal rot ein.

35:31.560 --> 35:32.280
Das ist jetzt neu.

35:32.840 --> 35:35.920
Das heißt, die Varianz der Summe ist Summe der Varianzen.

35:36.060 --> 35:38.980
Jetzt kommt wohl noch irgendwas hinzu, von dem man vielleicht hofft,

35:39.020 --> 35:39.700
dass es Null ist.

35:40.380 --> 35:42.060
Aber das ist im Allgemeinen nicht Null.

35:45.120 --> 35:46.000
Also, Definition.

35:47.100 --> 35:48.820
Kovarianz und Unkorreliertheit.

35:49.340 --> 35:51.920
Wenn ich zwei Zufallsvariablen habe, das ist immer die

35:51.920 --> 35:56.280
Grundvoraussetzung, es existiert E von X Quadrat, E von Y Quadrat,

35:56.360 --> 35:58.520
dann existieren auch alle weiteren Erwartungswerte.

35:59.600 --> 36:03.940
Dann heißt, wir sehen hier schon ein C, C von XY, das ist genau dieser

36:03.940 --> 36:09.680
Ausdruck, der Erwartungswert des Produktes der Zufallsvariablen X und

36:09.680 --> 36:13.000
Y, nachdem ich vorher die Erwartungswerte subtrahiert habe.

36:13.080 --> 36:14.260
Das nennt man zentrieren.

36:14.440 --> 36:18.380
X minus E von X mal Y minus E von Y.

36:20.140 --> 36:24.220
Dieser Ausdruck heißt Kovarianz von X und Y.

36:24.400 --> 36:26.120
Man sagt auch zwischen X und Y.

36:26.900 --> 36:28.660
Das ist ein neuer Begriff, die Kovarianz.

36:28.880 --> 36:32.300
Es sind also zwei Zufallsvariablen beteiligt und damit eine gemeinsame

36:32.300 --> 36:33.020
Verteilung.

36:33.020 --> 36:34.740
Hier brauche ich beide.

36:37.140 --> 36:41.500
Man nennt die beiden Zufallsvariablen unkorreliert, wenn dieser

36:41.500 --> 36:42.420
Ausdruck Null ist.

36:42.960 --> 36:44.720
Andernfalls sind sie korreliert.

36:45.440 --> 36:48.440
Sie sehen also, das Unkorreliertsein ist etwas besonders Schönes.

36:49.520 --> 36:50.380
Dann fällt es weg.

36:52.540 --> 36:55.740
Folgendes noch, beachte, dieser Erwartungswert, der da steht,

36:55.940 --> 36:56.660
existiert.

36:57.040 --> 36:59.200
Diese Kovarianz ist ja ein Erwartungswert.

36:59.200 --> 37:01.060
Wir sehen dieses Produktes.

37:01.860 --> 37:05.420
Und der existiert aus dem Grunde, es gilt für reelle Zahlen immer die

37:05.420 --> 37:09.280
Ungleichung U mal V Betrag kleiner gleich ein Halbmal, Klammer auf U

37:09.280 --> 37:10.480
Quadrat plus V Quadrat.

37:10.580 --> 37:11.840
Gilt für alle reellen Zahlen.

37:12.460 --> 37:16.200
Also gilt punktweise auf dem Wahrscheinlichkeitsraum, für U setzen Sie

37:16.200 --> 37:20.360
jetzt ein Groß X minus E von X und für V setzen Sie ein Groß Y minus E

37:20.360 --> 37:20.700
von Y.

37:20.960 --> 37:23.900
Dann gilt also auf dem Wahrscheinlichkeitsraum der Betrag dieses

37:23.900 --> 37:27.700
Produktes, von dem wir den Erwartungswert bilden sollen, ist kleiner

37:27.700 --> 37:32.180
gleich ein Halbmal X minus E von X in Klammern zum Quadrat plus Y

37:32.180 --> 37:34.260
minus E von Y in Klammern zum Quadrat.

37:34.600 --> 37:37.760
Und die Erwartungswerte existieren, das war die Grundvoraussetzung, E

37:37.760 --> 37:40.820
von X Quadrat ist endlich und E von Y Quadrat ist endlich.

37:40.960 --> 37:42.880
Das heißt, diese Kovarianz existiert wirklich.

37:43.340 --> 37:47.260
Es ist einfach nur ein Majorantenkriterium, wenn wir hier unendliche

37:47.260 --> 37:49.280
Grundräume haben und mit Reihen rechnen müssen.

37:51.100 --> 37:53.020
Okay, also das wäre jetzt der Begriff.

37:54.240 --> 37:57.820
Kovarianz, wir werden gleich noch auf die Korrelation zu sprechen

37:57.820 --> 38:00.960
kommen, das steht zwar hier schon drin, unkorreliert, aber bislang

38:00.960 --> 38:04.820
haben wir noch keinen Korrelationskoeffizienten gebildet, nur für

38:04.820 --> 38:07.980
Daten, haben wir es an empirischen mal gehabt, aber noch nicht für

38:07.980 --> 38:09.980
Zufallsvariante, das kommt dann aber gleich.

38:11.960 --> 38:16.280
Okay, das ist nochmal die Definition der Kovarianz, Erwartungswert des

38:16.280 --> 38:21.080
Produktes der zentrierten Zufallsvariante, X wird zentriert, also

38:21.080 --> 38:25.300
subtrahiere den Erwartungswert, Y wird zentriert, subtrahiere den

38:25.300 --> 38:28.560
Erwartungswert, dann multipliziere und dann bilde den Erwartungswert.

38:29.060 --> 38:30.780
Jetzt kommen elementare Eigenschaften.

38:31.260 --> 38:33.240
Und diese Kovarianz hat folgende Eigenschaften.

38:33.320 --> 38:37.100
Erstens, die Kovarianz von X und Y ist der Erwartungswert des

38:37.100 --> 38:40.880
Produktes minus Produkt der Erwartungswerte.

38:41.160 --> 38:43.760
Ich habe hier eine andere Möglichkeit, sie darzustellen.

38:44.440 --> 38:46.600
So, das sieht man durch scharfes Hingucken.

38:46.740 --> 38:50.140
Schauen Sie sich die Definition an und schauen Sie sich in der

38:50.140 --> 38:52.500
Definition an, Sie würden das mal ausmultiplizieren.

38:52.880 --> 38:57.000
X minus E von X in Klammern mal Y minus E von Y in Klammern.

38:57.120 --> 38:58.320
Fangen Sie mal an zu multiplizieren.

38:58.860 --> 39:01.020
Dann bekommen Sie einen Faktor, auf jeden Fall X mal Y.

39:02.500 --> 39:07.660
Dann bekommen Sie minus konstante Erwartungswert von X mal Y.

39:08.140 --> 39:12.400
Dann bekommen Sie noch mit einem Minuszeichen E von Y als konstante

39:12.400 --> 39:12.920
mal X.

39:12.920 --> 39:15.900
Und dann kommen Sie mit einem Pluszeichen das Produkt der beiden

39:15.900 --> 39:16.820
Erwartungswerte.

39:17.600 --> 39:20.380
Das heißt, wenn Sie das ausmultiplizieren, haben Sie vier Terme.

39:20.800 --> 39:23.380
Sie wollen den Erwartungswert bilden, das ist aber additiv.

39:23.900 --> 39:25.140
Der erste Term war X mal Y.

39:25.620 --> 39:28.520
Also haben Sie auf jeden Fall den Erwartungswert von X mal Y und der

39:28.520 --> 39:29.040
steht schon da.

39:29.860 --> 39:32.680
Jetzt haben Sie mit einem Minuszeichen den Erwartungswert der

39:32.680 --> 39:34.640
konstanten E von X mal Y.

39:34.900 --> 39:37.220
Das ist aber nichts anderes als die konstante E von X mal

39:37.220 --> 39:38.300
Erwartungswert von Y.

39:38.960 --> 39:43.080
Und das andere Minuszeichen führt auch zu Erwartungswert von X mal

39:43.080 --> 39:44.060
Erwartungswert von Y.

39:44.220 --> 39:45.500
Also ziehen Sie das doppelt ab.

39:46.380 --> 39:49.940
Und am Ende haben Sie die konstante E von X mal konstante E von Y.

39:50.340 --> 39:52.640
Und der Erwartungswert der konstanten ist die konstante.

39:52.720 --> 39:55.860
Am Ende addieren Sie noch mal E von X mal E von Y.

39:56.340 --> 39:57.820
Das hebt sich dann wieder weg einmal.

39:58.320 --> 40:01.640
Und es bleibt über Erwartungswert des Produktes, Minusprodukt der

40:01.640 --> 40:02.340
Erwartungswerte.

40:02.780 --> 40:03.520
Wichtige Regel.

40:04.680 --> 40:07.540
Das heißt, die Erwartungswerte einzeln.

40:07.640 --> 40:09.580
Da brauchen Sie gar nicht die gemeinsame Verteilung.

40:09.660 --> 40:11.940
Da reichen die Marginalverteilungen völlig aus.

40:12.060 --> 40:15.080
Aber wenn Sie den Erwartungswert des Produktes bilden, dann brauchen

40:15.080 --> 40:16.320
Sie die gemeinsame Verteilung.

40:17.800 --> 40:18.600
Zweite Eigenschaft.

40:18.720 --> 40:23.720
Wenn Sie für X gleich Y setzen, dann sehen Sie natürlich, was steht

40:23.720 --> 40:23.880
da?

40:23.940 --> 40:25.000
E von X Quadrat.

40:25.080 --> 40:28.660
Wenn Sie direkt nach A gucken, Minus E von X in Klammern zum Quadrat.

40:28.920 --> 40:30.360
Das ist nichts anderes als die Varianz von X.

40:30.960 --> 40:33.080
Das heißt, Sie dürfen auch X gleich Y setzen.

40:34.500 --> 40:35.600
Dann nächste Regel.

40:35.820 --> 40:37.980
A, C von Y und X, wenn ich die beiden vertausche.

40:38.080 --> 40:39.360
Nun, Multiplikation ist kommutativ.

40:40.340 --> 40:44.900
Das heißt, diese Kovarianz ist symmetrisch in X und Y.

40:47.380 --> 40:48.180
Nächste Eigenschaft.

40:49.080 --> 40:53.140
Wenn ich da Konstanten addiere, zu X eine Konstante und zu Y eine

40:53.140 --> 40:53.700
Konstante.

40:53.820 --> 40:56.720
Jetzt schauen Sie in die Definition, in das Memo.

40:57.700 --> 41:00.060
Diese Konstante müssen Sie bei X addieren.

41:00.620 --> 41:03.720
Sie müssten sie aber auch bei X addieren, wo der Erwartungswert steht.

41:03.960 --> 41:04.740
Der hebt sich weg.

41:06.340 --> 41:08.540
Da steht dann Plus A, Minus A in der ersten Klammer.

41:09.600 --> 41:12.020
Und in der zweiten Klammer steht, bei dem Y können Sie Plus B

41:12.020 --> 41:15.820
schreiben, aber Sie ziehen dann auch den Erwartungswert von Y plus B

41:15.820 --> 41:16.100
ab.

41:16.540 --> 41:17.740
Ziehen dann auch das B wieder ab.

41:18.060 --> 41:20.580
Das heißt, solche Konstanten spielen überhaupt keine Rolle bei der

41:20.580 --> 41:21.420
Kovarianzbildung.

41:21.640 --> 41:24.560
Ganz egal, wie diese reellen Zahlen A und B sind.

41:25.300 --> 41:26.740
Wichtige weitere Erkenntnis.

41:27.840 --> 41:30.020
Das nennt man dann Verschiebungsinvarianz.

41:30.500 --> 41:32.300
Das Gleiche hatten wir schon bei der Varianz.

41:32.400 --> 41:35.900
Auch die Kovarianz ist nicht beeinflusst durch Verschiebungen dieser

41:35.900 --> 41:37.060
beiden Zufallsvariablen.

41:37.800 --> 41:40.900
Wenn Sie unabhängige Zufallsvariablen, was ist denn dann, wenn Sie

41:40.900 --> 41:41.720
unabhängig sind?

41:42.080 --> 41:45.820
Oh, da hatten wir eine Multiplikationsformel für Erwartungswerte, wenn

41:45.820 --> 41:46.480
Sie sich erinnern.

41:47.420 --> 41:50.420
Wenn zwei Zufallsvariablen unabhängig sind, ist der Erwartungswert des

41:50.420 --> 41:52.880
Produktes gleich Produkt der Erwartungswerte.

41:52.880 --> 41:55.160
Schauen wir mal, was in B steht.

41:55.300 --> 41:59.320
Da steht die Kovarianz ist Erwartungswert des Produktes minus Produkt

41:59.320 --> 42:00.140
der Erwartungswerte.

42:00.260 --> 42:02.360
Wenn die unabhängig sind, fällt das weg.

42:02.500 --> 42:05.640
Das heißt, das ist Null, weil der Erwartungswert des Produktes gerade

42:05.640 --> 42:07.460
Produkt der Erwartungswerte ist.

42:07.860 --> 42:10.160
Auch das ist sofort einzusehen.

42:10.680 --> 42:11.380
Was haben wir denn noch?

42:12.620 --> 42:14.280
Die Umkehrung ist im Allgemeinen falsch.

42:14.700 --> 42:16.140
Wir haben gleich ein Beispiel A.

42:17.080 --> 42:20.020
Aus Kovarianz Null folgt nicht notwendig Unabhängigkeit.

42:20.020 --> 42:21.540
Unabhängigkeit ist stärker.

42:23.420 --> 42:24.080
Was haben wir hier noch?

42:24.200 --> 42:29.160
Varianz der Summe ist Summe der Varianzen plus zweimal, jetzt haben

42:29.160 --> 42:33.100
wir wieder diese Summe i kleiner j, der Kovarianzen von x, i und x, j.

42:34.100 --> 42:37.440
Okay, man sieht also insbesondere, wenn die Kovarianzen alle Null

42:37.440 --> 42:40.940
sind, dann steht da Varianz der Summe ist Summe der Varianzen.

42:41.080 --> 42:44.940
Das heißt, bei Unabhängigkeit hätten wir dann das bewiesen, was ich

42:44.940 --> 42:46.100
schon vorher gesagt hatte.

42:46.100 --> 42:49.020
Diese Formel Varianz der Summe ist Summe der Varianzen bei

42:49.020 --> 42:49.680
Unabhängigkeit.

42:50.120 --> 42:51.120
So hier, was haben wir noch?

42:51.200 --> 42:54.620
Summe, wenn Sie dort zwei Linearkombinationen haben, einmal eine Summe

42:54.620 --> 42:59.260
a, i, x, i, i von 1 bis m, in welcher Zufallswahl x1 bis xm und noch

42:59.260 --> 43:04.380
eine zweite Summe b, j, y, j, j von 1 bis n, dann können Sie die

43:04.380 --> 43:05.660
beiden Summen nach vorne ziehen.

43:05.800 --> 43:08.300
Sie können auch die Konstanten rausziehen und dann bleibt über die

43:08.300 --> 43:10.560
Kovarianz von x, i und x und y, j.

43:10.560 --> 43:16.640
Das bedeutet, die Kovarianz ist ein bilinearer Operator.

43:17.480 --> 43:20.760
Sie können sie immer auf Paare von Zufallsvariablen anwenden.

43:22.340 --> 43:25.260
Sie ist auch symmetrisch, wir können vertauschen, haben wir gesehen.

43:25.620 --> 43:28.320
Wir können Summen nach vorne ziehen und Konstanten rausziehen.

43:28.600 --> 43:32.520
Also das wäre hier die wichtige Botschaft, die Kovarianz ist bilinear.

43:33.120 --> 43:36.400
Ein bilineares Funktional, und zwar worauf?

43:36.400 --> 43:38.040
Auf dem Vektorraum, L2.

43:38.240 --> 43:41.640
L2 sind alle diejenigen Zufallsvariablen auf Omega, die die

43:41.640 --> 43:45.320
Eigenschaft haben, dass der Erwartungswert von x² existiert.

43:46.040 --> 43:49.460
Da steckt eine kleine Behauptung drin, dass wirklich dann das ein

43:49.460 --> 43:50.200
Vektorraum ist.

43:50.380 --> 43:51.360
Das müssen wir natürlich zeigen.

43:51.720 --> 43:54.340
Wenn x drin liegt und y, dann auch die Summe.

43:54.460 --> 43:55.780
Einfach umgleichen.

43:55.880 --> 44:01.160
Sie werden in der Analyse 3 allgemein LP-Räume kennenlernen, Maßräume,

44:01.220 --> 44:01.860
LP -Räume.

44:02.220 --> 44:03.380
Das ist nur ein Spezialfall.

44:04.380 --> 44:08.660
Also wenn Sie das dann im Kopf haben, L2 ist nur ein Spezialfall und

44:08.660 --> 44:10.320
da haben Sie sogar allgemeine Maßräume.

44:10.560 --> 44:13.540
Wir beweisen jetzt, dass die Kovarianz bilinear ist.

44:14.520 --> 44:17.300
Dann folgt auch die andere Aussage sofort daraus.

44:17.480 --> 44:23.200
Das heißt, diese Kovarianz wollen wir untersuchen und wir gehen

44:23.200 --> 44:25.220
einfach in die Definition.

44:25.680 --> 44:28.520
Das heißt, links steht eine Zufallsvariable x und rechts steht eine

44:28.520 --> 44:31.580
Zufallsvariable y und die sind einfach nur kompliziert, solche Summen.

44:31.580 --> 44:35.320
Das heißt, die Definition war, nimm das x, subtrahiere dessen

44:35.320 --> 44:35.580
Erwartungswert.

44:36.420 --> 44:39.100
Das haben wir hier und multiplizieren das mit dem y.

44:39.400 --> 44:42.940
Das ist diese Summe und subtrahiere auch dessen Erwartungswert.

44:43.120 --> 44:43.580
Das machen wir.

44:44.180 --> 44:48.020
Jetzt erkennt man natürlich, der Erwartungswert ist ein linearer

44:48.020 --> 44:48.620
Operator.

44:48.820 --> 44:55.860
Das heißt, was ich hier subtrahiere, dieses hier, das ist nichts

44:55.860 --> 44:56.580
anderes als...

44:58.080 --> 45:00.920
Die Summe kann ich nach vorne ziehen, die Ai ist auch.

45:01.320 --> 45:03.360
Die Summe harmoniert mit der Summe davor.

45:03.520 --> 45:06.400
Das heißt, wenn ich subtrahiere, entsteht die Summe i von 1 bis m.

45:06.760 --> 45:10.620
Dann kann ich sogar Ai ausklammern und dann steht da xi minus e von

45:10.620 --> 45:10.980
xi.

45:12.280 --> 45:16.120
Ich habe nur angewendet, dass der Erwartungswert der Summe, Summe der

45:16.120 --> 45:18.560
Erwartungswert ist und die Konstanten rausziehbar sind.

45:18.820 --> 45:19.540
Und hier genauso.

45:20.180 --> 45:23.180
Hier, wenn ich das ausrechne, ziehe ich die Summe nach vorne.

45:23.580 --> 45:25.100
Ich ziehe auch noch das Biot nach vorne.

45:25.100 --> 45:27.800
Und das heißt, vorne habe ich auch die Summe stehen über j.

45:28.340 --> 45:30.960
Ich habe nichts anderes als das, was jetzt kommt auf der nächsten

45:30.960 --> 45:31.420
Folie.

45:31.800 --> 45:33.880
Nämlich hier, Sie sehen die Summe i von 1 bis n.

45:34.420 --> 45:37.200
Ai habe ich ausgeklammert, xi minus e von xi.

45:37.540 --> 45:39.520
Bei der zweiten Summe genau das Gleiche.

45:40.480 --> 45:43.180
Was ich jetzt habe, ist nur das Distributivgesetz auf R.

45:43.920 --> 45:48.040
Ich habe hier eine Doppelsumme und dann nutze ich wieder aus, dass der

45:48.040 --> 45:49.360
Erwartungswert linear ist.

45:50.020 --> 45:52.800
Das heißt, ich habe hier den Erwartungswert dieser Doppelsumme.

45:52.800 --> 45:58.040
Und jetzt steht da ai mal bj und dann steht da xi minus e von xi mal

45:58.040 --> 45:59.820
yj minus e von yj.

46:00.460 --> 46:03.300
Jetzt kommt die Rechenregel Summen nach vorne vor den

46:03.300 --> 46:05.080
Erwartungswertkonstanten nach vorne.

46:05.320 --> 46:07.900
Das heißt, ich darf hier die beiden Summen nach vorne ziehen.

46:08.300 --> 46:11.040
Ich darf ai nach vorne ziehen, ich darf bj nach vorne ziehen.

46:11.340 --> 46:15.220
Also bleibt nur noch über der Erwartungswert von xi minus e von xi mal

46:15.220 --> 46:17.600
yj minus e von yj.

46:17.720 --> 46:22.060
Und das ist nach Definition die Kurvarianz von xi und yj.

46:22.060 --> 46:25.480
Das heißt, hier habe ich nur wieder die Rechenregeln über

46:25.480 --> 46:26.940
Erwartungswerte ausgenutzt.

46:27.460 --> 46:29.400
Die ziehen sich wirklich wie ein roter Faden durch.

46:30.080 --> 46:32.540
Sollte jetzt schon zum kleinen 1 mal 1 geworden sein.

46:32.860 --> 46:33.620
Immer das Gleiche.

46:34.660 --> 46:39.120
Okay, ja zu e dann, die Varianz von xi.

46:39.780 --> 46:42.800
Nun, die Varianz, wissen wir, ist die Kurvarianz mit sich selbst.

46:43.020 --> 46:45.120
Varianz von x ist Kurvarianz von xx.

46:45.360 --> 46:48.780
Und jetzt rechnen wir die Billeniarität, nutzen wir hier aus.

46:48.780 --> 46:51.620
Das heißt, hier habe ich nichts anderes als diese Doppelsumme der

46:51.620 --> 46:52.320
Kurvarianzen.

46:53.860 --> 46:57.820
Und jetzt betrachte ich einfach nur den Fall i gleich j und i ungleich

46:57.820 --> 46:58.580
j getrennt.

46:58.720 --> 47:01.160
i gleich j habe ich dann eine Einzelsumme.

47:01.860 --> 47:05.000
Da ist jetzt die Kurvarianz von xi mit sich selbst, ist die Varianz

47:05.000 --> 47:05.520
von xi.

47:06.080 --> 47:08.480
Das haben wir auch gesehen, also habe ich die Summe der Varianzen.

47:09.200 --> 47:09.980
Was bleibt über?

47:10.200 --> 47:11.740
Die Kurvarianz ist symmetrisch.

47:12.060 --> 47:15.040
Das heißt, ich hätte eigentlich die Summe i ungleich j, aber ich

47:15.040 --> 47:17.680
schreibe wieder 2 mal Summe i kleiner j.

47:18.540 --> 47:21.940
Also erstmal schreibe ich das und jetzt schreibe ich das so, wie es

47:21.940 --> 47:23.880
eben sagte, Summe der Varianzen bleibt.

47:24.240 --> 47:27.880
Und hierfür schreibe ich jetzt 2 mal und dann die Summe i kleiner j,

47:28.020 --> 47:29.060
Kurvarianz xxj.

47:29.180 --> 47:30.660
Und das war die Formel für die Varianz.

47:30.840 --> 47:34.500
Sie sehen, die folgt dann unmittelbar, wenn man sich die Billeniarität

47:34.500 --> 47:37.060
überlegt hat, also elementare Rechnung.

47:41.270 --> 47:41.730
Gut.

47:43.530 --> 47:43.850
Memo.

47:44.290 --> 47:48.830
Die Kurvarianz ist Billeniar und die Kurvarianz ist 0, falls x und y

47:48.830 --> 47:49.850
unabhängig sind.

47:49.850 --> 47:54.330
Das haben wir gesehen, also eine hinreichende Bedingung für Kurvarianz

47:54.330 --> 47:55.010
0 ist die Unabhängigkeit.

47:55.550 --> 47:59.150
Jetzt ein einfaches Beispiel für unkorrelierte Zufallsvarianten, also

47:59.150 --> 48:01.890
Kurvarianz 0, aber sie sind nicht unabhängig.

48:02.510 --> 48:03.670
So, wie läuft das Beispiel ab?

48:03.750 --> 48:07.610
Ich starte mit zwei unabhängigen Zufallsvarianten x und y, die sollen

48:07.610 --> 48:08.910
die gleiche Verteilung haben.

48:09.570 --> 48:11.510
Wie die Verteilung aussieht, interessiert mich nicht.

48:11.630 --> 48:13.130
Sie sollen nur die gleiche Verteilung haben.

48:13.850 --> 48:15.950
So, natürlich sollen die Varianzen existieren.

48:16.030 --> 48:18.110
Wenn sie die gleiche Verteilung haben, haben sie auch den gleichen

48:18.110 --> 48:19.790
Erwartungswert und die gleiche Varianz.

48:20.990 --> 48:21.810
Was mache ich?

48:21.810 --> 48:26.890
Ich bilde mal die Kurvarianz von x plus y und x minus y und nutze die

48:26.890 --> 48:28.090
Billeniarität aus.

48:28.510 --> 48:31.430
Das heißt, ich habe zunächst mal die Kurvarianz von x mit x, das ist

48:31.430 --> 48:34.570
die Varianz von x oder Kurvarianz von x mit x.

48:34.830 --> 48:38.770
Dann habe ich die Kurvarianz von y und x, also sozusagen links vom

48:38.770 --> 48:40.730
Komma das y, rechts vom Komma das x.

48:40.730 --> 48:45.190
Dann mit dem Minuszeichen die Kurvarianz von x und y, weil vor dem y

48:45.190 --> 48:46.510
ein Minuszeichen steht.

48:46.990 --> 48:50.730
Und dann nochmal minus die Kurvarianz von y und y.

48:51.090 --> 48:52.830
Das war die Billeniarität.

48:53.990 --> 48:57.190
So, man sieht, die Kurvarianz y und x ist gleich der von x und y.

48:57.350 --> 48:59.030
Die beiden mittleren Terme heben sich auf.

48:59.130 --> 49:00.270
Die Kurvarianz ist symmetrisch.

49:01.130 --> 49:05.490
Und links steht, Kurvarianz von x und x ist die Varianz von x minus

49:05.490 --> 49:08.490
Kurvarianz von y und y ist die Varianz von y.

49:08.490 --> 49:12.010
Da die die gleiche Verteilung haben, haben sie die gleichen Varianzen

49:12.010 --> 49:12.910
und es kommt 0 raus.

49:13.490 --> 49:17.990
Das heißt, x plus y und x minus y sind unter dieser Voraussetzung

49:17.990 --> 49:20.350
unkorreliert, haben die Kurvarianz 0.

49:21.030 --> 49:22.650
Unter dieser ganz allgemeinen Voraussetzung.

49:22.930 --> 49:24.110
Jetzt machen wir einen Spezialfall.

49:25.510 --> 49:26.610
Das ist also die Botschaft.

49:26.790 --> 49:29.650
x plus y, x minus y sind unkorreliert.

49:30.610 --> 49:31.110
Beispiel.

49:31.710 --> 49:32.790
Zweifacher Würfelwurf.

49:33.210 --> 49:35.210
x beschreibt die Augenzahl des ersten Wurfs.

49:35.210 --> 49:38.230
Die Wahrscheinlichkeit, dass x gleich j ist, ist immer ein Sechstel.

49:38.310 --> 49:41.290
J von 1 bis 6 und y stehe für den zweiten Wurf.

49:41.610 --> 49:43.030
Betrachtet die beiden Augenzahlen.

49:44.690 --> 49:45.290
Gut schütteln.

49:45.430 --> 49:46.610
Ich nehme an Unabhängigkeit.

49:46.730 --> 49:47.930
Erster Wurf, zweiter Wurf.

49:48.390 --> 49:49.790
Die Voraussetzung ist gegeben.

49:51.130 --> 49:54.250
Dann ist natürlich ein Sechstendreißigstel die Wahrscheinlichkeit,

49:54.390 --> 49:57.670
dass x plus y den Wert 12 annimmt.

49:58.950 --> 50:00.010
Summe 12.

50:00.110 --> 50:02.970
Summe 12 heißt erster Wurf 6 und zweiter Wurf 6.

50:03.770 --> 50:05.570
Automatisch ist dann natürlich die Differenz 0.

50:06.290 --> 50:07.330
x minus y ist 0.

50:07.430 --> 50:08.930
Das ist nur das Paar 6,6.

50:09.770 --> 50:12.230
Das heißt, die Wahrscheinlichkeit ist ein Sechstendreißigstel.

50:14.450 --> 50:16.590
Einer von 36 möglichen Fällen.

50:16.970 --> 50:19.970
Aber das ist verschieden von dem Produkt der Wahrscheinlichkeiten.

50:20.870 --> 50:23.710
Nämlich die Wahrscheinlichkeit, dass die Summe gleich 12 ist, ist

50:23.710 --> 50:26.470
erster Wurf 6, zweiter Wurf 6, ist ein Sechstendreißigstel.

50:26.810 --> 50:29.970
Aber die Wahrscheinlichkeit, dass die Differenz 0 ist, die

50:29.970 --> 50:31.090
Wahrscheinlichkeit ist ein Sechstel.

50:31.090 --> 50:32.410
Das heißt, gleiche Augenzahlen.

50:32.850 --> 50:36.350
Erster Wurf 1, zweiter Wurf 1 oder erster Wurf 2, zweiter Wurf 2 und

50:36.350 --> 50:36.710
so weiter.

50:37.130 --> 50:39.590
Das heißt, hier steht ein Sechstendreißigstel mal ein Sechstel.

50:39.810 --> 50:44.330
Aus dem Grunde sind x plus y und x minus y nicht unabhängig.

50:44.690 --> 50:47.430
Sonst müsste ja gerade die Wahrscheinlichkeit des Schnittes, dass

50:47.430 --> 50:49.590
beide Ereignisse eintreten, gleich dem Produkt der

50:49.590 --> 50:50.550
Wahrscheinlichkeiten sein.

50:51.170 --> 50:54.190
Das heißt, wir haben ein sehr einfaches Beispiel für unkorrelierte

50:54.190 --> 50:57.050
Zufallsvariablen, die aber nicht stochastisch unabhängig sind.

50:59.860 --> 51:00.980
Ist das klar geworden?

51:01.220 --> 51:04.020
Also, ein simples Beispiel ist eine stärkere Bedingung, die

51:04.020 --> 51:06.540
Unabhängigkeit, als die Unkorreliertheit.

51:12.510 --> 51:16.030
Kleine Aufgabe, vereinfachen Sie, das ist jetzt so eine typische

51:16.030 --> 51:18.930
Klausuraufgabe, unter Verwendung der Plenarität.

51:19.230 --> 51:23.730
Zum Beispiel, was ist die Kurvvariance von 2x minus 3y, 3x minus 4y?

51:24.730 --> 51:29.110
Man muss jetzt, wie beim Klammerrechnen, einmal 2x und dann erst mal

51:29.110 --> 51:29.710
3x.

51:30.210 --> 51:34.190
Zwei Faktoren, 2 und 3, die Faktoren kommen nach vorne, 2 mal 3 ist 6,

51:34.310 --> 51:37.530
also 2 mal 3 mal die Kurvarianz von x und x erstmal.

51:38.150 --> 51:42.610
Jetzt hätte man mit dem Minuszeichen hier 3y, 3x, also minus 3 mal 3,

51:43.010 --> 51:44.450
Kurvarianz von y und x.

51:44.790 --> 51:47.990
Jetzt hätte man nochmal ein Minuszeichen, nämlich 2x und minus 4y.

51:47.990 --> 51:51.970
Das wäre dann minus 2 mal 4 mal x und y.

51:52.250 --> 51:57.190
Und dann bleibt noch über minus, minus ergibt plus, 3, 4, y, y heißt

51:57.190 --> 52:00.170
plus 3 mal 4 mal Kurvarianz von y und y.

52:00.290 --> 52:03.970
Das wäre die erste Stufe, wenn man das in Stufen machen möchte.

52:04.450 --> 52:08.910
Und das erste ist natürlich 6 mal die Varianz von x, minus 9 mal die

52:08.910 --> 52:10.710
Kurvarianz von x, y.

52:10.850 --> 52:14.090
Ich habe gleich die Symmetrie ausgenutzt, minus 8 mal die Kurvarianz

52:14.090 --> 52:16.910
von x, y plus 12 mal Varianz von y.

52:16.910 --> 52:20.990
Also kriege ich da 6 mal Varianz von x und die Kurvarianzen können Sie

52:20.990 --> 52:21.590
noch addieren.

52:21.730 --> 52:25.690
Dann haben Sie minus 17 Kurvarianz x, y plus 12 mal Varianz von y.

52:25.850 --> 52:30.010
So typische Übungsaufgaben, dass man den Umgang lernt mit Kurvarianz.

52:31.690 --> 52:34.670
Sie glauben nicht, wenn Sie später mal irgendwie Bachelor-Arbeiten

52:34.670 --> 52:37.070
schreiben oder Master-Arbeiten, das sind dann die Elementarstechniken.

52:38.010 --> 52:39.570
Also wirklich wie 3 mal 5.

52:41.950 --> 52:44.230
Kurvarianzen werden eigentlich nie ausgerechnet.

52:44.230 --> 52:48.490
Ich komme da gleich noch zu, nach einer Darstellungsformel.

52:48.590 --> 52:52.310
Sondern man versucht immer zu vereinfachen durch Ausnutzen von solchen

52:52.310 --> 52:53.770
Eigenschaften wie z.B.

52:54.030 --> 52:54.510
Bilinearität.

52:54.790 --> 52:57.770
Hier ax und dann noch minus ay plus c.

52:58.130 --> 53:00.390
Wir wissen schon, die Konstante c spielt keine Rolle.

53:01.050 --> 53:03.330
Also bleibt über, dann haben Sie a und dann minus a.

53:03.390 --> 53:06.590
Ergibt erst mal minus a Quadrat Kurvarianz von x und y.

53:07.210 --> 53:07.770
Das war's.

53:08.910 --> 53:12.130
Dritte Eigenschaft, wenn ich jetzt noch weiß, x1 bis xn sind

53:12.130 --> 53:15.670
unabhängig, soll die Kurvarianz von x1 und diesem arithmetischen

53:15.670 --> 53:17.090
Mittelbilden aller xj.

53:17.390 --> 53:20.490
Ist natürlich klar, wie der Bilinearität, 1 durch n kann ich

53:20.490 --> 53:21.030
rausziehen.

53:21.550 --> 53:22.750
Summe kann ich rausziehen.

53:23.290 --> 53:26.310
Dann bleibt über, Kurvarianz von x1 mit xj.

53:27.170 --> 53:30.010
So habe ich natürlich einen einzigen Summan, der hier relevant ist,

53:30.070 --> 53:31.010
nämlich j gleich 1.

53:31.130 --> 53:33.630
Die Kurvarianz von x1 mit x1 ist die Varianz.

53:34.210 --> 53:36.850
Alle anderen Kurvarianzen verschwinden wegen der Unabhängigkeit.

53:36.850 --> 53:41.050
Das heißt, ich habe wirklich nur 1 durch n mal, und die Kurvarianz von

53:41.050 --> 53:43.850
x1 mit x1 ist die Varianz von x1.

53:46.050 --> 53:47.330
Ist das klar geworden?

53:47.690 --> 53:51.970
Wirklich mal so ein brutales Rechenbeispiel.

54:00.580 --> 54:03.300
Ja, jetzt kommt die Darstellungsformel.

54:03.380 --> 54:06.120
Wir hatten allgemein folgende Formel gehabt.

54:06.660 --> 54:11.220
Wenn ich einen Zufallsvektor habe z, der kann jetzt irgendein n

54:11.220 --> 54:14.680
-dimensional sein, ganz allgemein, und setze eine Funktion g drauf,

54:14.780 --> 54:18.620
die von dem R auf n in den R1 geht, dann ist der Erwartungswert von g

54:18.620 --> 54:20.980
von z folgendermaßen ausrechenbar.

54:21.140 --> 54:25.120
Ich muss summieren über die endlich vielen oder absehbar unendlich

54:25.120 --> 54:29.800
vielen Punkte z mit der Eigenschaft, die Wahrscheinlichkeit von Groß-Z

54:29.800 --> 54:32.400
gleich Klein-Z ist positiv, die überhaupt angenommen werden.

54:33.240 --> 54:37.220
Und dann steht da g von z mal die Wahrscheinlichkeit, dass z gleich z

54:37.220 --> 54:37.480
ist.

54:37.480 --> 54:41.760
Das war die Darstellungsformel für den Erwartungswert der Funktion

54:41.760 --> 54:43.060
eines Zufallsvektors.

54:44.200 --> 54:47.700
So, dann noch mal zur Erinnerung, die Kurvarianz kann man so

54:47.700 --> 54:48.420
ausrechnen.

54:48.740 --> 54:52.480
Erwartungswert des Produktes minus Produkt der Erwartungswerte war

54:52.480 --> 54:53.080
eine Möglichkeit.

54:54.160 --> 54:57.520
Und ich lasse jetzt beherzige, hat man sofort die Darstellungsformel

54:57.520 --> 54:59.120
für die Kurvarianz, nämlich wie folgt.

55:00.020 --> 55:02.840
Stellen Sie sich vor, die Zufallsvariante x nimmt irgendwelche Werte

55:02.840 --> 55:05.720
x1, x2 an, aber nur die, das heißt, die Summe dieser

55:05.720 --> 55:06.940
Wahrscheinlichkeiten ist 1.

55:07.840 --> 55:09.680
Die Summe kann abbrechen oder auch nicht.

55:09.820 --> 55:12.760
Wenn ich sage, größer gleich 1, heißt das immer, vielleicht habe ich

55:12.760 --> 55:16.080
nur endlich viele Werte, vielleicht habe ich absehbar unendlich viele.

55:17.640 --> 55:19.080
Genauso gelte das für y.

55:19.440 --> 55:23.880
y nehme die Werte y1, y2 und so weiter an, keine weiteren.

55:24.580 --> 55:26.780
Hier ist nicht ausgeschlossen, dass sogar irgendwelche

55:26.780 --> 55:28.040
Wahrscheinlichkeiten hier 0 sind.

55:28.140 --> 55:30.560
Das Entscheidende ist nur, die Summe dieser Wahrscheinlichkeiten ist

55:30.560 --> 55:30.920
1.

55:32.440 --> 55:36.420
Und dann gilt, die Kurvarianz von x und y kann ich so ausrechnen.

55:36.500 --> 55:38.660
Ich summiere über diese i, ich summiere über diese j.

55:39.140 --> 55:43.360
Und dann steht da nichts anderes als xi mal yj mal Wahrscheinlichkeit

55:43.360 --> 55:45.520
x gleich xi und y gleich yj.

55:45.620 --> 55:48.940
Und dann subtrahiere ich am Ende noch e von x mal e von y.

55:49.920 --> 55:54.080
Wenn Sie sich das Memo ansehen, da steht ja oben im rechten Teil, die

55:54.080 --> 55:57.200
Kurvarianz ist der Erwartungswert des Produktes minus Produkt der

55:57.200 --> 55:57.860
Erwartungswerte.

55:58.020 --> 56:00.240
Nun, minus Produkt der Erwartungswerte steht da.

56:00.240 --> 56:03.660
Das heißt, ich muss mir nur noch überlegen, dass diese Doppelsumme

56:03.660 --> 56:05.520
gleich dem Erwartungswert des Produktes ist.

56:05.600 --> 56:08.280
Aber das folgt direkt aus dem ersten Teil des Memos.

56:08.800 --> 56:15.720
Das z ist hier nichts anderes als das Paar xy und die Funktion g

56:15.720 --> 56:20.240
ordnet dem Paar das Produkt zu, der beiden Komponenten.

56:21.060 --> 56:23.640
Das heißt, das folgt direkt aus der Darstellungsformel.

56:24.520 --> 56:26.920
Jetzt habe ich schon hingeschrieben, wie ich das meine.

56:26.920 --> 56:30.840
Das heißt, ich müsste, um die Kurvarianz mal auszurechnen, muss ich

56:30.840 --> 56:32.380
die gemeinsame Verteilung kennen.

56:32.480 --> 56:35.600
Ich muss also kennen, diese Wahrscheinlichkeiten, mit denen x den Wert

56:35.600 --> 56:38.380
xi annimmt und y zugleich den Wert yj.

56:38.480 --> 56:39.740
Die Wahrscheinlichkeit muss ich kennen.

56:40.020 --> 56:43.360
Dann heißt die Regel, multipliziere eben mit diesen Werten xi mal yj

56:43.360 --> 56:45.080
und summiere über alle i und j drauf.

56:45.180 --> 56:46.920
Hast eine Doppelsumme.

56:47.880 --> 56:50.100
Schlimm wäre das, wenn man vielleicht eine Doppelreihe sogar hat.

56:52.520 --> 56:55.020
Ich nenne das die Ich-Weiß-Es-Nicht-Besser-Methode.

56:55.260 --> 56:59.640
Wenn aber nichts anderes einfällt, dann müssen wir vielleicht auch mal

56:59.640 --> 57:00.020
rechnen.

57:02.200 --> 57:06.040
Das möchten wir gerne anderen überlassen, aber manchmal geht es nicht

57:06.040 --> 57:06.360
anders.

57:06.620 --> 57:09.580
Also das muss ich dann vielleicht wirklich mal so ausrechnen.

57:09.640 --> 57:10.740
Wir machen das gleich an einem Beispiel.

57:11.280 --> 57:15.360
Also nach Möglichkeit möchte man das vermeiden durch Ausnutzen dieser

57:15.360 --> 57:16.320
strukturellen Eigenschaften.

57:16.320 --> 57:19.040
Wenn ich irgendwie Summen habe, Faktoren, also wenn ich irgendwie

57:19.040 --> 57:23.120
Bilinearität ausnutzen kann, bis zum Geht-Nicht-Mehr, dann sollte ich

57:23.120 --> 57:23.540
das tun.

57:24.620 --> 57:26.540
Nur ganz zum Schluss muss ich vielleicht mal rechnen.

57:28.320 --> 57:28.800
Beispiel.

57:30.300 --> 57:31.560
Also erstmal nochmal die Memo.

57:31.820 --> 57:33.360
So rechnen wir, ganz konkret.

57:33.960 --> 57:36.940
Immer dran denken, am Ende nicht vergessen, den Erwartungswert des

57:36.940 --> 57:38.180
Produktes zu subtrahieren.

57:39.340 --> 57:42.860
Aber nochmal, für diese einzelnen Erwartungswerte brauche ich nicht

57:42.860 --> 57:44.060
die gemeinsame Verteilung.

57:44.060 --> 57:46.900
Es reicht mir die Verteilung von X, um den Erwartungswert von X

57:46.900 --> 57:47.700
ausrechnen zu können.

57:47.800 --> 57:51.140
Es reicht mir die Verteilung von Y, um den Erwartungswert von Y

57:51.140 --> 57:52.080
ausrechnen zu können.

57:52.480 --> 57:56.580
Aber die gemeinsame Verteilung brauche ich bei dieser Doppelsumme, die

57:56.580 --> 57:57.200
davor steht.

57:57.960 --> 57:58.360
Beispiel.

57:59.140 --> 58:00.460
So, Sie sehen nochmal dieses Tableau.

58:00.560 --> 58:04.220
Wir hatten hier eine bivariate Verteilung, die von einem Parameter

58:04.220 --> 58:04.740
abhängt.

58:04.860 --> 58:07.940
Die Zufallsvariablen nehmen jemals die Werte 1 und 2 an.

58:09.340 --> 58:12.160
Sie sehen dort an den Rändern stehen genau die Wahrscheinlichkeiten

58:12.160 --> 58:12.600
halb.

58:12.600 --> 58:16.020
Das heißt, die Wahrscheinlichkeit ist halb, dass X den Wert 1 annimmt

58:16.020 --> 58:19.060
und auch halb, dass X den Wert 2 annimmt und für Y genauso.

58:19.540 --> 58:21.460
Und hier stehen die gemeinsamen Wahrscheinlichkeiten.

58:21.560 --> 58:26.960
Sie sehen hier diesen Parameter C, diesen freien Parameter, der jetzt

58:26.960 --> 58:29.380
die Verteilung wirklich dann bestimmt, auch die gemeinsame.

58:29.480 --> 58:33.760
Das war unser Beispiel für verschiedene gemeinsame Verteilungen mit

58:33.760 --> 58:35.800
gleichen Marginalverteilungen.

58:36.520 --> 58:39.180
So, die Erwartungswerte von X sieht man natürlich sofort ein.

58:39.180 --> 58:43.220
X nimmt die Werte 1 und 2 an mit gleichen Wahrscheinlichkeiten und Y

58:43.220 --> 58:43.660
auch.

58:43.940 --> 58:47.240
Das heißt, die erwartenden Werte stimmen überein und da kommt raus 1

58:47.240 --> 58:48.320
,5, 3,5.

58:48.500 --> 58:50.100
Das sind die beiden Erwartungswerte.

58:50.440 --> 58:53.200
Das heißt, ich darf jetzt nicht vergessen, am Ende muss ich ja die

58:53.200 --> 58:56.420
miteinander multiplizieren, also 3,5 zum Quadrat und das noch

58:56.420 --> 58:57.000
subtrahieren.

58:57.100 --> 58:59.640
Aber jetzt dreht sich es um diese Doppelsumme, Kurvarianz.

59:00.300 --> 59:00.980
Nun, was ist das?

59:01.460 --> 59:04.060
Jetzt habe ich die Summe i und j größer gleich 1.

59:04.380 --> 59:06.500
Das heißt, ich habe jetzt die Fälle 1 und 1.

59:06.500 --> 59:07.720
Das ist 1 mal 1.

59:07.880 --> 59:08.920
Ich muss dann multiplizieren.

59:09.000 --> 59:12.560
X i mal Y j ist 1 mal 1 und die Wahrscheinlichkeit ist hier c.

59:13.920 --> 59:15.060
Sie sehen, was habe ich dann?

59:15.200 --> 59:17.440
Dann hätte ich also nichts anderes als 1 mal 2.

59:17.960 --> 59:21.960
Das ist die 1 von dem i und die 2 und dann haben Sie ein halbes minus

59:21.960 --> 59:22.240
c.

59:22.340 --> 59:23.280
Das ist die Wahrscheinlichkeit.

59:23.800 --> 59:29.120
Genauso die linke untere Ecke hier, 2 mal 1 mal d, haben Sie das.

59:29.460 --> 59:34.080
Und dann kommt noch hinzu 2 mal 2 mal dieses c und das kommt raus.

59:34.080 --> 59:36.180
Und nicht vergessen, am Ende müssen Sie subtrahieren.

59:36.560 --> 59:38.840
Dreihalbe zum Quadrat, Produkt der Erwartungswerte.

59:39.160 --> 59:42.000
Wenn Sie das jetzt elementar ausrechnen, erhalten Sie c minus ein

59:42.000 --> 59:42.220
Viertel.

59:43.340 --> 59:45.480
Das heißt, die Kurvarianz ist c minus ein Viertel.

59:45.640 --> 59:48.080
Insbesondere ist sie 0, wenn c gleich ein Viertel ist.

59:49.400 --> 59:51.780
Wenn c gleich ein Viertel ist, sieht man auch unschwer ein, dass die

59:51.780 --> 59:53.960
beiden Zufallswerten stochastisch unabhängig sind.

59:58.140 --> 01:00:01.620
Es kann Ihnen auch passieren in der Klausur, dass Sie sowas, man

01:00:01.620 --> 01:00:04.940
bekommt eine Bivariate-Verteilung und dann ein bisschen was rechnen

01:00:04.940 --> 01:00:05.180
müssen.

01:00:05.400 --> 01:00:07.740
Also hier gibt es dann unter Umständen ein paar Punkte.

01:00:10.980 --> 01:00:15.260
Ja, jetzt möchte ich auf eine interessante Aufgabe kommen.

01:00:16.160 --> 01:00:18.880
Die Aufgabe ist so, ich habe zwei Zufallsvariablen.

01:00:20.080 --> 01:00:24.780
Und die Aufgabe ist die, mache eine Vorhersage für y aufgrund von x.

01:00:25.260 --> 01:00:27.660
Also x und y haben irgendwie eine gemeinsame Verteilung.

01:00:28.220 --> 01:00:31.460
Es teilt mir jemand den Wert von x mit und sagt, okay, das ist jetzt

01:00:31.460 --> 01:00:32.400
so eine Information.

01:00:34.480 --> 01:00:38.560
Schätze aufgrund dieser Information, dass y, die Realisierung, die du

01:00:38.560 --> 01:00:40.000
ja nicht kennst, bestmöglich.

01:00:40.940 --> 01:00:43.820
Somit bestmöglich, muss ich jetzt sagen, nach welchem Kriterium.

01:00:44.720 --> 01:00:46.760
Das Kriterium soll folgendermaßen sein.

01:00:49.460 --> 01:00:52.940
Die Vorhersage, ich habe auch nur gewisse Funktionen, die erlaubt sind

01:00:52.940 --> 01:00:53.380
für mich.

01:00:54.000 --> 01:00:55.560
Ich bin da sehr eingeschränkt.

01:00:56.160 --> 01:00:59.640
Die erlaubten Funktionen sind nur von der Bauart affine Funktionen.

01:00:59.640 --> 01:01:05.080
Also wenn ich x erzählt bekomme, darf ich nur sagen a plus b mal x.

01:01:05.960 --> 01:01:08.760
Aber die a's und b's, die darf ich mir geeignet aussuchen,

01:01:08.860 --> 01:01:09.380
bestmöglich.

01:01:09.840 --> 01:01:13.400
Später werden wir allgemeine Vorhersagefunktion betrachten, aber noch

01:01:13.400 --> 01:01:13.860
nicht jetzt.

01:01:15.160 --> 01:01:17.700
So, das Gütig-Kriterium muss ich noch sagen, was es ist.

01:01:17.780 --> 01:01:18.580
Das sieht so aus.

01:01:19.020 --> 01:01:21.740
Es ist die sogenannte mittlere quadratische Abweichung.

01:01:21.840 --> 01:01:22.960
Was versteht man darunter?

01:01:23.700 --> 01:01:25.100
Nun, das ist der Erwartungswert.

01:01:25.100 --> 01:01:30.980
Und jetzt sehen Sie y minus, und jetzt käme quasi meine Vorhersage,

01:01:31.460 --> 01:01:35.180
minus, kann ich also ein Klammer, a plus b mal x, Klammer zu.

01:01:36.240 --> 01:01:40.220
Oder y minus a minus b mal x und das in Klammern zum Quadrat.

01:01:41.380 --> 01:01:45.000
Wenn Sie so wollen, bevor man überhaupt irgendwas erfährt, wäre das

01:01:45.000 --> 01:01:49.820
der zufällige Vorhersagefehler y minus a minus b mal x, wenn ich a und

01:01:49.820 --> 01:01:50.300
b wähle.

01:01:51.360 --> 01:01:54.380
Dieser Fehler wird quadriert, ist also ein Zufallsvariable.

01:01:54.780 --> 01:01:56.780
Davon wird der Erwartungswert gebildet.

01:01:57.160 --> 01:02:01.140
Und jetzt ist mein Ziel, ich möchte das gern minimieren über a und b.

01:02:01.440 --> 01:02:02.280
Das ist meine Aufgabe.

01:02:03.600 --> 01:02:05.500
Das heißt, jetzt kommt schon der Satz.

01:02:07.240 --> 01:02:11.120
Das Optimierungsproblem, dass diese mittlere quadratische Abweichung,

01:02:11.360 --> 01:02:14.940
bitte minimiere die über a und b, das lässt sich lösen, sehr einfach.

01:02:15.780 --> 01:02:16.840
Und da kommt Folgendes raus.

01:02:17.800 --> 01:02:19.420
Dieses Optimierungsproblem hat eine Lösung.

01:02:20.180 --> 01:02:22.640
Nun, das b-Stern, das optimale b sieht so aus.

01:02:22.760 --> 01:02:26.500
Die Kovarianz von x und y dividiert durch die Varianz von x.

01:02:27.380 --> 01:02:29.840
Und wenn ich dieses b-Stern kenne, dann kenne ich auch sofort das

01:02:29.840 --> 01:02:31.220
optimale a, das a-Stern.

01:02:31.380 --> 01:02:35.720
Das ist nichts anderes als der Erwartungswert von y minus b-Stern mal

01:02:35.720 --> 01:02:36.680
Erwartungswert von x.

01:02:36.760 --> 01:02:39.460
Ich könnte jetzt das b-Stern, was da links steht, einsetzen.

01:02:40.560 --> 01:02:43.000
Das wären also jetzt die optimalen Werte von a und b.

01:02:43.720 --> 01:02:46.180
Und dann hat es noch einen Minimalwert.

01:02:46.620 --> 01:02:49.980
Was kommt raus, wenn ich das dann hinterher einsetze, diese Werte?

01:02:50.120 --> 01:02:52.580
Da kommt Folgendes raus, der Minimalwert, ich nenne m-Stern.

01:02:53.140 --> 01:02:54.000
Das ist ein Produkt.

01:02:54.720 --> 01:02:57.000
Da steht, der erste Faktor ist die Varianz von y.

01:02:57.740 --> 01:03:01.980
Und der zweite Faktor ist ein 1 minus und dann ein Quadrat von etwas,

01:03:02.200 --> 01:03:05.160
also ein r von x, y in Klammern zum Quadrat.

01:03:05.280 --> 01:03:07.400
Ich schreibe kurz r² von x, y.

01:03:07.620 --> 01:03:09.140
Ich muss noch sagen, was das r ist.

01:03:09.140 --> 01:03:14.940
Das r ist nichts anderes als die Konvarianz von x und y, dividiert

01:03:14.940 --> 01:03:20.240
durch das Produkt der Standardabweichungen oder mit anderen Worten das

01:03:20.240 --> 01:03:23.180
Produkt aus den Wurzeln, aus den Varianzen.

01:03:24.700 --> 01:03:26.200
Hier kann man schon Folgendes erkennen.

01:03:27.340 --> 01:03:31.020
Ich minimiere etwas, Sie sehen, einen Erwartungswert von etwas, was

01:03:31.020 --> 01:03:32.160
nicht negativ ist.

01:03:32.380 --> 01:03:35.440
Als Quadrat ist diese Zufallszahl immer nicht negativ.

01:03:35.440 --> 01:03:38.420
Das heißt, auch der Minimalwert, wenn ich a-Stern und b-Stern

01:03:38.420 --> 01:03:40.420
einsetze, muss nicht negativ sein.

01:03:40.740 --> 01:03:44.540
Das bedeutet, dieses m-Stern ist größer gleich 0.

01:03:45.620 --> 01:03:47.700
Da steht Varianz von y als Faktor.

01:03:48.060 --> 01:03:50.400
Und der zweite Faktor ist 1 minus r².

01:03:50.580 --> 01:03:52.980
Der zweite Faktor muss auch größer gleich 0 sein.

01:03:53.220 --> 01:03:56.140
Sie sehen sofort, r² ist kleiner gleich 1.

01:03:56.240 --> 01:03:59.520
Oder r liegt zwischen minus 1 und plus 1.

01:03:59.900 --> 01:04:01.740
Können wir direkt ablesen.

01:04:01.740 --> 01:04:03.560
Dieses r wird einen Namen bekommen.

01:04:03.800 --> 01:04:06.840
Das heißt dann Korrelationskoeffizient von x und y.

01:04:07.240 --> 01:04:11.840
Und wir sehen allein an der Lösung hier, wenn das die Lösung ist, das

01:04:11.840 --> 01:04:15.580
müssen wir noch beweisen, dass das r zwischen plus 1 und minus 1

01:04:15.580 --> 01:04:15.860
liegt.

01:04:17.380 --> 01:04:18.500
Ist das klar geworden?

01:04:20.300 --> 01:04:20.820
Gut.

01:04:21.320 --> 01:04:22.220
Also das ist die Aufgabe.

01:04:22.720 --> 01:04:24.780
Und die Aufgabe lässt sich wirklich sehr simpel lösen.

01:04:25.540 --> 01:04:28.820
Ich setze mal kurz z gleich y minus bx.

01:04:28.820 --> 01:04:31.760
Wir sehen nämlich den Parameter b mal damit rein.

01:04:32.180 --> 01:04:33.820
Wenn ich das mache, steht da nichts anderes.

01:04:34.020 --> 01:04:38.380
Dann ist dieses, was wir dort minimieren wollen, ist e von z minus a

01:04:38.380 --> 01:04:39.420
in Klammern zum Quadrat.

01:04:39.500 --> 01:04:40.400
Ich habe nur abgekürzt.

01:04:40.700 --> 01:04:42.200
z ist y minus b mal x.

01:04:43.420 --> 01:04:46.520
So, das kann ich natürlich auf jeden Fall minimieren, sofort in

01:04:46.520 --> 01:04:47.480
Abhängigkeit von a.

01:04:47.560 --> 01:04:48.620
Das hatten wir heute auf einer Folie.

01:04:48.680 --> 01:04:49.640
Für a stand nur t.

01:04:50.080 --> 01:04:53.740
Das wird minimal in Abhängigkeit von a, wenn ich für a den

01:04:53.740 --> 01:04:55.820
Erwartungswert von z einsetze.

01:04:57.600 --> 01:05:02.180
Das ist nämlich nichts anderes als Varianz von z plus e von z minus a

01:05:02.180 --> 01:05:03.000
zum Quadrat.

01:05:03.220 --> 01:05:03.760
Wir hatten das heute.

01:05:03.860 --> 01:05:06.080
Für z stand nur x und für a stand t.

01:05:07.160 --> 01:05:07.520
Hatten wir.

01:05:08.320 --> 01:05:12.160
Das heißt, das wird minimal, also dieser Verschiebungssatz, das war

01:05:12.160 --> 01:05:15.460
diese Eigenschaft c in den Eigenschaften über die Varianzen.

01:05:15.800 --> 01:05:17.540
Das ist größer gleich der Varianz, sieht man.

01:05:17.880 --> 01:05:20.560
Und minimal wird das für a gleich e von z.

01:05:20.620 --> 01:05:23.940
Und ich setze für z ein, was da drüber steht, y minus bx.

01:05:23.940 --> 01:05:28.840
Also ist das der Erwartungswert von y minus b mal der Erwartungswert

01:05:28.840 --> 01:05:29.280
von x.

01:05:29.800 --> 01:05:32.680
Das bedeutet, wenn ich b kenne, kenne ich sofort a.

01:05:36.840 --> 01:05:38.900
Ich minimiere hier in zwei Stufen.

01:05:39.320 --> 01:05:41.020
Ich verwende nicht Analyse 2.

01:05:42.280 --> 01:05:44.740
Ich möchte runter bis zum Gymnasium 9.

01:05:44.900 --> 01:05:45.260
Klasse.

01:05:45.740 --> 01:05:46.420
Werden Sie gleich sehen.

01:05:47.700 --> 01:05:49.000
So einfach ist das Problem nämlich.

01:05:50.640 --> 01:05:52.820
Also ich setze das ein jetzt, was wir haben.

01:05:53.460 --> 01:05:55.300
Das heißt, ich habe jetzt folgendes.

01:05:56.200 --> 01:06:02.140
Für das a setze ich jetzt das ein und habe natürlich dann y minus und

01:06:02.140 --> 01:06:03.820
bei dem a steckt drin e von y.

01:06:03.980 --> 01:06:05.620
y minus e von y habe ich.

01:06:06.220 --> 01:06:10.980
Und oben minus b mal x habe ich auf jeden Fall.

01:06:11.180 --> 01:06:14.100
Und dann habe ich natürlich noch minus minus b mal e von x.

01:06:14.200 --> 01:06:15.760
b kann ich ausklammern, ich habe das.

01:06:16.520 --> 01:06:20.060
Das heißt, ich habe jetzt diese Aufgabe, das zu minimieren bezüglich

01:06:20.060 --> 01:06:20.400
b.

01:06:21.540 --> 01:06:24.280
Wenn ich das lösen kann, ich kriege gleich b raus, dann habe ich auch

01:06:24.280 --> 01:06:24.660
das a.

01:06:24.760 --> 01:06:27.220
Das a ergibt sich aus dem b, das haben wir eben gesehen.

01:06:27.700 --> 01:06:31.040
Deshalb auch diese zweite Gleichung mit dem a-Stern.

01:06:31.560 --> 01:06:33.340
Das a-Stern ergibt sich aus dem b-Stern.

01:06:33.960 --> 01:06:36.000
Warum kann man das jetzt einfach lösen?

01:06:36.580 --> 01:06:38.440
Nun, das müssen wir minimieren bezüglich b.

01:06:40.560 --> 01:06:42.380
Vielleicht sieht das jetzt kompliziert aus.

01:06:42.920 --> 01:06:43.860
Ich kürze mal ab.

01:06:43.940 --> 01:06:48.540
Ich sage mal, y minus e von y ist y-Schlange und x minus e von x ist x

01:06:48.540 --> 01:06:48.820
-Schlange.

01:06:49.660 --> 01:06:52.900
Das heißt, die zentrierten Zufallsvarianten bekommen jetzt

01:06:52.900 --> 01:06:54.560
Abkürzungen.

01:06:55.640 --> 01:06:56.720
Bis auf Weiteres.

01:06:57.420 --> 01:06:58.940
So, jetzt führe ich eine Funktion ein.

01:06:59.020 --> 01:07:01.780
Sie sehen, ich muss eine Funktion h, die von b abhängt, minimieren.

01:07:01.860 --> 01:07:03.220
Die Funktion h von b ist das.

01:07:03.560 --> 01:07:07.660
Wenn ich jetzt einsetze für y minus e von y, y-Schlange, dann steht da

01:07:07.660 --> 01:07:11.340
nichts anderes als Erwartungswert von y-Schlange minus b mal x

01:07:11.340 --> 01:07:12.420
-Schlange zum Quadrat.

01:07:13.420 --> 01:07:17.600
Wenn ich das ausrechne, wieder Linearität des Erwartungswertes, ist

01:07:17.600 --> 01:07:18.320
das nichts anderes.

01:07:18.500 --> 01:07:19.580
Also das muss minimiert werden.

01:07:19.700 --> 01:07:21.820
Okay, man muss immer daran denken, was man tun muss.

01:07:22.240 --> 01:07:25.720
Aber das h von b ist auf jeden Fall etwas, was größer gleich Null ist

01:07:25.720 --> 01:07:28.960
als Erwartungswert des Quadrates einer Zufallsvariante.

01:07:29.560 --> 01:07:31.680
Die Zufallsvariante ist größer gleich Null, also auch deren

01:07:31.680 --> 01:07:32.480
Erwartungswert.

01:07:33.100 --> 01:07:34.060
Erwartungswert ist monoton.

01:07:34.300 --> 01:07:34.820
Immer daran denken.

01:07:35.460 --> 01:07:38.140
So, h von b, e von y-Schlange zum Quadrat.

01:07:38.220 --> 01:07:39.680
Jetzt kommt wieder die binomische Formel.

01:07:40.420 --> 01:07:43.700
Minus zweimal, jetzt kommt das gemischte Glied, mal b, mal der

01:07:43.700 --> 01:07:46.880
Erwartungswert des Produktes, y-Schlange mal x-Schlange.

01:07:47.000 --> 01:07:49.080
Ich schreibe x-Schlange mal y-Schlange.

01:07:49.860 --> 01:07:53.020
Und dann bleibt noch über plus b-Quadrat mal Erwartungswert von x

01:07:53.020 --> 01:07:53.860
-Schlange zum Quadrat.

01:07:54.680 --> 01:07:57.640
So, jetzt führe ich das, ich mache das rückgängig mit dem y-Schlange.

01:07:58.120 --> 01:08:00.560
Sie sehen, y-Schlange ist y minus e von y.

01:08:00.760 --> 01:08:03.580
Dieser erste Erwartungswert ist nichts anderes als die Varianz von y.

01:08:06.020 --> 01:08:07.620
Was ist denn der Erwartungswert?

01:08:07.740 --> 01:08:11.080
x-Schlange ist x minus e von x und das ist y minus e von y.

01:08:11.080 --> 01:08:13.680
Und dieser Erwartungswert ist nach Definition die Kovarianz.

01:08:14.460 --> 01:08:17.420
Also steht da minus 2b mal Kovarianz von x und y.

01:08:18.220 --> 01:08:19.040
Was ist das?

01:08:19.660 --> 01:08:22.580
x-Schlange ist x minus e von x in Klammern zum Quadrat.

01:08:22.920 --> 01:08:24.420
Der Erwartungswert ist die Varianz von x.

01:08:24.540 --> 01:08:26.760
Also steht da plus b-Quadrat mal Varianz von x.

01:08:28.640 --> 01:08:32.180
Das ist als Funktion von b eine quadratische Funktion.

01:08:32.880 --> 01:08:35.500
Eine Parabel, die immer größer gleich null ist.

01:08:36.480 --> 01:08:38.060
So, jetzt kommt die neunte Klasse der Schule.

01:08:38.060 --> 01:08:40.560
Finde sozusagen die Minimalstelle dieser Parabel.

01:08:41.740 --> 01:08:44.140
Das kann man dann ableiten, null setzen usw.

01:08:44.260 --> 01:08:45.840
Und das ist jetzt wirklich elementar.

01:08:46.280 --> 01:08:50.360
Das heißt, h' von b ist null und daraus folgt, das optimale b sieht

01:08:50.360 --> 01:08:52.180
wirklich so aus, wie wir das hatten.

01:08:52.560 --> 01:08:55.600
Und wenn ich das jetzt einsetze, dann liefert das auch den

01:08:55.600 --> 01:08:56.120
Minimalwert.

01:08:56.200 --> 01:08:57.340
Das überlasse ich jetzt Ihnen.

01:08:57.960 --> 01:09:00.980
Aber ich wollte Ihnen sagen, Sie müssen dann nicht unbedingt bei dem

01:09:00.980 --> 01:09:04.560
ursprünglichen Problem müssen Sie nicht unbedingt die Analyse bemühen

01:09:04.560 --> 01:09:08.480
und das partiell nach a und b differenzieren und dort beides null

01:09:08.480 --> 01:09:12.020
setzen und vielleicht noch nachprüfen, ob irgendeine quadratische Form

01:09:12.020 --> 01:09:13.980
dann irgendwie definiert ist.

01:09:14.060 --> 01:09:14.840
So brauchen Sie alles nicht.

01:09:16.780 --> 01:09:18.180
Es geht ganz elementar.

01:09:19.040 --> 01:09:19.880
Also das kommt raus.

01:09:20.540 --> 01:09:24.760
Gut, also null kleiner gleich m-Stern, das ist dieser Minimalwert.

01:09:24.840 --> 01:09:30.000
Wenn ich jetzt einsetze, dann steht da wirklich Varianz von y, das ist

01:09:30.000 --> 01:09:34.340
das hier, da Varianz von y, zwei Zeilen drüber, minus zwei b-Stern,

01:09:34.520 --> 01:09:38.320
also minus zwei, ich setze b-Stern ein, mal die Covarianz, das ergibt

01:09:38.320 --> 01:09:38.640
das.

01:09:39.060 --> 01:09:42.760
Und dann habe ich noch plus b-Quadrat mal Varianz von x, dann bleibt

01:09:42.760 --> 01:09:43.240
das über.

01:09:43.380 --> 01:09:46.780
Und wenn ich jetzt hier geschickt zusammenfasse und nochmal hier bei

01:09:46.780 --> 01:09:50.260
dem Varianz von y auch ein Varianz von x in den Nenner schreibe und

01:09:50.260 --> 01:09:54.740
damit multipliziere, dementsprechend erhalte ich erstmal das und dann

01:09:54.740 --> 01:09:55.940
erhalte ich das.

01:09:56.580 --> 01:10:01.280
Also Varianz von y mal eins und dann minus dem und das war das

01:10:01.280 --> 01:10:01.700
Ergebnis.

01:10:01.940 --> 01:10:03.660
Also das ist dann direktes Rechnen.

01:10:04.760 --> 01:10:04.800
Okay.

01:10:06.020 --> 01:10:10.580
Ja, also wir können jetzt einen neuen Begriff auch bilden, angesichts

01:10:10.580 --> 01:10:12.220
dieses Optimierungsproblems.

01:10:12.900 --> 01:10:14.460
Und zwar sieht das folgendermaßen aus.

01:10:14.540 --> 01:10:20.260
Erstmal, Sie sehen Varianz von y mal eins und das war das Quadrat von

01:10:20.260 --> 01:10:20.740
diesem r.

01:10:21.080 --> 01:10:22.540
Und das r bekommt jetzt einen Namen.

01:10:24.220 --> 01:10:27.220
Und das r...

01:10:28.240 --> 01:10:29.860
haben wir das schon definiert?

01:10:29.920 --> 01:10:32.240
Wir haben das noch nicht definiert, also ich hoffe, dass wir das noch

01:10:32.240 --> 01:10:33.040
später definieren.

01:10:34.000 --> 01:10:36.520
Bemerkung erstmal, Methode der kleinsten Quadrate.

01:10:39.320 --> 01:10:43.440
Die Wahrscheinlichkeiten, dass x den Wert xj annimmt und y den Wert yj

01:10:43.440 --> 01:10:44.360
sein, 1 durch n.

01:10:45.820 --> 01:10:50.500
Hier sehen Sie eine Gleichverteilung auf n Werten in der Ebene, ist

01:10:50.500 --> 01:10:52.780
die gemeinsame Verteilung, die Gleichverteilung.

01:10:53.920 --> 01:10:58.760
Dann gilt, dass dieser Erwartungswert y minus a minus b mal x zum

01:10:58.760 --> 01:11:02.420
Quadrat, jetzt kommt die Darstellungsformel für Erwartungswerte, Sie

01:11:02.420 --> 01:11:05.720
können die gleiche Wahrscheinlichkeit immer rausziehen, das 1 durch n,

01:11:05.780 --> 01:11:11.020
und es bleibt über Summe j von 1 bis n yj minus a minus b mal xj zum

01:11:11.020 --> 01:11:11.440
Quadrat.

01:11:11.540 --> 01:11:12.300
Und das hatten wir früher.

01:11:12.940 --> 01:11:15.520
Da haben wir nicht an Zufallsverhandlungen gedacht, allererste Stunde

01:11:15.520 --> 01:11:17.180
haben wir an Datenpunkte gedacht.

01:11:17.740 --> 01:11:19.560
xj, yj, j von 1 bis n.

01:11:20.200 --> 01:11:23.340
Sie sehen, bis auf den Faktor 1 durch n, ist das jetzt wirklich ein

01:11:23.340 --> 01:11:28.160
Erwartungswert, und zwar der mit einem bivarianten Zufallsvektor

01:11:28.160 --> 01:11:31.220
zusammenhängt, der diese Punktepaare mit gleichen Wahrscheinlichkeiten

01:11:31.220 --> 01:11:32.300
1 durch n annimmt.

01:11:32.380 --> 01:11:34.700
Und Sie sehen, diese Summe minimieren, das haben wir uns damals

01:11:34.700 --> 01:11:38.140
überlegt, das heißt, das ist schon so eine gerade Punktepaare hatten

01:11:38.140 --> 01:11:38.540
wir gehabt.

01:11:38.980 --> 01:11:41.820
Sie sehen also diese Summe der Quadrate minimal, das hatten wir damals

01:11:41.820 --> 01:11:45.320
schon, und die optimale Gerade haben wir empirische Regressionsgrade

01:11:45.320 --> 01:11:45.720
genannt.

01:11:45.720 --> 01:11:48.580
Jetzt kommt die Definition, die ich noch unterschlagen hatte.

01:11:49.020 --> 01:11:50.400
Die kommt jetzt nach dem Beispiel.

01:11:50.920 --> 01:11:55.740
Das war unsere Aufgabe, das war der Minimalwert, und jetzt kommt die

01:11:55.740 --> 01:11:56.960
Definition von diesem r.

01:11:57.900 --> 01:12:01.340
Und dieser heißt eben Korrelationskoeffizient nach Pirsen.

01:12:01.420 --> 01:12:04.600
Es gibt mehrere Korrelationskoeffizienten, deshalb wird manchmal das

01:12:04.600 --> 01:12:07.720
als Attribut gebraucht, der pirsische Korrelationskoeffizient.

01:12:08.140 --> 01:12:11.460
Wenn die beiden Varianzen positiv sind, davon sind wir ausgegangen,

01:12:11.880 --> 01:12:16.080
heißt dieser Ausdruck r von xy, also die Covarianz, dividiert durch

01:12:16.080 --> 01:12:19.260
das Produkt der Wurzel der Varianzen pirsischer

01:12:19.260 --> 01:12:22.060
Korrelationskoeffizient von x und y.

01:12:23.300 --> 01:12:28.080
Und man nennt x und y positiv korreliert oder unkorreliert oder

01:12:28.080 --> 01:12:33.460
negativ korreliert, wenn eben das rxy strikt positiv ist, gleich 0 ist

01:12:33.460 --> 01:12:34.480
oder kleiner als 0.

01:12:34.560 --> 01:12:35.600
Nur diese Fälle hat man.

01:12:36.160 --> 01:12:38.820
Und wir haben eben schon gesehen, dass r liegt zwischen minus 1 und

01:12:38.820 --> 01:12:39.400
plus 1.

01:12:39.400 --> 01:12:40.700
Das haben wir uns schon überlegt.

01:12:41.020 --> 01:12:42.500
Nur die Werte können angenommen werden.

01:12:42.620 --> 01:12:46.340
Also das ist erstmal die Definition und ich möchte hier nur noch die

01:12:46.340 --> 01:12:48.320
Eigenschaften, die wichtigsten.

01:12:48.940 --> 01:12:52.940
Das sind die beiden Memos, die Lösung unserer Aufgabe, das r als

01:12:52.940 --> 01:12:55.500
solches und die Zufallsvariante sind x und y.

01:12:55.800 --> 01:12:58.160
Und jetzt kommen die Eigenschaften von r noch.

01:12:58.620 --> 01:13:03.420
Die Covarianz zum Quadrat ist kleiner oder gleich Produkt aus den

01:13:03.420 --> 01:13:04.200
beiden Varianzen.

01:13:04.300 --> 01:13:07.260
Das ist nichts anderes, wenn sie dividieren durch die rechte Seite,

01:13:07.660 --> 01:13:10.900
dass das r² kleiner gleich 1 ist, was wir uns schon überlegt hatten.

01:13:11.220 --> 01:13:13.300
Das nennt man auch Cauchy-Schwarz-Umgleichung.

01:13:16.120 --> 01:13:18.740
Minus 1 ist kleiner gleich r, kleiner gleich 1.

01:13:18.980 --> 01:13:19.840
Das sind die Umgleichungen.

01:13:19.920 --> 01:13:21.400
Die ist also äquivalent zu der da oben.

01:13:22.240 --> 01:13:23.740
Sie brauchen nur durchdividieren.

01:13:23.840 --> 01:13:27.840
Sie sehen, das Quadrat ist kleiner gleich 1, aber auch größer gleich

01:13:27.840 --> 01:13:28.060
0.

01:13:28.620 --> 01:13:30.720
Es kann also nur zwischen minus 1 und 1 sein.

01:13:31.200 --> 01:13:32.980
Und jetzt kommen die Extremfälle.

01:13:32.980 --> 01:13:34.200
Wann kann das 1 sein?

01:13:34.300 --> 01:13:37.320
Schauen Sie in das erste Memo, stellen sich vor, der Betrag von r ist

01:13:37.320 --> 01:13:39.460
1, dann ist r² gleich 1.

01:13:40.040 --> 01:13:44.100
Dann ist oben in der Klammer 1 minus 1, da steht 0 in dem Memo.

01:13:44.560 --> 01:13:46.620
Das heißt, dieses Minimum ist 0.

01:13:48.080 --> 01:13:52.180
Das heißt, Sie finden a und b derart, dass der Erwartungswert einer

01:13:52.180 --> 01:13:54.800
nicht negativen Zufallsvariante 0 ist.

01:13:55.440 --> 01:13:56.600
Die ist also immer größer gleich 0.

01:13:56.640 --> 01:14:00.020
Der Erwartungswert kann nur dann 0 sein, wenn sie diesen Wert 0 mit

01:14:00.020 --> 01:14:01.460
Wahrscheinlichkeit 1 annimmt.

01:14:02.080 --> 01:14:05.840
Das bedeutet, der Extremfall ist der, es gibt dann a und b aus r mit

01:14:05.840 --> 01:14:09.760
der Eigenschaft, dass die Wahrscheinlichkeit, dass y gleich a plus bx

01:14:09.760 --> 01:14:10.500
ist gleich 1.

01:14:10.840 --> 01:14:13.940
Das heißt, mit Wahrscheinlichkeit 1 liegt das, was realisiert wird,

01:14:14.020 --> 01:14:14.940
auf einer Geraden.

01:14:15.920 --> 01:14:18.240
Und die Steigung dieser Geraden, das ist ja das b.

01:14:19.220 --> 01:14:23.700
Ich setze erstmal voraus, dass die Varianzen positiv sind, beide.

01:14:24.360 --> 01:14:30.780
Und die Steigung, ob die positiv ist oder negativ ist, das hängt von

01:14:30.780 --> 01:14:31.600
der Kovarianz ab.

01:14:31.680 --> 01:14:35.340
Wir haben gesehen, das b-Stern, das Optimale war ja gerade Kovarianz

01:14:35.340 --> 01:14:36.320
durch Varianz.

01:14:36.400 --> 01:14:40.740
Das heißt, das Vorzeichen von b, ob es hoch geht oder runter geht, das

01:14:40.740 --> 01:14:41.780
hängt nur von der Kovarianz ab.

01:14:41.820 --> 01:14:45.640
Für positiv korrelierte geht die gerade hoch, für negativ korrelierte

01:14:45.640 --> 01:14:46.540
geht die gerade runter.

01:14:46.880 --> 01:14:48.460
Das ist also hier das Ergebnis.

01:14:49.420 --> 01:14:53.160
Und ich denke, damit machen wir Schluss.

01:14:53.300 --> 01:14:57.340
Man sieht hier noch, wir können den Betrag interpretieren als Maß für

01:14:57.340 --> 01:15:01.760
die Vorhersagbarkeit von y durch eine affine Funktion von x.

01:15:02.360 --> 01:15:04.040
Und ich zeige Ihnen doch noch vier Bilder.

01:15:05.000 --> 01:15:06.940
Die Bilder sind die, wir kennen sowas schon.

01:15:08.000 --> 01:15:09.080
Sie sehen Punkthaufen.

01:15:09.560 --> 01:15:13.480
Links oben schwache negative Korrelation, minus 0,156.

01:15:14.500 --> 01:15:18.080
Dann rechts oben etwas stärkere positive Korrelation.

01:15:18.260 --> 01:15:20.960
Man hat das Gefühl, 0 steigt so ein bisschen an.

01:15:21.260 --> 01:15:22.360
Dann haben Sie sogar mal 0.

01:15:22.620 --> 01:15:24.560
Da haben Sie gar keinen affinen Zusammenhang.

01:15:24.700 --> 01:15:25.860
Die liegen auf einer Parabel.

01:15:26.460 --> 01:15:28.920
Und hier haben Sie eine relativ starke negative Korrelation.

01:15:29.360 --> 01:15:32.280
Das heißt, hier ist der Zufallsvektor jeweils gleich verteilt auf

01:15:32.280 --> 01:15:33.440
diesen n Punkten.

01:15:34.020 --> 01:15:36.400
Und wenn er gleich verteilt ist, dann rechnet man den

01:15:37.740 --> 01:15:39.800
Korrelationskoeffizienten aus wie damals.

01:15:40.040 --> 01:15:44.500
Das ist genau das, was wir hier haben, wobei x quer das arithmetische

01:15:44.500 --> 01:15:47.640
Mittel der x ist und y quer das arithmetische Mittel der y.

01:15:48.060 --> 01:15:51.200
Das heißt, hier schließt sich dann der Kreis mit dem, was wir in der

01:15:51.200 --> 01:15:53.380
deskriptiven Statistik gemacht haben.

01:15:53.560 --> 01:15:54.720
Das sollten Sie ganz einfach sehen.

01:15:54.800 --> 01:15:59.120
In der Theorie wären das ein Zufallsvektor, der jeden dieser Punkte

01:15:59.120 --> 01:16:01.540
mit gleicher Wahrscheinlichkeit 1 durch n annimmt.

01:16:02.500 --> 01:16:07.440
Also das, dann haben wir die Kurvarianz auf jeden Fall abgeschlossen.

01:16:07.920 --> 01:16:11.540
Ich werde das beim nächsten Mal nochmal prägnant zusammenfassen.

01:16:11.880 --> 01:16:14.480
Wir werden uns dann in der nächsten Woche einen wichtigen Verteilungen

01:16:14.480 --> 01:16:19.540
widmen, also wichtige Verteilungsmodelle und werden uns dann einem

01:16:19.540 --> 01:16:23.460
allgemeinen Vorhersageproblem widmen, wo wir uns nicht einschränken

01:16:23.460 --> 01:16:27.720
auf solche affinen Funktionen, sondern viel flexibler agieren können.

01:16:27.960 --> 01:16:31.760
Das heißt, Sie sind dann eigentlich viel freier in Ihren Vorhersagen,

01:16:31.820 --> 01:16:32.520
die Sie machen können.

01:16:32.880 --> 01:16:36.420
Dann danke ich Ihnen ganz herzlich und dann sehen wir uns nächste

01:16:36.420 --> 01:16:36.900
Woche wieder.

