In der Statistik wird der Satz von Cochran in der Varianzanalyse verwendet. Der Satz geht auf den schottischen Mathematiker William Gemmell Cochran zurück.
Man nimmt an
seien stochastisch unabhängige standardnormalverteilte Zufallsvariablen, und es gilt
![{\displaystyle \sum _{i=1}^{n}U_{i}^{2}=Q_{1}+\cdots +Q_{k},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/99551de62cfd2a69faf0a56e1b7c44aab7a8b7b5)
wobei jedes
die Summe der Quadrate von Linearkombinationen der
s darstellt. Ferner nimmt man an, dass
![{\displaystyle r_{1}+\cdots +r_{k}=n,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/394dd14bd793a05923fd8e6528d0b4fdc805b679)
wobei
der Rang von
ist. Der Satz von Cochran besagt, dass die
unabhängig sind mit einer Chi-Quadrat-Verteilung mit
Freiheitsgraden.
Der Satz von Cochran ist die Umkehrung des Satzes von Fisher.
Beispiel
Falls
unabhängige normalverteilte Zufallsvariablen mit Erwartungswert
und Standardabweichung
sind, dann gilt
![{\displaystyle U_{i}=(X_{i}-\mu )/\sigma \;}](https://wikimedia.org/api/rest_v1/media/math/render/svg/64bd50ed3bfc1e498a17ed6b621c64d47b6202d6)
ist standardnormalverteilt für jedes
.
Jetzt kann man folgendes schreiben
![{\displaystyle \sum _{i=1}^{n}U_{i}^{2}=\sum \limits _{i=1}^{n}\left({\frac {X_{i}-{\overline {X}}}{\sigma }}\right)^{2}+n\left({\frac {{\overline {X}}-\mu }{\sigma }}\right)^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/32fff222e75cc21bf835a0cd8ab96042ae1f30e9)
Damit man diese Identität erkennt, muss man auf beiden Seiten mit
multiplizieren und beachten, dass gilt
![{\displaystyle \sum _{i=1}^{n}(X_{i}-\mu )^{2}=\sum _{i=1}^{n}(X_{i}-{\overline {X}}+{\overline {X}}-\mu )^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5cba275163e9d8fbf1280560d5e73115c293979d)
und erweitert, um zu zeigen
![{\displaystyle \sum _{i=1}^{n}(X_{i}-{\overline {X}})^{2}+\sum _{i=1}^{n}({\overline {X}}-\mu )^{2}+2\sum _{i=1}^{n}(X_{i}-{\overline {X}})({\overline {X}}-\mu ).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/999f09c22c1757db098614f1f563f8e5a4a240a9)
Der dritte Term ist null, weil der Faktor
![{\displaystyle \sum _{i=1}^{n}({\overline {X}}-X_{i})=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/42fca5dda3639ea1f7826646c89d4e0c8e561038)
ist, und der zweite Term besteht nur aus
identischen Termen, die zusammengefügt wurden.
Kombiniert man die obigen Ergebnisse und teilt anschließend durch
, dann erhält man:
![{\displaystyle \sum _{i=1}^{n}\left({\frac {X_{i}-\mu }{\sigma }}\right)^{2}=\sum _{i=1}^{n}\left({\frac {X_{i}-{\overline {X}}}{\sigma }}\right)^{2}+n\left({\frac {{\overline {X}}-\mu }{\sigma }}\right)^{2}=Q_{1}+Q_{2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/93dc3b6ce72d839af515e2587e5e3da0037fd518)
Jetzt ist der Rang von
gerade gleich 1 (es ist das Quadrat von nur einer Linearkombination der standardnormalverteilten Zufallsvariablen). Der Rang von
ist gleich
, und daher sind die Bedingungen des Satzes von Cochran erfüllt.
Der Satz von Cochran besagt dann, dass
und
unabhängig sind, mit einer Chi-Quadrat-Verteilung mit
und
Freiheitsgrad.
Dies zeigt, dass der Mittelwert und die Varianz unabhängig sind; Ferner gilt
![{\displaystyle ({\overline {X}}-\mu )^{2}\sim {\frac {\sigma ^{2}}{n}}\chi _{1}^{2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d2765d2094ab60dd9cdf116acf5e625e48cda78c)
Um die unbekannte Varianz der Grundgesamtheit
zu schätzen, wird ein häufig verwendeter Schätzer benutzt
![{\displaystyle {\hat {\sigma }}^{2}={\frac {1}{n}}\sum _{i=1}^{n}\left(X_{i}-{\overline {X}}\right)^{2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ceef6b973f2c731f605c7fc69bc4911a1399350e)
Der Satz von Cochran zeigt, dass
![{\displaystyle {\hat {\sigma }}^{2}\sim {\frac {\sigma ^{2}}{n}}\chi _{n-1}^{2},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f136a70c0de15a56cd13d89a46759fa8086d9f6b)
was zeigt, dass der Erwartungswert von
gleich
ist.
Beide Verteilungen sind proportional zur wahren aber unbekannten Varianz
Daher ist ihr Verhältnis unabhängig von
, und weil sie unabhängig sind, erhält man
,
wobei
die F-Verteilung mit
und
Freiheitsgraden darstellt (siehe auch Studentsche t-Verteilung).
Literatur
- Cochran, W. G.: The distribution of quadratic forms in a normal system, with applications to the analysis of covariance. Mathematical Proceedings of the Cambridge Philosophical Society 30 (2): 178–191, 1934.
- Bapat, R. B.: Linear Algebra and Linear Models. Zweite Auflage (1990). Springer. ISBN 978-0-387-98871-9