Loi du χ² non centrée

Loi du χ2 non centré
Image illustrative de l’article Loi du χ² non centrée
Densité de probabilité

Image illustrative de l’article Loi du χ² non centrée
Fonction de répartition

Paramètres k > 0 {\displaystyle k>0\,} (degrés de liberté)

λ > 0 {\displaystyle \lambda >0\,} paramètre de décentralisation

Support x [ 0 ; + [ {\displaystyle x\in [0;+\infty [\,}
Densité de probabilité 1 2 e ( x + λ ) / 2 ( x λ ) k / 4 1 / 2 I k / 2 1 ( λ x ) {\displaystyle {\frac {1}{2}}{\rm {e}}^{-(x+\lambda )/2}\left({\frac {x}{\lambda }}\right)^{k/4-1/2}I_{k/2-1}({\sqrt {\lambda x}})}
Fonction de répartition 1 Q k 2 ( λ , x ) {\displaystyle 1-Q_{\frac {k}{2}}\left({\sqrt {\lambda }},{\sqrt {x}}\right)} avec la fonction Q de Marcum Q M ( a , b ) {\displaystyle Q_{M}(a,b)}
Espérance k + λ {\displaystyle k+\lambda \,}
Variance 2 ( k + 2 λ ) {\displaystyle 2(k+2\lambda )\,}
Asymétrie 2 3 / 2 ( k + 3 λ ) ( k + 2 λ ) 3 / 2 {\displaystyle {\frac {2^{3/2}(k+3\lambda )}{(k+2\lambda )^{3/2}}}}
Kurtosis normalisé 12 ( k + 4 λ ) ( k + 2 λ ) 2 {\displaystyle {\frac {12(k+4\lambda )}{(k+2\lambda )^{2}}}}
Fonction génératrice des moments exp ( λ t 1 2 t ) ( 1 2 t ) k / 2 {\displaystyle {\frac {\exp \left({\frac {\lambda t}{1-2t}}\right)}{(1-2t)^{k/2}}}} pour t < 1/2
Fonction caractéristique exp ( i λ t 1 2 i t ) ( 1 2 i t ) k / 2 {\displaystyle {\frac {\exp \left({\frac {i\lambda t}{1-2it}}\right)}{(1-2it)^{k/2}}}}
modifier Consultez la documentation du modèle

En théorie des probabilités et en statistique, la loi du χ2 non centrée est une loi de probabilité qui généralise la loi du χ². Cette loi apparait lors de tests statistiques, par exemple pour le maximum de vraisemblance.

Motivations

Soit Xi, k variables aléatoires indépendantes de loi normale de moyennes μ i {\displaystyle \mu _{i}} et variances σ i 2 {\displaystyle \sigma _{i}^{2}} . Alors la variable aléatoire

i = 1 k ( X i σ i ) 2 {\displaystyle \sum _{i=1}^{k}\left({\frac {X_{i}}{\sigma _{i}}}\right)^{2}}

suit une loi du χ2 non centrée. Elle dépend de deux paramètres : k qui spécifie le nombre de degrés de liberté (c'est-à-dire le nombre de Xi), et λ qui est en lien avec la moyenne des variables Xi par la formule :

λ = i = 1 k ( μ i σ i ) 2 . {\displaystyle \lambda =\sum _{i=1}^{k}\left({\frac {\mu _{i}}{\sigma _{i}}}\right)^{2}.}

λ {\displaystyle \lambda } est parfois appelé le paramètre de décentralisation. Certaines références définissent λ différemment, comme la moyenne de la somme ci-dessus ou comme sa racine carrée.

Cette loi apparait en statistique multivariée, elle est issue de la loi normale multidimensionnelle. Comme la loi du χ² est le carré de la norme du vecteur aléatoire défini à partir des variables de loi N ( 0 k , I k ) {\displaystyle {\mathcal {N}}(0_{k},I_{k})} (c'est-à-dire le carré de la distance entre l'origine et un point donné par cette loi), la loi du χ2 non centrée est le carré de la norme d'un vecteur aléatoire de loi N ( μ , I k ) {\displaystyle {\mathcal {N}}(\mu ,I_{k})} . Ici 0k est le vecteur nul de longueur k, μ = ( μ 1 , . . . , μ k ) {\displaystyle \mu =(\mu _{1},...,\mu _{k})} et Ik est la matrice unité de taille k.

Définition

La densité de probabilité est donnée par :

{ f X ( x ; k , λ ) = i = 0 e λ / 2 ( λ / 2 ) i i ! f Y k + 2 i ( x )  si  x > 0 0  sinon {\displaystyle {\begin{cases}f_{X}(x;k,\lambda )=\sum _{i=0}^{\infty }{\dfrac {{\rm {e}}^{-\lambda /2}(\lambda /2)^{i}}{i!}}f_{Y_{k+2i}}(x)&{\text{ si }}x>0\\0&{\text{ sinon}}\end{cases}}}

Yq est de loi du χ² à q degrés de liberté.

De cette représentation, la loi du χ2 non centrée est vue comme une loi mélange de loi du χ 2 {\displaystyle \chi ^{2}} . Supposons que la variable J suit une loi de Poisson avec moyenne λ/2, et que la loi conditionnelle de Z sachant J = i est la loi du χ2 à k+2i degrés de liberté. Alors la loi (non conditionnelle) de Z est la loi du χ2 non centrée à k degrés de liberté, et avec paramètre de décentralisation λ {\displaystyle \lambda } .

D'une autre part, la densité peut être écrite sous la forme

f X ( x ; k , λ ) = 1 2 e ( x + λ ) / 2 ( x λ ) k / 4 1 / 2 I k / 2 1 ( λ x ) {\displaystyle f_{X}(x;k,\lambda )={\frac {1}{2}}{\rm {e}}^{-(x+\lambda )/2}\left({\frac {x}{\lambda }}\right)^{k/4-1/2}I_{k/2-1}({\sqrt {\lambda x}})}

Iν(z) est la fonction de Bessel modifiée du premier type donnée par

I a ( y ) = ( y / 2 ) a j = 0 ( y 2 / 4 ) j j ! Γ ( a + j + 1 ) . {\displaystyle I_{a}(y)=(y/2)^{a}\sum _{j=0}^{\infty }{\frac {(y^{2}/4)^{j}}{j!\Gamma (a+j+1)}}.}

En utilisant la relation entre les fonctions de Bessel et hypergéométrique, la densité peut également être écrite sous la forme[1] :

f X ( x ; k , λ ) = e λ / 2 0 F 1 ( ; k / 2 ; λ x / 4 ) 1 2 k / 2 Γ ( k / 2 ) e x / 2 x k / 2 1 . {\displaystyle f_{X}(x;k,\lambda )={{\rm {e}}^{-\lambda /2}}_{0}F_{1}(;k/2;\lambda x/4){\frac {1}{2^{k/2}\Gamma (k/2)}}{\rm {e}}^{-x/2}x^{k/2-1}.}

Siegel (1979) considère plus particulièrement le cas k=0 (0 degré de liberté), dans ce cas la loi est atomique en 0.

Propriétés

Fonction génératrice des moments

La fonction génératrice des moments est donnée par

M ( t ; k , λ ) = exp ( λ t 1 2 t ) ( 1 2 t ) k / 2 . {\displaystyle M(t;k,\lambda )={\frac {\exp \left({\frac {\lambda t}{1-2t}}\right)}{(1-2t)^{k/2}}}.}

Moments

Les premiers moments sont :

μ 1 = k + λ {\displaystyle \mu _{1}^{'}=k+\lambda }
μ 2 = ( k + λ ) 2 + 2 ( k + 2 λ ) {\displaystyle \mu _{2}^{'}=(k+\lambda )^{2}+2(k+2\lambda )}
μ 3 = ( k + λ ) 3 + 6 ( k + λ ) ( k + 2 λ ) + 8 ( k + 3 λ ) {\displaystyle \mu _{3}^{'}=(k+\lambda )^{3}+6(k+\lambda )(k+2\lambda )+8(k+3\lambda )}
μ 4 = ( k + λ ) 4 + 12 ( k + λ ) 2 ( k + 2 λ ) + 4 ( 11 k 2 + 44 k λ + 36 λ 2 ) + 48 ( k + 4 λ ) {\displaystyle \mu _{4}^{'}=(k+\lambda )^{4}+12(k+\lambda )^{2}(k+2\lambda )+4(11k^{2}+44k\lambda +36\lambda ^{2})+48(k+4\lambda )}

Les premiers moments centrés sont :

μ 2 = 2 ( k + 2 λ ) {\displaystyle \mu _{2}=2(k+2\lambda )\,}
μ 3 = 8 ( k + 3 λ ) {\displaystyle \mu _{3}=8(k+3\lambda )\,}
μ 4 = 12 ( k + 2 λ ) 2 + 48 ( k + 4 λ ) {\displaystyle \mu _{4}=12(k+2\lambda )^{2}+48(k+4\lambda )\,}

Le n-ième cumulant est

K n = 2 n 1 ( n 1 ) ! ( k + n λ ) . {\displaystyle K_{n}=2^{n-1}(n-1)!(k+n\lambda ).\,}

Ainsi

μ n = 2 n 1 ( n 1 ) ! ( k + n λ ) + j = 1 n 1 ( n 1 ) ! 2 j 1 ( n j ) ! ( k + j λ ) μ n j . {\displaystyle \mu _{n}^{'}=2^{n-1}(n-1)!(k+n\lambda )+\sum _{j=1}^{n-1}{\frac {(n-1)!2^{j-1}}{(n-j)!}}(k+j\lambda )\mu _{n-j}^{'}.}

Fonction de répartition

En utilisant encore la relation entre les lois du χ2 centrée et non centrée, la fonction de répartition peut s'écrire sous la forme

P ( x ; k , λ ) = e λ / 2 j = 0 ( λ / 2 ) j j ! Q ( x ; k + 2 j ) {\displaystyle P(x;k,\lambda )={\rm {e}}^{-\lambda /2}\;\sum _{j=0}^{\infty }{\frac {(\lambda /2)^{j}}{j!}}Q(x;k+2j)}

Q(x ; k) est la fonction de répartition de la loi du χ2 à k degrés de liberté donnée par :

Q ( x ; k ) = γ ( k / 2 , x / 2 ) Γ ( k / 2 ) {\displaystyle Q(x;k)={\frac {\gamma (k/2,x/2)}{\Gamma (k/2)}}\,}
et où γ(k,z) est la fonction gamma incomplète.

La fonction Q de Marcum QM(a,b) peut également être utilisée pour formuler la fonction de répartition[2] :

P ( x ; k , λ ) = 1 Q k 2 ( λ , x ) {\displaystyle P(x;k,\lambda )=1-Q_{\frac {k}{2}}\left({\sqrt {\lambda }},{\sqrt {x}}\right)}

Approximation

Sankaran[3] propose plusieurs formes approchées de la fonction de répartition. Dans un article précédent[4], il formule l'expression suivante :

P ( x ; k , λ ) Φ [ ( x k + λ ) h ( 1 + h p ( h 1 0.5 ( 2 h ) m p ) ) h 2 p ( 1 + 0.5 m p ) ] {\displaystyle P(x;k,\lambda )\approx \Phi \left[{\frac {({\frac {x}{k+\lambda }})^{h}-(1+hp(h-1-0.5(2-h)mp))}{h{\sqrt {2p}}(1+0.5mp)}}\right]}

Φ ( ) {\displaystyle \Phi (\cdot )\,} est la fonction de répartition de la loi normale,
h = 1 2 3 ( k + λ ) ( k + 3 λ ) ( k + 2 λ ) 2 , {\displaystyle h=1-{\frac {2}{3}}{\frac {(k+\lambda )(k+3\lambda )}{(k+2\lambda )^{2}}}\,,}
p = k + 2 λ ( k + λ ) 2 , {\displaystyle p={\frac {k+2\lambda }{(k+\lambda )^{2}}},}
m = ( h 1 ) ( 1 3 h ) . {\displaystyle m=(h-1)(1-3h)\,.}

Cette approximation ainsi que d'autres sont données dans un livre ultérieur[5].

Pour approcher la loi du χ2, le paramètre de décentralisation λ est égal à zéro.


Liens avec d'autres lois

  • Si V est de loi du χ², V χ k 2 {\displaystyle V\sim \chi _{k}^{2}} , alors V {\displaystyle V} est également de loi du χ2 non centrée : V χ k 2 ( 0 ) {\displaystyle V\sim {\chi '}_{k}^{2}(0)} .
  • Si V 1 χ k 1 2 ( λ ) {\displaystyle V_{1}\sim {\chi '}_{k_{1}}^{2}(\lambda )} , V 2 χ k 2 2 ( 0 ) {\displaystyle V_{2}\sim {\chi '}_{k_{2}}^{2}(0)} , et V1 et V2 sont indépendantes, alors V 1 / k 1 V 2 / k 2 {\displaystyle {\frac {V_{1}/k_{1}}{V_{2}/k_{2}}}} est de loi de Fisher non centrée : V 1 / k 1 V 2 / k 2 F k 1 , k 2 ( λ ) {\displaystyle {\frac {V_{1}/k_{1}}{V_{2}/k_{2}}}\sim F'_{k_{1},k_{2}}(\lambda )} .
  • Si J P ( λ 2 ) {\displaystyle J\sim {\mathcal {P}}({\frac {\lambda }{2}})} , où P {\displaystyle {\mathcal {P}}} désigne la loi de Poisson, alors χ k + 2 J 2 χ k 2 ( λ ) {\displaystyle \chi _{k+2J}^{2}\sim {\chi '}_{k}^{2}(\lambda )}
  • Approximation par la loi normale[6] : si V χ k 2 ( λ ) {\displaystyle V\sim {\chi '}_{k}^{2}(\lambda )} , alors V ( k + λ ) 2 ( k + 2 λ ) N ( 0 , 1 ) {\displaystyle {\frac {V-(k+\lambda )}{\sqrt {2(k+2\lambda )}}}\to {\mathcal {N}}(0,1)} en probabilité lorsque k {\displaystyle k\to \infty } ou λ {\displaystyle \lambda \to \infty } .

Transformations

Sankaran (1963) étudie les transformations de la forme z = [ ( X b ) / ( k + λ ) ] 1 / 2 {\displaystyle z=[(X-b)/(k+\lambda )]^{1/2}} . Il analyse le développement des cumulants de z de l'ordre de O ( ( k + λ ) 4 ) {\displaystyle O((k+\lambda )^{-4})} et montre que les choix suivants de b donnent les résultats raisonnables suivants :

  • b = ( k 1 ) / 2 {\displaystyle b=(k-1)/2} rend le second cumulant de z approximativement indépendant de λ,
  • b = ( k 1 ) / 3 {\displaystyle b=(k-1)/3} rend le troisième cumulant de z approximativement indépendant de λ,
  • b = ( k 1 ) / 4 {\displaystyle b=(k-1)/4} rend le quatrième cumulant de z approximativement indépendant de λ.

De plus, une transformation plus simple, z 1 = ( X ( k 1 ) / 2 ) 1 / 2 {\displaystyle z_{1}=(X-(k-1)/2)^{1/2}} , peut être utilisée comme fonction de stabilisation de variance qui produit une variable aléatoire de moyenne ( λ + ( k 1 ) / 2 ) 1 / 2 {\displaystyle (\lambda +(k-1)/2)^{1/2}} et de variance O ( ( k + λ ) 2 ) {\displaystyle O((k+\lambda )^{-2})} .

L'utilisation de ces transformations peut être altérée par le fait de considérer les racines carrées de nombres négatifs.

Différentes lois du χ et χ2
Lois en fonction de variables de loi normale
loi du χ² i = 1 k ( X i μ i σ i ) 2 {\displaystyle \sum _{i=1}^{k}\left({\frac {X_{i}-\mu _{i}}{\sigma _{i}}}\right)^{2}}
loi du χ² non centrée i = 1 k ( X i σ i ) 2 {\displaystyle \sum _{i=1}^{k}\left({\frac {X_{i}}{\sigma _{i}}}\right)^{2}}
loi du χ i = 1 k ( X i μ i σ i ) 2 {\displaystyle {\sqrt {\sum _{i=1}^{k}\left({\frac {X_{i}-\mu _{i}}{\sigma _{i}}}\right)^{2}}}}
loi du χ non centrée i = 1 k ( X i σ i ) 2 {\displaystyle {\sqrt {\sum _{i=1}^{k}\left({\frac {X_{i}}{\sigma _{i}}}\right)^{2}}}}

Références

  1. Muirhead (2005) Theorem 1.3.4
  2. Nuttall, Albert H. (1975): Some Integrals Involving the QM Function, IEEE Transactions on Information Theory, 21(1), 95-96, (ISSN 0018-9448)
  3. Sankaran, M. (1963). Approximations to the non-central chi-squared distribution Biometrika, 50(1-2), 199–204
  4. Sankaran, M. (1959). "On the non-central chi-squared distribution", Biometrika 46, 235–237
  5. Johnson et al. (1995) Section 29.8
  6. Muirhead (2005) pages 22–24 and problem 1.18.
  • Abramowitz, M. and Stegun, I.A. (1972), Handbook of Mathematical Functions, Dover. Section 26.4.25.
  • Johnson, N. L., Kotz, S., Balakrishnan, N. (1970), Continuous Univariate Distributions, Volume 2, Wiley. (ISBN 0-471-58494-0)
  • Muirhead, R. (2005) Aspects of Multivariate Statistical Theory (2nd Edition). Wiley. (ISBN 0471769851)
  • Siegel, A.F. (1979), "The noncentral chi-squared distribution with zero degrees of freedom and testing for uniformity", Biometrika, 66, 381–386
v · m
Lois discrètes
à support fini
0 paramètre de forme
1 paramètre de forme
2 paramètres de forme
3 paramètres de forme
N paramètres de forme
à support infini
0 paramètre de forme
1 paramètre de forme
2 paramètres de forme
3 paramètres de forme
Lois absolument continues
à support compact
0 paramètre de forme
1 paramètre de forme
2 paramètres de forme
3 paramètres de forme
à support semi-infini
0 paramètre de forme
1 paramètre de forme
2 paramètres de forme
3 paramètres de forme
N paramètres de forme
à support infini
0 paramètre de forme
1 paramètre de forme
2 paramètres de forme
Autres types de lois
Lois à support mixte continu-discret
Lois à support variable
Lois multidimensionnelles
Discrètes
Continues
Matricielles
Lois directionnelles
Univariantes
Sphériques bidimensionnelles
Toroïdales bidimensionnelles
Multidimensionnelles
Lois singulières
Familles de lois
  • icône décorative Portail des probabilités et de la statistique