Aannemelijkheidsquotiënttoets

In de statistiek is een aannemelijkheidsquotiënttoets, vaak ook aangeduid met de Engelse term likelihood-ratiotest, een parametrische toets die als toetsingsgrootheid een aannemelijkheidsquotiënt, of een functie daarvan, heeft. De toets vergelijkt de aannemelijkheid van de parameterwaarde(n) onder de nulhypothese met de aannemelijkheid van de waarde(n) onder de alternatieve hypothese en verwerpt de nulhypothese als de parameterwaarde(n) onder de alternatieve hypothese significant aannemelijker zijn dan die onder de nulhypothese. Veel klassieke toetsen, zoals de F-toets en de t-toets voor twee steekproeven kunnen als aannemelijkheidsquotiënttoets beschouwd worden.

Enkelvoudige hypothesen

In het eenvoudige geval van een enkelvoudige nul- en alternatieve hypothese

H 0 : θ = θ 0 {\displaystyle {\text{H}}_{0}:\theta =\theta _{0}}

tegen

H 1 : θ = θ 1 ( θ 1 θ 0 ) {\displaystyle {\text{H}}_{1}:\theta =\theta _{1}(\theta _{1}\neq \theta _{0})} ,

is de toetsingsgrootheid van de aannemelijkheidsquotiënttoets gegeven door het aannemelijkheidsquotiënt[1][2] (verondersteld dat dit goed gedefinieerd is)

Λ ( x 1 , , x n ) = L ( θ 0 | x 1 , , x n ) L ( θ 1 | x 1 , , x n ) = f θ 0 ( x 1 , , x n ) f θ 1 ( x 1 , , x n ) {\displaystyle \Lambda (x_{1},\ldots ,x_{n})={\frac {L(\theta _{0}|x_{1},\ldots ,x_{n})}{L(\theta _{1}|x_{1},\ldots ,x_{n})}}={\frac {f_{\theta _{0}}(x_{1},\ldots ,x_{n})}{f_{\theta _{1}}(x_{1},\ldots ,x_{n})}}}

of equivalent door

Λ ( x 1 , , x n ) = L ( θ 0 | x 1 , , x n ) sup { L ( θ | x 1 , , x n ) : θ { θ 0 , θ 1 } } {\displaystyle \Lambda (x_{1},\ldots ,x_{n})={\frac {L(\theta _{0}|x_{1},\ldots ,x_{n})}{\sup\{L(\theta |x_{1},\ldots ,x_{n}):\theta \in \{\theta _{0},\theta _{1}\}\}}}} ,

waarin L {\displaystyle L} de aannemelijkheidsfunctie is en f θ {\displaystyle f_{\theta }} de betrokken kansfunctie of kansdichtheid.

De nulhypothese wordt verworpen voor kleine waarden van het aannemelijkheidsquotiënt, immers in die gevallen is de alternatieve waarde θ 1 {\displaystyle \theta _{1}} van de parameter aannemelijker dan de waarde θ 0 {\displaystyle \theta _{0}} . Het kritieke gebied is dus:

{ ( x 1 , , x n ) | Λ ( x 1 , , x n ) < c } {\displaystyle \{(x_{1},\ldots ,x_{n})|\Lambda (x_{1},\ldots ,x_{n})<c\}}

Volgens het lemma van Neyman en Pearson is deze aannemelijkheidsquotiënttoets de meest onderscheidende toets onder de toetsen met dezelfde onbetrouwbaarheid (statistiek).

Samengestelde hypothesen

In het algemeen hebben de nul- en alternatieve hypothese de vorm

H 0 : θ Θ 0 {\displaystyle {\text{H}}_{0}:\theta \in \Theta _{0}}

tegen

H 1 : θ Θ 1 ( Θ 1 Θ 0 = ) {\displaystyle {\text{H}}_{1}:\theta \in \Theta _{1}(\Theta _{1}\cap \Theta _{0}=\varnothing )}

Daarbij zullen in veel gevallen Θ 0 {\displaystyle \Theta _{0}} en Θ 1 {\displaystyle \Theta _{1}} een partitie vormen van de parameterruitme Θ {\displaystyle \Theta } , zodat Θ 1 {\displaystyle \Theta _{1}} het complement is van Θ 0 {\displaystyle \Theta _{0}} .

De toetsingsgrootheid van de aannemelijkheidsquotiënttoets wordt gegeven door het quotiënt

Λ ( x 1 , , x n ) = sup θ Θ 0 L ( θ | x 1 , , x n ) sup θ Θ L ( θ | x 1 , , x n ) {\displaystyle \Lambda (x_{1},\ldots ,x_{n})={\frac {\sup _{\theta \in \Theta _{0}}L(\theta |x_{1},\ldots ,x_{n})}{\sup _{\theta \in \Theta }L(\theta |x_{1},\ldots ,x_{n})}}} ,

waarin

L ( θ | x 1 , , x n ) = f θ ( x 1 , , x n ) {\displaystyle L(\theta |x_{1},\ldots ,x_{n})=f_{\theta }(x_{1},\ldots ,x_{n})}

de aannemelijkheidsfunctie is, met f θ {\displaystyle f_{\theta }} de betrokken kansfunctie of kansdichtheid.[3]

De nulhypothese wordt ook hier verworpen voor kleine waarden van het aannemelijkheidsquotiënt. Het kritieke gebied is dus:

{ ( x 1 , , x n ) | Λ ( x 1 , , x n ) < c } {\displaystyle \{(x_{1},\ldots ,x_{n})|\Lambda (x_{1},\ldots ,x_{n})<c\}}

Opmerking

Sommige auteurs definiëren op equivalente wijze het aannemelijkheidsquotiënt als het omgekeerde van het hier gedefinieerde.[4]

Verdeling onder de nulhypothese

Voor het bepalen van de bovengenoemde kritieke waarde c {\displaystyle c} is de verdeling onder de nulhypothese nodig van de toetsingsgrootheid Λ {\displaystyle \Lambda } . In veel gevallen is deze verdeling zeer moeilijk te bepalen of niet exact bekend, maar is wel een asymptotische benadering mogelijk.

Logaritme

In veel gevallen zal de toets uitgevoerd worden met een aselecte steekproef. Dan is de simultane verdeling bepaald door:

f θ ( x 1 , , x n ) = f θ ( x 1 ) f θ ( x n ) {\displaystyle f_{\theta }(x_{1},\ldots ,x_{n})=f_{\theta }(x_{1})\cdot \ldots \cdot f_{\theta }(x_{n})}

Het is dan veelal eenvoudiger om te werken met de logaritme van de aannemelijkheidsfunctie:

log L ( θ | x 1 , , x n ) = log f θ ( x 1 , , x n ) = log ( f θ ( x 1 ) f θ ( x n ) ) = log f θ ( x 1 ) + + log f θ ( x n ) {\displaystyle \log L(\theta |x_{1},\ldots ,x_{n})=\log f_{\theta }(x_{1},\ldots ,x_{n})=\log \left(f_{\theta }(x_{1})\cdot \ldots \cdot f_{\theta }(x_{n})\right)=\log f_{\theta }(x_{1})+\ldots +\log f_{\theta }(x_{n})}

Omdat de logaritme monotoon stijgend is, zal de toets gebaseerd op de logaritme van het aannemelijkheidsquotiënt equivalent zijn met de aannemelijkheidsquotiënttoets zelf.

Voorbeeld

De stochastische variabelen X 1 , , X n {\displaystyle X_{1},\ldots ,X_{n}} vormen een aselecte steekproef uit een normale verdeling met bekende variantie σ 2 {\displaystyle \sigma ^{2}} en onbekende verwachtingswaarde μ {\displaystyle \mu } . Voor het toetsen van

H 0 : μ = μ 0 {\displaystyle {\text{H}}_{0}:\mu =\mu _{0}}

tegen

H 1 : μ = μ 1 < μ 0 {\displaystyle {\text{H}}_{1}:\mu =\mu _{1}<\mu _{0}}

met de aannemelijkheidsquotiënttoets is de toetsingsgrootheid:

Λ ( X 1 , , X n ) = exp ( 1 2 σ 2 i = 1 n ( ( X i μ 1 ) 2 ( X i μ 0 ) 2 ) ) = {\displaystyle \Lambda (X_{1},\ldots ,X_{n})=\exp \left({\frac {1}{2\sigma ^{2}}}\sum _{i=1}^{n}\left((X_{i}-\mu _{1})^{2}-(X_{i}-\mu _{0})^{2}\right)\right)=}
= exp ( 1 σ 2 i = 1 n X i ( μ 0 μ 1 ) ) exp ( n 2 σ 2 ( μ 0 2 μ 1 2 ) ) {\displaystyle =\exp \left({\frac {1}{\sigma ^{2}}}\sum _{i=1}^{n}X_{i}(\mu _{0}-\mu _{1})\right)\exp \left(-{\frac {n}{2\sigma ^{2}}}(\mu _{0}^{2}-\mu _{1}^{2})\right)}

De nulhypothese wordt verworpen voor kleine waarden van Λ {\displaystyle \Lambda } , wat erop neerkomt dat

i = 1 n X i < c {\displaystyle \sum _{i=1}^{n}X_{i}<c}

of equivalent

X ¯ < c {\displaystyle {\bar {X}}<c'} ,

wat de bekende Gauß-toets oplevert.

In dit geval zou ook goed de logaritme van het aannemelijkheidsquotiënt gebruikt kunnen worden:

log Λ ( X 1 , , X n ) = 1 σ 2 i = 1 n X i ( μ 0 μ 1 ) n 2 σ 2 ( μ 0 2 μ 1 2 ) {\displaystyle \log \Lambda (X_{1},\ldots ,X_{n})={\frac {1}{\sigma ^{2}}}\sum _{i=1}^{n}X_{i}(\mu _{0}-\mu _{1})-{\frac {n}{2\sigma ^{2}}}(\mu _{0}^{2}-\mu _{1}^{2})}

Zie ook

Referenties

Bronnen, noten en/of referenties
  1. Mood, A.M.; Graybill, F.A. (1963) Introduction to the Theory of Statistics, 2nd edition. McGraw-Hill ISBN 978-0070428638 (blz. 286)
  2. Kendall, M.G., Stuart, A. (1973) The Advanced Theory of Statistics, Volume 2, Griffin. ISBN 0852642156 (blz. 234)
  3. Casella, George; Berger, Roger L. (2001) Statistical Inference, Second edition. ISBN 978-0534243128 (blz. 375)
  4. Cox, D. R. and Hinkley, D. V Theoretical Statistics, Chapman and Hall, 1974. (blz. 92)