Regresión semiparamétrica

En estadística, la regresión semiparamétrica es una regresión que combina modelos paramétricos y no paramétricos. Se utiliza a menudo en situaciones en las que el modelo no paramétrico no puede funcionar totalmente bien, o cuando el investigador quiere usar un modelo paramétrico, pero la forma funcional con respecto a un subconjunto de los regresores o la densidad de los errores no se conoce. Los modelos de regresión paramétricos son un tipo particular del modelado semiparamétrico, ya que los modelos semiparamétricos contienen un componente paramétrico.

Estimación

Se han propuesto y desarrollado muchos métodos de regresión semiparamétricos diferentes. Los métodos más conocidos son los modelos parcialmente lineales, índices y de coeficientes variables.

Modelos parcialmente lineales

Un modelo parcialmente lineal está dado por:

Y i = X i β + g ( Z i ) + u i , i = 1 , , n , {\displaystyle Y_{i}=X'_{i}\beta +g\left(Z_{i}\right)+u_{i},\,\quad i=1,\ldots ,n,\,}

donde Y i {\displaystyle Y_{i}} es la variable dependiente, X i {\displaystyle X_{i}} y Z i {\displaystyle Z_{i}} son p × 1 {\displaystyle p\times 1} un vector de variables explicatorias, β {\displaystyle \beta } es un p × 1 {\displaystyle p\times 1} vector parámetros desconocidos y Z i R q {\displaystyle Z_{i}\in \operatorname {R} ^{q}} . La parte paramétrica del modelo parcialmente lineal está dada por el vector de parámetros β {\displaystyle \beta } mientras que la parte no paramétrico es la función desconocida g ( Z i ) {\displaystyle g\left(Z_{i}\right)} . Los datos se supone que es iid con E ( u i | X i , Z i ) = 0 {\displaystyle E\left(u_{i}|X_{i},Z_{i}\right)=0} y el modelo permite una condicionalmente heteroscedasticos proceso de error E ( u i 2 | x , z ) = σ 2 ( x , z ) {\displaystyle E\left(u_{i}^{2}|x,z\right)=\sigma ^{2}\left(x,z\right)} forma de desconocido. Este tipo de modelo fue propuesto por Robinson (1988) y se extendió a manejar covariables categóricas de Racine y Liu (2007).

Este método se implementa mediante la obtención de un n {\displaystyle {\sqrt {n}}} estimador consistente de β {\displaystyle \beta } y luego derivar un estimador de g ( Z i ) {\displaystyle g\left(Z_{i}\right)} de la regresión no paramétrica de Y i X i β ^ {\displaystyle Y_{i}-X'_{i}{\hat {\beta }}} en z {\displaystyle z} utilizando un método de regresión no paramétrica apropiada.[1]

Modelos de indexación

Un modelo de índice único toma la forma:

Y = g ( X β 0 ) + u , {\displaystyle Y=g\left(X'\beta _{0}\right)+u,\,}

donde Y {\displaystyle Y} , X {\displaystyle X} y β 0 {\displaystyle \beta _{0}} fueron definidos anteriormente y el término de error u {\displaystyle u} satisface E ( u | X ) = 0 {\displaystyle E\left(u|X\right)=0} . El modelo único índice toma su nombre de la parte paramétrica del modelo de x β {\displaystyle x'\beta } ue es un solo índice escalar. La parte no paramétrica es la función desconocida g ( ) {\displaystyle g\left(\cdot \right)} .

El método de Ichimura

El texto que sigue es una traducción defectuosa. Si quieres colaborar con Wikipedia, busca el artículo original y mejora esta traducción.
Copia y pega el siguiente código en la página de discusión del autor de este artículo: {{subst:Aviso mal traducido|Regresión semiparamétrica}} ~~~~

El método de modelo de índice único desarrollado por Ichimura (1993) es la siguiente. Tenga en cuenta la situación en la que y {\displaystyle y} es continua. Dada una forma conocida para la función g ( ) {\displaystyle g\left(\cdot \right)} , β 0 {\displaystyle \beta _{0}} podría ser estimado utilizando el método de mínimos cuadrados no lineales para reducir la función al mínimo.

i = 1 ( Y i g ( X i β ) ) 2 . {\displaystyle \sum _{i=1}\left(Y_{i}-g\left(X'_{i}\beta \right)\right)^{2}.}

Dado que la forma funcional de g ( ) {\displaystyle g\left(\cdot \right)} no se sabe, hay que estimarla. Para un valor dado de β {\displaystyle \beta } una estimación de la función

G ( X i β ) = E ( Y i | X i β ) = E [ g ( X i β o ) | X i β ] {\displaystyle G\left(X'_{i}\beta \right)=E\left(Y_{i}|X'_{i}\beta \right)=E\left[g\left(X'_{i}\beta _{o}\right)|X'_{i}\beta \right]}

usando kernel método. Ichimura (1993) propone estimar g ( X i β ) {\displaystyle g\left(X'_{i}\beta \right)} con

G ^ i ( X i β ) , {\displaystyle {\hat {G}}_{-i}\left(X'_{i}\beta \right),\,}

la licencia-un-out kernel no paramétrico estimador de G ( X i β ) {\displaystyle G\left(X'_{i}\beta \right)} ..

Estimador de Klein y Spady

Si la variable dependiente y {\displaystyle y} es binaria y X i {\displaystyle X_{i}} and u i {\displaystyle u_{i}} se supone que son independientes, Klein y Spady (1993) proponen una técnica para estimar β {\displaystyle \beta } utilizando métodos de máxima verosimilitud. La función de verosimilitud viene dada por:

L ( β ) = i ( 1 Y i ) ln ( 1 g ^ i ( X i β ) ) + i Y i ln ( g ^ i ( X i β ) ) , {\displaystyle L\left(\beta \right)=\sum _{i}\left(1-Y_{i}\right)\ln \left(1-{\hat {g}}_{-i}\left(X'_{i}\beta \right)\right)+\sum _{i}Y_{i}\ln \left({\hat {g}}_{-i}\left(X'_{i}\beta \right)\right),}

donde g ^ i ( X i β ) {\displaystyle {\hat {g}}_{-i}\left(X'_{i}\beta \right)} es la licencia-un-out estimador.

Coeficiente de Smooth / variando modelos de coeficientes

Hastie y Tibshirani (1993) proponen un modelo de coeficiente lisa dada por:

Y i = α ( Z i ) + X i β ( Z i ) + u i = ( 1 + X i ) ( α ( Z i ) β ( Z i ) ) + u i = W i γ ( Z i ) + u i , {\displaystyle Y_{i}=\alpha \left(Z_{i}\right)+X'_{i}\beta \left(Z_{i}\right)+u_{i}=\left(1+X'_{i}\right)\left({\begin{array}{c}\alpha \left(Z_{i}\right)\\\beta \left(Z_{i}\right)\end{array}}\right)+u_{i}=W'_{i}\gamma \left(Z_{i}\right)+u_{i},}

donde X i {\displaystyle X_{i}} is a k × 1 {\displaystyle k\times 1} vector and β ( z ) {\displaystyle \beta \left(z\right)} es un vector de funciones suaves no especificadas de z {\displaystyle z} .

γ ( ) {\displaystyle \gamma \left(\cdot \right)} puede ser expresado como:

γ ( Z i ) = ( E [ W i W i | Z i ] ) 1 E [ W i Y i | Z i ] . {\displaystyle \gamma \left(Z_{i}\right)=\left(E\left[W_{i}W'_{i}|Z_{i}\right]\right)^{-1}E\left[W_{i}Y_{i}|Z_{i}\right].}

Referencias

  1. See Li and Racine (2007) for an in depth look at nonparametric regression methods.
  • Robinson, P.M. (1988). «Root-n Consistent Semiparametric Regression». Econometrica (The Econometric Society) 56 (4): 931-954. JSTOR 1912705. doi:10.2307/1912705. 
  • Li, Qi; Racine, Jeffrey S. (2007). Nonparametric Econometrics: Theory and Practice. Princeton University Press. ISBN 0-691-12161-3. 
  • Racine, J.S.; Qui, L. (2007). «A Partially Linear Kernel Estimator for Categorical Data». Unpublished Manuscript, Mcmaster University. 
  • Ichimura, H. (1993). «Semiparametric Least Squares (SLS) and Weighted SLS Estimation of Single Index Models». Journal of Econometrics 58: 71-120. doi:10.1016/0304-4076(93)90114-K. 
  • Klein, R. W.; R. H. Spady (1993). «An Efficient Semiparametric Estimator for Binary Response Models». Econometrica (The Econometric Society) 61 (2): 387-421. JSTOR 2951556. doi:10.2307/2951556.  La referencia utiliza el parámetro obsoleto |coautores= (ayuda)
  • Hastie, T.; R. Tibshirani (1993). «Varying-Coefficient Models». Journal of the Royal Statistical Society, Series B 55: 757-796.  La referencia utiliza el parámetro obsoleto |coautores= (ayuda)
Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q7449609
  • Wd Datos: Q7449609