MiFee - CL - 2009-12-012009259pauta - Examen (E-Views)
MiFee - CL - 2009-12-012009259pauta - Examen (E-Views)
MiFee - CL - 2009-12-012009259pauta - Examen (E-Views)
Econometrı́a I
Profesores: José Miguel Benavente, Pamela Jervis, Andrés Sagner, Javier Turén
Ayudantes: Alejandra Abufhele, Roberto Gillmore, Iván Gutierrez, Daniela Luengo,
Francisca Pacheco, Carmen Quezada y Pedro Roje.
Primavera 2009
Pauta Examen
1. (10 puntos) Si los regresores del modelo de regresión lineal son estocásticos, los esti-
madores β̂ seguirán cumpliendo con el Teorema de Gauss-Markov.
Respuesta: Falso. Si bien β̂ es incondicionalmente insesgado y su varianza puede ser
descrita en términos del comportamiento medio de los regresores, el supuesto nece-
sario para que el Teorema de Gauss-Markov se cumpla es que los regresores deben ser
ortogonales a los errores.
2. (10 puntos) Suponga que usted estima un modelo de regresión lineal y sospecha que los
residuos de este modelo se encuentran autocorrelacionados y siguen un proceso AR(2).
En vista de esto, el test recomendado para detectar dicha autocorrelación es aquél
propuesto por Durbin-Watson.
Respuesta: Falso. El test de Durbin-Watson sirve para detectar autocorrelación de los
residuos si éstos siguen un proceso AR(1). Los tests sugeridos en este caso son los
propuestos por Breusch-Godfrey o Box-Pierce-Ljung (Q-Stat).
1
Facultad de Economı́a y Negocios Universidad de Chile
2.1. Matemático 1
Suponga que Ud. dispone de una muestra de tamaño N que se distribuye Bernoulli, es decir,
pi (xi ; θ) = θxi (1 − θ)1−xi , i = 1, . . . , N , donde xi es la observación i-ésima de la muestra y
θ el parámetro poblacional asociado a esta distribución1 .
1. (4 puntos) Encuentre una expresión para la Función de Log-Verosimilitud l(θ; X),
donde X = (x1 , x2 , . . . , xN ) es un vector que contiene todas las observaciones de la
muestra.
2. (8 puntos) Encuentre el estimador de Máxima Verosimilitud de θ (θ̂M V ).
3. (8 puntos) Encuentre la varianza de θ̂M V .
Solución:
1. El primer paso consiste en encontrar la Función de Verosimilitud L(θ; X), la cual
corresponde a la función de probabilidad conjunta de los datos:
N
Y
L(θ; X) = pi (xi ; θ)
i=1
x1
= θ (1 − θ)1−x1 · θx2 (1 − θ)1−x2 · . . . · θxN (1 − θ)1−xN
PN PN
xi
= θ i=1 (1 − θ)N − i=1 xi
2
Facultad de Economı́a y Negocios Universidad de Chile
N n
!
∂l(θ; X) 1X 1 X
= xi − N− xi
∂θ θ i=1 1−θ i=1
∂l(θ; X)
|θ̂M V = 0
∂θ
N n
!
1 X 1 X
xi = N− xi
θ̂M V i=1 1 − θ̂M V i=1
N
1 X
θ̂M V = xi
N i=1
∂ 2 l(θ; X)
I(θ) = −E
∂θ2
N N
!
∂ 2 l(θ; X) 1 X 1 X
= − 2 xi − N− xi
∂θ2 θ i=1 (1 − θ)2 i=1
N N
!
∂ 2 l(θ; X) 1 X 1 X
− = xi + N− xi
∂θ2 θ2 i=1 (1 − θ)2 i=1
2 N N
!
∂ l(θ; X) 1 X 1 X
−E = E[xi ] + N− E[xi ]
∂θ2 2
θ i=1 (1 − θ)2 i=1
Nθ N
= + (1 − θ)
θ2 (1 − θ)2
N N
= +
θ (1 − θ)
N
=
θ(1 − θ)
V [θ̂M V ] = I(θ)−1
−1
N
=
θ(1 − θ)
θ(1 − θ)
=
N
3
Facultad de Economı́a y Negocios Universidad de Chile
θ̂M V (1 − θ̂M V )
V [θ̂M V ] =
N
N N
!
1 X 1 X
= xi 1 − xi
N 2 i=1 N i=1
2.2. Matemático 2
Considere el siguiente modelo de regresión lineal para una muestra de tamaño T de datos
en series de tiempo y cuyo término de errror (ut ) es homocedástico, pero presenta auto-
correlación serial del tipo AR(1) pero en el ruido blanco (ε)(A este tipo de procesos se les
conoce como media móvil.):
yt = Xt β + u t
ut = εt + θεt−1
1 + θ2 θ 0 ··· 0
θ 1 + θ2 θ ··· 0
0 θ 1 + θ2 ··· 0
Ω=
.. .. .. .. ..
. . . . .
0 0 0 0 1 + θ2
Solución:
4
Facultad de Economı́a y Negocios Universidad de Chile
2
u2t = (εt + θεt−1 )
= ε2t + 2θεt εt−1 + θ2 ε2t−1
E[u2t ] = E[ε2t + 2θεt εt−1 + θ2 ε2t−1 ]
= σ 2 + 2θ · 0 + θ2 σ 2
= σ 2 (1 + θ2 )
θ
γ1 =
1 + θ2
γ2 = 0
σ 2 (1 + θ2 ) σ2 θ 0 ··· 0
σ 2
θ σ 2
(1 + θ 2
) σ 2
θ ··· 0
0 σ 2
θ σ 2
(1 + θ2 ) ··· 0
E[uu′ ] =
.. .. .. .. ..
. . . . .
0 0 0 0 σ 2 (1 + θ2 )
1 + θ2 θ 0 ··· 0
θ 1 + θ 2
θ · · · 0
2 0 θ 1 + θ 2
· · · 0
= σ
.. .. .. . .. ..
. . . .
0 0 0 0 1 + θ2
5
Facultad de Economı́a y Negocios Universidad de Chile
1 + θ2 θ 0 ··· 0
θ 1 + θ2 θ ··· 0
0 θ 1 + θ2 ··· 0
Ω=
.. .. .. .. ..
. . . . .
0 0 0 0 1 + θ2
2.3. Matemático 3
Considere una regresión en forma matricial de la forma:
Y = Xβ + u
Donde X es de dimensión nxk, Y y u son de dimensión nx1 y β es de kx1. El parámetro
de interés es β. Las propiedades de u son: E(u, X) = 0, E(uu′ ) = Σ. Adémas se sabe que
ΣX = XΘ para alguna matriz Θ no singular de dimensión kxk.
4. (4 puntos) Compare las dos varianzas encontradas, ¿Qué descubrio?. En base a este
resultado, sugiera: ¿con cuál de los dos metódos de estimación propuestos usted se
quedarı́a?.
Solución:
1. Para demostrar esto, debemos recordar que (A·B)−1 = B −1 ·A−1 . Entonces, aplicamos
esta propiedad a la igualdad ΣX = XΘ, obteniendo:
2. Como vimos, en este caso la matriz E(uu′ ) ya no es la matriz identidad, además sabe-
mos que βb = β + (X ′ X)−1 X ′ u, resolviendo la varianza del estimador MCO tenemos:
6
Facultad de Economı́a y Negocios Universidad de Chile
e = (X ′ Σ−1 X)−1
V ar(β)
4. Al comparar las dos varianzas el resultado es directo, para los dos estimadores las
varianzas son iguales. Bajo este resultado, al elegir uno de los modelos para realizar
la estimación nos quedariamos con el MCO ya que es tan eficiente como el MCG y no
necesitariamos estimar la forma de la matriz Σ.
2.4. Matemático 4
Suponga el siguiente modelo:
yt = β1 + β2 x2t + β3 x3t + ut
Donde E(ut ) = 0, y E(u2t ) = tσu2 .
3.1. Ejercicio 1
Suponga que Ud. está interesado en estimar los determinantes de la caja de empresas en
Chile y estima el siguiente modelo de regresión lineal:
donde cash es la caja de empresas (en millones de $), size es una proxy para el tamaño
de las empresas y se encuentra medido como el logaritmo natural de los activos totales (en
millones de $ de 2003), liq es una medida de liquidez de las empresas, y lev es el ratio de
leverage (endeudamiento) de ellas.
Empleando la base de datos ENIA (Encuesta Nacional Industrial Anual), Ud. estima el
modelo anterior en Stata, pero como su computador se “colgó”, los resultados que obtiene
son los siguientes:
7
Facultad de Economı́a y Negocios Universidad de Chile
En base a la información que pudo rescatar, complete los valores faltantes, es decir:
5. (4 puntos) Lı́mites del intervalo de confianza (al 95 %) del coeficiente β̂3 , si se sabe que
el valor crı́tico de este test, para un nivel de significancia α = 0,05, es igual a 1,97. ¿Es
este coeficiente significativo de forma individual para un nivel de significancia del 5 %?
6. (3 puntos) El valor del Test F .
Solución:
1. Para obtener el RSS, consideremos la definición del coeficiente de ajuste R2 y los
valores que disponemos:
RSS
R2 = 1−
T SS
RSS
0,1696 = 1−
8,34668471
RSS = 6,9311
T SS = ESS + RSS
8,34668471 = ESS + 6,9311
ESS = 1,4156
8
Facultad de Economı́a y Negocios Universidad de Chile
β̂1
tβ̂1 =
σβˆ1
−0,0225478
=
0,0030518
= −7,39
4. Análogo al problema anterior, el valor de β̂2 puede ser obtenido a partir de la definición
del test t asociado:
β̂2
tβ̂2 =
σβˆ2
β̂2
−3,71 =
0,0148844
β̂2 = −0,0552
De esta forma el lı́mite inferior del intervalo de confianza, con α = 0,05, es igual a
−0,0855, mientras que el lı́mite superior es igual a −0,0269. Como dicho intervalo de
confianza no contiene el valor 0, concluı́mos que el coeficiente β̂3 es significativo de
forma individual a un nivel de significancia (α) del 5 %.
3.2. Ejercicio 2
Suponga que usted acaba de estimar la siguiente ecuación para el salario:
9
Facultad de Economı́a y Negocios Universidad de Chile
1. (5 puntos) Rellene el cuadro 1 con los datos faltantes, además calcule el TSS y refiérase
sobre la significancia de los parámetros del modelo.
2. (5 puntos) Uno de los problemas tı́picos de este tipo de modelo es la dificultad para
controlar por los distintos niveles de habilidad que poseen los individuos. Para corregir
esto, un econometrista sugiere incorporar el resultado del test de coeficiente intelectual
de los entrevistados, variable llamada IQ, como variable independiente (el resto de los
regresores se mantienen). Los resultados de este modelo se presentan en el cuadro 2.
Se sabe que el número de observaciones es 935, el R2 = 0,265 y LnL = −107865,3.
Refiérase a este nuevo modelo (compárelo con el anterior) , sea concreto en: significancia
de parámetros, cambios en magnitudes y su interpretación económetrica.
3. (5 puntos) Imagine que al mirar un gráfico de los residuos de este modelo se observa que
estos aumentan exponencialmente a medida que el coeficiente de IQ de los individuos
es mayor. ¿Qué problema encontramos?. Explique como lo resolverı́a y la metodologı́a
a usar.
4. (5 puntos) Finalmente, calcule los criterios de selección de modelos AIC y BIC. ¿Son
comparables estos modelos? En base a esto, ¿Con cuál modelo se queda?.
10
Facultad de Economı́a y Negocios Universidad de Chile
Cuadro 1: Resultados
Coeficiente Desv. Estándar Estadı́stico t
Constante 5.14 0.11
Experiencia 0.014 4.67
Matrimonio 0.199 0.135
Urbano 0.184 0.027
Sexo 0.188 4.95
Escolaridad 0.065 0.006
Solución:
1.
5,14
tConstante = = 46,7
0,11
0,199
tM atrimonio = = 1,47
0,135
0,184
tU rbano = = 6,81
0,027
0,065
tEscolaridad = = 10,83
0,006
0,014
Std.ErrExper = = 0,0029
4,67
0,188
Std.ErrSexo = = 0,0379
4,95
Finalmente, el TSS:
RSS
R2 = 1 −
T SS
145327
0,253 = 1 −
T SS
T SS = 194547,6
Se aprecia que todos los parámetros son estadı́sticamente significativos, excepto por
la dummie matrimonio. Se aprecia un retorno a la escolaridad de aproximadamente
6.5 %.
11
Facultad de Economı́a y Negocios Universidad de Chile
2. Como dice el enunciado, las personas poseen distintos niveles de habilidad. Una buena
forma de aproximar por el nivel de habilidad es lo que propone este econometrı́sta al
incorporar el coeficiente intelectual de los individuos. Veámos los nuevos estadı́sticos t:
5,18
tConstante = = 39,8
0,13
0,014
tExper = = 4,6
0,003
0,2
tM atrimonio = = 5,12
0,039
0,182
tU rbano = = 6,74
0,027
0,143
tSexo = = 3,66
0,039
0,054
tEscolaridad = = 7,71
0,007
0,036
tIQ = = 36
0,001
Nos damos cuenta que el parámetro de IQ es altamente significativo mientras que el
resto de los parámetros siguen siendo significativos también. La variable de la habilidad
es claramente una variable relevante, este ejemplo es un problema tı́pico de omisión de
variables relevantes. Al omitir variables relevantes tendremos sesgo en los parámetros
del modelo, llegando a sobre o subestimar efectos. Si comparamos el retorno a la
escolaridad en ambos casos, vemos que este baja de 6.5 % a 5.4 %. El no incorporar
la habilidad nos llevaba a sobreestimar el verdadero retorno a la escolaridad. El resto
de las magnitudes del modelo se mantienen estables, demostrando que el ”premio”por
habilidad (IQ) es de 3.6 %.
4. Los criterios si son comparables entre modelos, ya que el modelo 1 es anidado del
modelo 2 y además ambos mantienen el mismo número de observaciones. Recordando
la forma funcionales de los criterios BIC y AIC:
2lnL ln(n)
BIC = − +k
n n
2lnL k
AIC = − +
n n
Con esto calculamos los criterios para ambos modelos:
12
Facultad de Economı́a y Negocios Universidad de Chile
Modelo 1
La decisión sobre el mejor modelo es aquél que tenga los menores niveles de criterios
de selección. Por esto, nos quedamos con el segundo modelo.
13