Notas de Aula Greene II
Notas de Aula Greene II
Notas de Aula Greene II
Cunha
ECONOMETRIA I
PARTE 2
SUMRIO
Cap.9 Modelo de regresso generalizado e heterocedasticidade
31
53
75
80
96
Lista de exerccios 2
104
CAPTULO 9
9.1 Introduo
Neste e em vrios captulos a seguir, o modelo de regresso ser
estendido para incorporar distrbios que violam a suposio A4 do modelo
clssico de regresso linear. O modelo de regresso linear generalizado
y = X +
E[|X] = 0
(9-1)
E[|X] = 2 =
em que,
uma matriz definida positiva de covarincia
2 caso geral
2I caso particular
HETEROCEDASTICIDADE:
Diferentes varincias
Comum em sries de tempo com alta freqncia e volatilidade como
dados dirios do mercado financeiro, e em dado de corte no tempo
Assumindo que os distrbios so no correlacionados, ento 2 ser
1 0
2
2
2 0
=
M
M
0 0
K 0 12 0
L 0 0 22
=
O M M
M
L 0
0
L 0
O M
L n2
K
AUTOCORRELAO:
Usual em dados de sries temporais, que possuem memria. Sries
temporais usualmente so homocedsticas
Ento 2 ser
1
2 = 2 1
M
n1
1
1
M
n2
K n1
L n2
O
M
L
1
E[|X] = 2I
(9-2)
melhor
linear
no-viesado
(BLU),
consistente
(9-3)
e
distribudo
(9-4)
=
X' X
n n
1
1
X ' X X ' X
n
n
(9-5)
1
10
(9-7)
2 1
1
(9-9)
11
11
=
X 'X
nn
1
1
2
X ' [ ]X X 'X
n
n
1 n n
plim Q* = plim ij x i x 'j
n i =1 j =1
O ponto que Q* uma matriz de somas de quadrados e produtos
cruzados que envolvem ij e as colunas de X. O estimador de mnimos
quadrados b um estimador consistente de , o que implica que o resduo de
mnimos quadrados ei um estimador consistente de i. A abordagem geral,
ento, utilizar X e e para obter um estimador de Q*.
Em muitas aplicaes assumida uma estrutura particular para . Os
casos de heterocedasticidade e autocorrelao so considerados na
Seo 9.4 e no Captulo 20, respectivamente, enquanto vrios
modelos para dados em painel so analisados no Captulo 11.
12
13
C = vetores caractersticos de
= C1/21/2C
T = C1/2
= TT
e 1 = PP
P = C1/2
y* = X* + *
(9-11)
A varincia condicional de *
E[**] = PP = P2P = 2PP = 2PP1P1P = 2I
2
14
E[ | X* ] = E [( X*' X* ) X*' y * | X* ]
= E[(X*X*)X*(X* + *)|X*]
= + E[(X*X*)1X**)|X*]
=
(9-12)
15
F[ j ,nk ]
= y * - X*
e
'
(y X )' 1 ( y X )
=
=
nk
nk
2
(9-14)
16
RG2
(y X )' (y X )
=1
2
in=1 ( yi y )
*' * = ( y X)' 1 (y X)
O quadrado da correlao entre os valores previstos e observados
17
( ) =
M
n 1
1
M
n2
3 K n 1
2 K n2
O
K
i2 = 2 zi
(9-15)
18
= ( ) no lugar de . Se
estimao GLS vivel, podemos utilizar
equivalente . Assim, o
plim = , ento assintoticamente
estimador de Mnimos Quadrados Generalizados Vivel denotado por
1X) 1 X'
1y
= ( X'
1 1 1
plim X'
X X' 1X = 0
n
(9-16)
1
1 1 X' 1 = 0
plim
X'
(9-17)
Em amostras pequenas o estimador OLS pode ser mais eficiente que o FGLS.
19
9.4 Heterocedasticidade
Quando as varincias dos distrbios da regresso no so constantes
so denominadas heterocedsticas. Heterocedasticidade ocorre em vrias
aplicaes, em dados de corte temporal ou sries de tempo. Por exemplo,
- devido ao tamanho da firma lucro varincia
- gastos das famlias renda varincia
No modelo de regresso heterocedstico, tem-se:
Var [i|X] = i2
i = 1, ..., n
1 0
2
2
2 0
E['| X] = =
M
M
0 0
0
0
M
0
L 0
L 0
O M
L n
tr () = i = n
i =1
20
2
1
1
1
(9-18)
Q *n
X' X 1
=
=
n
n
i x i x'i
i =1
em mdia quadrtica
Em geral,
a
2 1 * 1
N , Q Q Q
n
com
Q* = plim Q *n
21
inapropriada
apropriada
n n n
Em grandes amostras s
X' X X' X
=
=
n
n
1 '
x i x i
i =1 n
i '
x i x i =
i =1 n
n
1
( 1 i )x i x'i
i =1 n
n ) = 1. Se os pesos no so
correlacionados com xixi, a diferena ser zero, caso contrrio, a diferena
pode ser considervel.
O escalar Tr() = n implica que
22
1 X' X 1
Est. Asy. var[b] =
n n n
ei2 x i x i'
X' X
(9-27)
= n(XX)1S0(XX)1
em que,
S0 =
1
n
e x x
2
'
i i i
plim S0 = plim Q*
com
Q* =
1
n
2
'
i xi xi
23
nR 2 ~ 2p-1
n de regressores em X, incluindo a
constante
R2 obtido de regresso de ei2 = (x, x2, xixj)
Note
ei so os resduos da regresso de y = (X)
um teste geral, pois no necessrio fazer nenhuma
suposio sobre a natureza da heterocedasticidade
Portanto, um teste no-construtivo, pois quando rejeitamos H0:
no sabemos o que fazer depois.
24
LM =
1
2
i =1
2 e' e
e i n
Seja, u = {e12, e22, ..., en2} e i = {1, 1, ..., 1} um vetor de uns. Ento,
u = ee n . Assim,
1
LM= (u ui)'Z(Z' Z)-1Z' (u ui)
V
25
(9-29)
y1 1
x'1 1
y
x
'
2
2
2
2
sobre PX =
Py =
M
M
x
'
n
n
n
n
Aplicando mnimos quadrados no modelo transformado, obteremos o
estimador de mnimos quadrados ponderados (WLS):
1
n
n
'
= wi xi xi wi xi yi
i =1
i =1
em que, wi = 1 i
freqentemente utiliza-se wi = 1 i
26
i2 = 2 xik2
ento, o modelo de regresso transformado para MQG
x
x
y
= k + 1 1 + 2 2 + L +
xk
xk
xk
xk
(9-30)
xk no
lugar de 1 xk
1
= X' V 1X X' V 1y
(9-31)
1
1
Var. Assint [ ] = 2 X' V 1X X' V 1V 1X X' V 1X
ei2 '
1
2 x i x i X' V X
i =1 vi
)
n
(9-32)
(9-33)
27
encontrar
um
estimador
consistente
dos
parmetros
n 1 ' n 1
= 2 x i x i 2 x i yi
i=1 i
i=1 i
(9-34)
28
ei = i xi(b ) = i + ui
Ento,
ei2 = (i + ui)2 = i2 + ui2 + 2iui
Como b , ui ser negligencivel, aproximadamente, temos
P
ei2 = i2 + ui*
Por exemplo, se i2 = zi, ento o estimador consistente de vai
depender da inclinao de mnimos quadrados, a , no modelo,
ei2 = zi + ui*
Neste modelo, ui* heterocedstico e auto-correlacionado, ento a
consistente, mas no eficiente.
9.7 Aplicaes
Esta seo apresenta duas aplicaes comuns de modelos de regresso
heterocedsticos, o modelo de Harvey de Heterocedasticidade Multiplicativa
e o modelo de Grupos de Heterocedasticidade que estende para a varincia
dos distrbios alguns conceitos que so usualmente associados com a
variao na funo de regresso.
clear
set more off
set matsize 800
set memory 56m
memory
insheet using c:\data\TableF81.txt
compress
describe
summarize
gen income2=income*income
drop if acc==0
regress avgexp age income income2 ownrent
/*exemplo 8.1 grfico dos resduos*/
predict e, residual
scatter e income
/*teste de White*/
imtest, white
/*teste Breusch-Pagan ???*/
estat hettest income income2
regress avgexp age income income2 ownrent, robust
29
summarize
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------mdr |
100
.36
1.01025
0
7
acc |
100
.73
.446196
0
1
age |
100
32.08
7.828567
20
55
income |
100
3.3693
1.629013
1.5
10
avgexp |
100
189.0231
294.2446
0
1898.03
-------------+-------------------------------------------------------ownrent |
100
.36
.4824182
0
1
selfempl |
100
.05
.2190429
0
1
v8 |
0
v9 |
0
v10 |
0
-------------+-------------------------------------------------------v11 |
0
. gen income2=income*income
. drop if acc==0
(27 observations deleted)
. regress avgexp age income income2 ownrent
Source |
SS
df
MS
-------------+-----------------------------Model | 1816788.88
4
454197.22
Residual | 5433109.09
68 79898.6632
-------------+-----------------------------Total | 7249897.98
72 100693.027
Number of obs
F( 4,
68)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
73
5.68
0.0005
0.2506
0.2065
282.66
-----------------------------------------------------------------------------avgexp |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------age | -3.049219
5.460102
-0.56
0.578
-13.94468
7.846244
income |
235.3788
78.79648
2.99
0.004
78.14282
392.6147
income2 | -15.08389
7.339584
-2.06
0.044
-29.7298
-.4379772
ownrent |
27.90241
82.31317
0.34
0.736
-136.351
192.1558
_cons | -240.7363
193.0766
-1.25
0.217
-626.0147
144.5422
-----------------------------------------------------------------------------. /*exemplo 8.1 grfico dos resduos*/
. predict e, residual
. scatter e income
.
. /*teste de White*/
. imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(12)
Prob > chi2
=
=
14.57
0.2660
30
=
=
43.11
0.0000
Number of obs =
F( 4,
68) =
Prob > F
=
R-squared
=
Root MSE
=
73
12.52
0.0000
0.2506
282.66
-----------------------------------------------------------------------------|
Robust
avgexp |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------age | -3.049219
3.377757
-0.90
0.370
-9.789428
3.690989
income |
235.3788
90.06745
2.61
0.011
55.65196
415.1055
income2 | -15.08389
7.028738
-2.15
0.035
-29.10952
-1.058262
ownrent |
27.90241
95.50956
0.29
0.771
-162.684
218.4888
_cons | -240.7363
212.6349
-1.13
0.262
-665.0426
183.5701
-----------------------------------------------------------------------------.
-500
Residuals
500
1000
1500
Figura 9.1
6
Income
10
31
32
CAPTULO 20
Correlao serial
20.1 Introduo
20.2 A anlise de dados de sries de tempo
20.3 Processos dos distrbios
20.4 Alguns resultados assintticos para a anlise de dados de sries de
tempo
20.5 Estimao por Mnimos Quadrados
20.6 Estimao GMM
20.7 Teste para Autocorrelao
20.8 Estimao eficiente quando conhecido
20.9 Estimao quando desconhecida
20.10 Heterocedasticidade Auto regressiva Condicional
20.11 Sumrio e concluses
33
20.1 Introduo
Dados de sries de tempo freqentemente apresentam autocorrelao,
ou correlao serial nos distrbios ao longo do tempo. Considere, por
exemplo, o grfico dos resduos de mnimos quadrados no seguinte exemplo:
Exemplo 20.1 Equao de demanda por moeda
34
35
- Mnimos quadrados
Ineficiente
Problemas da Autocorrelao
- A inferncia fica
Comprometida
Similares
ao da
Heterocedasticidade
36
E[t] = 0
Var [t] = 2
Cov [t, s] = 0 para t s
A distribuio dos t
covarincia estacionria
ou fracamente estacionria
Se 2 = 0
E[ yt ] = 1 + 3 E[ yt 1 ] + E[ t ] =
37
1
1 3
0 =
32 0
2
0 =
1 32
Assim, estacionariedade
implica que | 3| < 1
(20-1)
Continuando o processo,
yt =
3i ( 1 + t i )
i =0
38
Corr[ t , t -s | X] =
cov[ t , t-s | X]
= s = s = s
Var[ t | X]Var[ t-s | X] 0
ts =
Diferentes processos
dos distrbios geram
diferenas nas
autocovarincias
e autocorrelaes
|t s |
0
39
Tem-se
Supondo
(20-4)
(20-5)
Reescrevendo (20-4)
u2
Var[ t ] =
= 2
2
1
(20-6)
40
Cov[ t , t 1 ] = E[ t t 1 ] = E[ t 1 ( t 1 + u t )]
= E[ t 1 t 1 ] + E[ t 1u t ] = Var[ t 1 ]
u2
=
1 2
(20-7)
t = s t s +
s 1
i =0
i ut i
u2
Cov[ t , t s ] = E[ t t s ] =
1 2
s
Corr[ t , t s ] = s = s
(20-9)
Portanto,
1
2
u 2
2 =
1 2
M
T 1
3 L T 1
2 L T 2
L T 3
T 2
T 3
M
1
(20-10)
1
1 + 2
1+ 2
1 0
=
...
...
...
0
0
0
0
0
0
...
...
...
0
0
...
...
... 1 + 2
...
41
0
0
...
ERGODICIDADE
A definio estabelece essencialmente que se eventos so separados
por um tempo suficiente, ento eles so assintticamente
independentes. Uma implicao que em sries de tempo, cada
observao ir conter pelo menos alguma informao que nica.
Ergodicidade um elemento importante na teoria da estimao. Esta
propriedade e a de estacionariedade sero requisitadas vrias vezes.
X' X X'
b = ( X ' X ) X' y = +
T T
1
GLS eficiente
OLS no eficiente
42
Pnlim
Se Xt estacionrio e ergtico,
X'X
P lim
n
X'
=0
T
Se t no est correlacionado
serialmente, wt = xtt
uma seqncia de
martingale diferena (definio 20.4, p. 638)
b consistente
43
p lim b =
+
1 +
OLS
e
GLS
so inconsistentes
44
2(XX)1(X
X)1(XX)1
um estimador
incorreto de
*=1
Q
n
'
ijx i x j
i =1 j =1
*= 1
Q
T
e e x x
t s t
t =1 s =1
'
s
(20-16)
45
* = S0 + 1
Q
T
wl = 1
wl et et l (x t x t' l +x t l x t' )
(20-17)
l =1 t =l +1
l
( L + 1)
46
H0: no h autocorrelao
versus
(20-19)
Breush (1978)
Godfrey (1978)
e' e
(20-20)
em que X0 = [Xt, et1, ..., et] matriz X aumentada com colunas et1 ... et,
preencher com zeros os espaos sem valores (iniciais).
utilizado para mudanas estruturais
47
Q =T
em que, r j =
T
t = j +1
et et j
P
j =1
r j2 ~ 2
(20-21)
2
t
t =1
Q ' = T (T + 2)
P
j =1 T
r j2
j
(20-22)
48
e12 + eT2
Tt= 2 (et et 1 ) 2
d=
= 2(1 r ) T 2 2(1 r )
2
T
t = 2 et
t = 2 eT
(20-23)
Etapas:
1) Fazer a regresso e calcular o valor d, com os resduos estimados
2) Obter o valor de dL e dU, para o nmero de observaes (n) e a
quantidade de parmetros menos 1(k -1).
3) Analisar o resultado, considerando:
h = r T (1 Tsc2 )
N (0,1)
(20-24)
49
(20-25)
em que
(20-26)
(20-27)
1 2 y
1
y2 y1
y * = y3 y 2 ,
y y
T
T 1
1 2 X
1
X 2 X 1
X* = X 3 X 2
X X
T
T 1
(20-28)
2 2
(1 )
(1 )
A primeira coluna de X transformada para
(1 )
50
lnGpop=ln(gasexp/(pop*gasp))
lnIncomepop=ln(income)
lnPG=ln(gasp)
lnPNC=ln(pnc)
lnPUC=ln(puc)
tend=year-1952
51
-.15
-.1
Residuals
-.05
0
.05
.1
1950
1960
1970
1980
Year
1990
2000
Number of obs
F( 5,
46)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
52
253.15
0.0000
0.9649
0.9611
.04709
-----------------------------------------------------------------------------lnGpop |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnIncomepop |
1.624962
.1951747
8.33
0.000
1.232096
2.017828
lnPG | -.0539223
.0421606
-1.28
0.207
-.1387871
.0309426
lnPNC | -.0834322
.1765335
-0.47
0.639
-.4387756
.2719112
lnPUC | -.0846749
.1024172
-0.83
0.413
-.29083
.1214801
tend | -.0139261
.0047732
-2.92
0.005
-.0235341
-.0043181
_cons | -26.67868
2.000292
-13.34
0.000
-30.70506
-22.6523
-----------------------------------------------------------------------------. predict e, residual
. line e year
. regress lnGpop lnIncomepop lnPG lnPNC lnPUC tend
Source |
SS
df
MS
-------------+-----------------------------Model | 2.80658066
5 .561316133
Residual | .101996656
46 .002217319
-------------+-----------------------------Total | 2.90857732
51 .057030928
Number of obs
F( 5,
46)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
52
253.15
0.0000
0.9649
0.9611
.04709
-----------------------------------------------------------------------------lnGpop |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnIncomepop |
1.624962
.1951747
8.33
0.000
1.232096
2.017828
lnPG | -.0539223
.0421606
-1.28
0.207
-.1387871
.0309426
lnPNC | -.0834322
.1765335
-0.47
0.639
-.4387756
.2719112
lnPUC | -.0846749
.1024172
-0.83
0.413
-.29083
.1214801
tend | -.0139261
.0047732
-2.92
0.005
-.0235341
-.0043181
_cons | -26.67868
2.000292
-13.34
0.000
-30.70506
-22.6523
------------------------------------------------------------------------. dwstat
Durbin-Watson d-statistic(
bgodfrey
6,
52) =
.4250046
52
Number of obs
F( 5,
46)
Prob > F
R-squared
Adj R-squared
Root MSE
=
52
= 1662.58
= 0.0000
= 0.9945
= 0.9939
= .01812
-----------------------------------------------------------------------------lnGpop |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnIncomepop |
.4656222
.1339286
3.48
0.001
.1960379
.7352064
lnPG | -.1387365
.0277144
-5.01
0.000
-.1945226
-.0829504
lnPNC | -.0967941
.1262128
-0.77
0.447
-.3508472
.157259
lnPUC | -.0013022
.051537
-0.03
0.980
-.1050408
.1024365
tend |
.0128809
.0045114
2.86
0.006
.0038
.0219619
_cons |
-16.2451
1.384229
-11.74
0.000
-19.03141
-13.45879
-------------+---------------------------------------------------------------rho |
.990442
-----------------------------------------------------------------------------Durbin-Watson statistic (original)
0.425005
Durbin-Watson statistic (transformed) 1.241458
.
. prais lnGpop lnIncomepop lnPG lnPNC lnPUC tend, corc
Iteration
Iteration
Iteration
Iteration
0:
1:
rho = 0.0000
rho = 0.7368
Number of obs
F( 5,
45)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
51
13.71
0.0000
0.6037
0.5597
.01552
-----------------------------------------------------------------------------lnGpop |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lnIncomepop |
.4624061
.1161981
3.98
0.000
.2283711
.6964412
lnPG | -.1325896
.0240923
-5.50
0.000
-.181114
-.0840651
lnPNC | -.0723031
.1086961
-0.67
0.509
-.2912282
.1466221
lnPUC |
.0096739
.0449029
0.22
0.830
-.0807652
.1001131
tend |
-.002429
.0049668
-0.49
0.627
-.0124327
.0075747
_cons | -15.55618
1.204619
-12.91
0.000
-17.98241
-13.12995
-------------+---------------------------------------------------------------rho |
.9566927
-----------------------------------------------------------------------------Durbin-Watson statistic (original)
0.425005
Durbin-Watson statistic (transformed) 1.631143
Convergence not achieved
r(430);
53
CAPTULO 11
54
55
9.1 INTRODUO
Conjunto de dados que combinam sries de tempo e corte temporal
Exemplo: Dados da OCDE
Dados Longitudinais (Microdados indivduos ou famlias)
Estudos recentes:
1) National Longitudinal Survey of Labor Market Experience
2) Michigan Panel Study of Income Dynamics
6.000 famlias e 15.000 indivduos (desde 1968)
3)
56
57
11.2.3 Extenses
Ver Captulo 17 Modelos de escolha binria
19 Modelos com dados censurados
18 Modelos com dados contveis
Painel
Balanceado
nxt=T
Nem todos os indivduos so observados
Painel no
Balanceado
i = 1, ..., n,
j = 1, ..., Ti
(11-2)
se i j ou t s
58
59
var[wi|Xi] = 2ITi + i =
o componente omitido
n ' n '
b = (XX) Xy = X i X i X i y i
i =1
i =1
1
1 1 n
Est. Ass. Var [b]= Xi X i
n n i =1
1 n
1 n
w
w
X
X
X
i i i i i i (11-3)
n i =1
n i =1
60
E. A.Var [b]= X g X g
g =1
G G
G
X g w g w g X g X g X g
G
1
g =1
g =1
(11-4)
G
o nmero de grupos
ng componentes em cada grupo
g = 1, ..., G observaes
ou
yi = xi + wi
61
Educao
Sexo
Raa
62
1) Formulao original
yit = + xit + it
(11-5a)
(11-5b)
yit yi* = (x it x i* ) + it i
(11-5c)
STotal
xx = i =1t =1(xit x)(xit x)'
n
STotal
= i =1 t =1 (xit x)( yit y )
xy
n
S Dentro
= in=1 Tt=1 (x it x i )(x it x i )'
xx
S Dentro
= in=1 Tt=1 (x it x i )( yit yi )
xy
S Entre
= in=1T ( x i x)(x i x)'
xx
S Entre
= in=1T ( x i x)( yi y )
xy
fcil verificar que
STotal
= S Dentro
+ S Entre
xx
xx
xx
STotal
= S Dentro
+ S Dentro
xy
xy
xy
x e y so mdias totais
(11-6)
63
64
1 Total
bTotal = STotal
S xy
xx
= S Dentro
+ S Entre
xx
xx
2) Estimador dentro dos grupos
(11-7)
]1[S Dentro
+ S Entre
xy
xy ]
(11-8)
]1
(11-9)
1 Dentro
b Dentro = S Dentro
S xy
xx
b Entre = S Entre
S Entre
xx
xy
que o estimador da mdia dos grupos
Considerando,
de (11-7)
S Dentro
= S Dentro
b Dentro
xy
xx
Entre
S Entre
= S Entre
xy
xx b
de (11-8)
Substituindo em (11-6)
]1
Entre
bTotal = S Dentro
+ S Entre
S Dentro
b Dentro + S Entre
xx
xx
xx
xx b
= F Dentrob Dentro + F Entreb Entre
em que,
Entre 1 Dentro
F Dentro = S Dentro
+
S
S xx
= I F Entre
xx
xx
(11-10)
65
(11-11)
+ it + [ci h(Xi)]
(11-12)
66
Assim,
yi = Xi + ii + i
Colecionando esses termos, temos
y1 X1
i 0 L 0 1 1
y X
0 i L 0
2
2
= +
. 2 + 2
M M
M M O M M M
0 0 L i n n
y n X n
ou
y = [X d1 d 2 L d n ]. +
(11-13)
Assim,
y = X + D +
Least Square Dummy Variable (LSDV) model
Modelo de mnimos quadrados com variveis binrias
Para n pequeno pode ser estimado por mnimos quadrados
grande utilizar regresso particionada [ver (11-14) (11-19)],
pois a capacidade do computador pode no suportar
a dimenso das matrizes.
11.4.2
67
T Assintoticamente pequeno
Tamanho do grupo
consistente (11-20)
no consistente
(11-21)
68
2
RLSDV
2
RPooled
(11-21)
(11-22)
69
(11-29)
2 + 2
2 u
= E[ i i | X] = Mu
u2
u2
u2
2 + u2
M
u2
M
u2
u2
L
u2
= 2IT +u2iTiT
O
M
2
L + u2
(11-30)
L
u2
0 0
0 0
=
M M M
0 0 0
L 0
L 0
= In
O M
70
(11-31)
2
n
T
nT i =1 t =1 eit
1
LM =
2(T 1) n T e 2
i =1 t =1 it
n (Te ) 2
nT i =1 i *
=
1 ~ (21) (11-42)
2(T 1) n T e 2
i =1 t =1 it
Exemplo 11.6 Teste para Efeito Aleatrio
LM = 3.881,34
Estimativa de
(11-33)
71
1
H ' = ( LSDV MEANS ) ' Asy.Var[ LSDV ] + Asy.Var[ MEANS ] ( LSDV MEANS )
(11-45)
H ' ~ [2K 1]
H0: modelo com efeito aleatrio
Uma vantagem dessa verso que a matriz de covarincia definida nonegativa.
Exemplo 11.8 Teste de Hausman para efeito fixo contra efeito aleatrio
H = 2.636,08
2 = 14,07
H0: rejeitada
72
73
yit = x it' + it + ui ,
Com i = 1, ..., n; t = 1 , ..., T. O termo comum ui o efeito unidade (por
exemplo o pas). A correlao espacial uma implicao da estrutura de
autocorrelao espacial
n
it = Wij jt + t
j =1
t = (I n W) 1 v t
Ento, para n observaes para o perodo t
y t = X t + (I n W) 1 v t + u
Assumimos, que ui e vi tm mdia zero e varincias independentes entre os
pases. Segue que o modelo de regresso generalizado, que pode ser obtido
utilizando o captulo 8, para n observaes e t perodos, com conhecido, :
E[ y t | X t ] = X t
Var[y t | X t ] = (I n W) 1[ 2 ii ' ](I n W) 1 + u2 I n
VER EXEMPLO 11.12 (gastos com sade) e 11.13 (vendas imobilirias)
74
11.8 ENDOGENEIDADE
11.9 REGREASSO NO LINEAR COM DADOS EM
PAINEL
11.10 SISTEMAS DE EQUAES
11.11 HETEROGENEIDADE DOS PARMETROS
At aqui os parmetros de inclinao do modelo foram tratados como
constantes fixas, e o intercepto variando aleatoriamente de grupo para grupo.
Uma formulao equivalente para o modelo empilhado, e de efeitos fixos e
aleatrios seria,
yit = ( + ui ) + x it'
+ it
75
yi = Xi + (i + Xiui)
ento,
ij = E[(yi Xi)(yi Xii)|Xi] = 2IT + XiXi
= (X' 1X)1X' 1y
Matriz de covarincia
(11-87)
76
CAPTULO 8
8.1 INTRODUO
8.2 SUPOSIES DO MODELO
8.3 ESTIMAO
8.4 DOIS TESTES DE ESPECIFICAO
8.5 ERRO DE MEDIDA
8.6 ESTIMAO NO-LINEAR COM VI
8.7 INSTRUMENTOS FRACOS
8.8 EXPERIMENTOS NATURAIS E FONTE DE EFEITOS CAUSAIS
8.9 SUMRIO E CONCLUSES
77
8.1 INTRODUO
A suposio de que Xi e i so no correlacionados no modelo de regresso linear
yi = xi + i
(8-1)
tem sido crucial. Mas, existem muitas aplicaes em economia em que esta suposio
no atendida. Sem essa suposio no possvel demonstrar que os estimadores (OLS
e GLS) so no-viesados e consistentes.
78
XX
Mantemos p lim
= Q xx
n
Modificamos A3. AI3. E [i | xi ]=i
E [xi i]=
(8-2)
Com um nmero diferente de zero. Complementamos com
1
p lim X =
(8-3)
n
[ ]
[ ]
2
AI8a. E xik
= Q xx,kk < , uma constante finita, k = 1, ..., K
2
AI8b. E z ik
= Q zz ,ll < , uma constante finita, l = 1, ..., L
AI9. E i | z i = 0
AI7. Ser relaxada na anlise de sries temporais. Considerando a mesma anlise da
seo 4.9, tem-se:
p lim(1 / n )ZZ = Q zz , uma matriz finita e definida positiva (dados bem comportados)
p lim(1 / n )ZX = Q zx , uma matriz finita, L x K, com rank K (relevante)
p lim(1 / n )Z = 0 , exogeneidade
8.3 ESTIMAO
8.3.1 Mnimos Quadrados Ordinrios
Viesado
Inconsistente
(8-6)
8.3.3 Motivaes
8.3.4 Mnimos Quadrados em 2 estgios
Se Z contm mais colunas (variveis) que X, ento no possvel obter ZX
= Z(ZZ)-1 ZX
X
= XZ(ZZ)-1 Z
X
Com isso,
X)-1 X
y
bIV = ( X
(8-9)
79
PROGRAMA DO STATA
clear
set more off
set matsize 800
set mem 256m
memory
*/incluindo os dados
infile lwage exp wks occ ind south smsa ms union ed fem blk time households using
e:\TABLEF91.prn
*/OLS
regress wks lwage ed union fem
*/IV with Z1
ivreg wks (lwage = ind ed union fem) ed union fem
*/IV with Z2(Two-stage least squares)
svyset _n
svy: ivreg wks ed union fem (lwage = ind ed union fem smsa)
80
81
CAPTULO 10
Sistemas de Equaes
10.1 Introduo
10. 2 Modelo de regresso aparentemente no correlacionada
10.3 Modelo generalizado
correlacionada
para
regresso
aparentemente
no
10.1 INTRODUO
Exemplos:
1) Funo Investimento
2) Modelo de precificao de ativos
3) Modelo para o produto de 48 estados dos EUA
4) Modelo dinmico para determinao dos salrios para 38 indstrias do UK
5) Conjunto de demanda por fator [minimizao de custos]
(10-1)
...
y M = XM M + M
M equaes
T observaes
O modelo de regresso aparentemente no-correlacionado (SUR) :
i = 1, ..., M
y i = Xii + i
em que,
= [ 1 , 2 ,..., M ]
Assumimos exogeneidade estrita de Xi,
E [ | X 1 , X 2 ,..., X M ] = 0
e homocedasticidade
E [ m m | X 1 , X 2 ,..., X M ] = mm I T
(10-2)
82
83
observaes totais T
equaes M
regressores de cada equao Ki
M
regressores totais K = i =1 K i
Necessita-se que T > Ki
Assumimos que os erros so no correlacionados entre as observaes, mas
correlacionados entre as equaes
E [ it js | X 1 , X 2 ,..., X M ] = ij
se t = s e 0 c.c.
Assim, tem-se
E [ i j | X 1 , X 2 ,..., X M ] = ij I T
ou
11 I 12 I ... 1M I
I I ...
21
22
2M I
E [| X 1 , X 2 ,..., X M ] = =
...
M 1I M 1I ... MM I
(10-3)
para
regresso
aparentemente
84
no
85
p=
2x
s
+ d
= 1x + v1
( 1 1) ( 1 1)
q=
1 2 x
1 s
+ 1 d
= 2 x + v2
( 1 1)
( 1 1)
(13-41)
Cov[ p, s ] = s2 / (1 1 )
temos que utilizar outros mtodos de estimao, tais como VI ou MQ2E
Exogeneidade x endogeneidade:
No h um consenso em econometria sobre qual varivel endgena e
qual exgena.
No sistema de oferta e demanda, enquanto as variveis preo e
quantidade so tratadas como endgenas, as demais so consideradas
exgenas. Por outro lado, em macroeconomia h uma interdependncia entre
as variveis do sistema. Por exemplo, na estimao da funo consumo por
MQO, a renda tratada como exgena.
Engle, Hendry e Richard (1983) definem o conjunto xt de variveis
como fracamente exgeno se o modelo pode ser escrito em termos da
distribuio de probabilidade marginal de xt e da distribuio condicional de
yt|xt tal que a estimao do conjunto completo da distribuio condicional
no menos eficiente que a estimao da distribuio conjunta.
No caso de sries de tempo, esse conjunto de variveis so
denominadas pr-determinadas se no modelo, xt independente de todas
estruturas subsequentes dos distrbios t+s.
86
Causalidade de Granger:
No h causalidade no sentido de Granger se f(xt|xt1, yt1) com ou H0:t-1 = 0
igual a f(x|xt1)
Se xt fracamente exgena e se yt1 no causa no sentido de Granger
xt, ento xt fortemente exgena.
(13-42)
M equaes
M variveis endgenas y1, ... yM
K variveis exgenas x1, ... xK (podem incluir valores predeterminados de y1, ... yM)
primeiro elemento de xt igual a constante 1.
t1, ... tM so erros estruturais
t ndice para as observaes t = 1, ..., T
Na forma matricial
11 12
[ y1 y2 L yM]t 21 22
M
M
M1 M2
L
L
O
L
1M
2M
11 12
+[x1 x2 L xK] 21 22
t
M
M
M
MM
M1 M2
L 1M
L 2M
=[1 2 L M]
t
O M
L MM
y t + x t' B = t'
ou,
x2
xM
]t
11
21
M
M 1
12
22
L
L
1M
2M
MM
+ [v 1
vM
]t
87
y t = x t B 1 + t 1
y t = x t + v t
Para que exista uma soluo para este sistema a condio de completude
precisa ser atendida: precisa ser no singular
Nota: Se for triangular (modelo recursivo) possvel resolver por MQO
Exemplo 10.4 Forma estrutural e reduzida por MQO.
vrias teorias
podem ser
empregadas
equivalncia
observacional
Equivalncia observacional
O problema da identificao no um problema do tamanho da amostra
O sistema na forma reduzida
y t' = x t' + v t
E[ v t v t '| x t ] =
XX
= p lim
Xy
p
lim
88
yy
yX XX Xy
= p lim
p lim
n
n n n
e podem ser estimados de forma consistentes por uma regresso
de mnimos quadrados de y sobre X.
Agora, ns podemos deduzir os parmetros estruturais da forma
reduzida?
A correspondncia entre os parmetros da forma reduzida e os da
forma estrutural :
= B 1
= E [vv] = 1 1
B =
=
( )
Se conhecido
podemos obter B e
~
y t' + x t' B = ~t'
E ps multiplique por , uma matriz no singular, para obter uma nova
estrutura, em que escolhida arbitrariamente. Pode-se concluir que
transformao no singular na estrutura original tem a mesma forma
reduzida. Assim, necessitamos da teoria econmica para impor restries ao
modelo, para identific-lo corretamente.
1
1
p
p
z
z
q
q
1
1
p
p
x
z
89
y t + x t' B = t'
e o modelo na forma reduzida
y t' = x t' + v t
Se conseguirmos deduzir os parmetros da forma estrutura a partir da forma
reduzida, dizemos que a equao est identificada. Para uma equao
particular, a soluo est contida em
= B 1
= B
j = B j
90
(10.48)
(1)
y1 = x1
(2)
y2 = x2
+ 12y1
(3)
y3 = x3
+ 2, Cov(y1, 2) = Cov(x1+ 1, 2) = 0
Ento, o estimador IV
91
W = Variveis predeterminadas
do sistema
j , IV = [ W 'j Z j ]1 W 'j y j
que consistente. A matriz de covarincia assinttica tambm pode ser
obtida de forma consistente, conforme (13-16).
O mtodo de estimao em 2 estgios. Esse mtodo consiste em utilizar
como instrumento para yj os valores estimados na de yj sobre todos os xs do
sistema
Estgio 1
Estgio 2
92
EXEMPLO 10.1
Table F9.2: Munnell Productivity Data, 48 Continental U.S. States, 17 years,19701986
Dados dos exemplos 9.9 e 9.10 de Munnells (1990), um estudo sobre nvel da
produtividade do capital pblico para os Estados Unidos, considerando 48 estados,
divididos em 9 regies.
A equao bsica uma funo de produo Cobb-Douglas:
Agrupamento em 9 regies:
Golfo = Alabama, Florida, Lousiana, Mississippi;
Meio Oeste = Illinois, Indiana, Kentucky, Michigan, Minnesota, Ohio, Winsconsin;
Meio Atlntico = Delavare, Maryland, Nova Jersey, Nova York, Pennsylvania,
Virginia;
Montanhas = Colorado, Idaho, Montana, Dakota do Norte, Dakota do Sul, Wyoming;
Nova Inglaterra = Connecticut, Maine, Massachusetts, Nova Haspshire, Rhode Island,
Vermont;
Sul = Gergia, Carolina do Norte, Carolina do Sul, Tennesse, Oeste da Virginia;
Sudoeste = Arizona, Nevada, Novo Mxico, Texas, Utah;
Tornado Alley = Arkansas, Iowa, Kansas, Missouri, Nebraska, Oklahoma;
Costa Oeste = Califrnia, Oregon, Washington.
93
EXEMPLO 10.8
Table F10.1: Cost Function Data, 145 U.S. Electricity Producers, 1955 Data; Nerlove
Source: Nerlove (1960) and Christensen and Greene (1976)
Equaes:
p
p
p
s K = K + KK ln K + KL ln L + KE ln E
pM
pM
pM
p
p
p
s L = L + KL ln K + LL ln L + LE ln E
pM
pM
pM
p
s E = E + KE ln K
pM
p
p
+ EL ln L + EE ln E
pM
pM
Variveis:
Firm = Observation,
Year = 1955 for all observations
Cost = Total cost,
Output = Total output,
Pl = Wage rate,
Sl = Cost share for labor,
Pk = Capital price index,
Sk = Cost share for capital,
Pf = Fuel price,
Sf = Cost share for fuel
PROGRAMA DO STATA
clear
*/set more off
set matsize 800
set memory 128m
memory
infile year cost k l e m pk pl pe pm order using c:\TABLEF102.prn
gen lk=log(pk/pm)
gen ll=log(pl/pm)
gen le=log(pe/pm)
94
Funo consumo:
Funo Investimento:
Salrio privado:
Equilbrio da demanda:
Lucros privados:
Estoque de capital:
Ct = 0 + 1Pt + 3Pt1 +2 ( Wt + Wt )+ 1t
It = 0 + 1Pt + 2 Pt1 + 3Kt1 + 2t
p
Wt = 0 + 1 Xt + 2 Xt1 + 3At + 3t
Xt = Ct + It + Gt
p
Pt = Xt - Tt - Wt
Kt = Kt1 + It
95
96
PROGRAMA DO STATA
clear
*/set more off
set matsize 800
set memory 128m
memory
use c:\klein.dta
*/gen t=_n
*/gen ano1 = y(1920y1) + t-1
*/format ano1 %ty
*/tsset ano1
format year %ty
summarize
tsset year
*/gen lp = l.p
*/gen lpso= l.pso
gen lpso1= l.pso1
gen lx= l.x
*/MODELO I DE KLEIN
*/MMO
regress c p lp wpwg
regress i p lp k1
regress wp pso1 lpso1 yr
more
*/MININOS QUADRADOS 2 ESTGIOS
ivreg c lp (p wpwg = t wg g yr lp lx k1)
ivreg i lp k1 (p = lp g wg t yr)
ivreg wp lpso1 (pso1 yr = p lpso1 lp k1 wpwg g wg t)
*/MINIMOS QUADRADOS 3 ESTGIOS
reg3 (c p lp wpwg) (i p lp k1) (wp pso1 lpso1 yr), endog (wpwg p pso1) exog(t wg g)
97
CAPTULO 14
14.1 Introduo
14.2 Funo Verossimilhana e a identificao dos parmetros
14.3 Estimao eficiente: O princpio da Mxima Verossimilhana
14.4 Propriedades dos estimadores de Mxima Verossimilhana
14.5 Verossimilhana condicional, modelos economtricos e o estimador
GMM
14.6 Testes de hiptese e de especificao e medidas de ajustamento
14.7 Estimao de Mxima Verossimilhana em duas etapas
14.8 Estimao de Pseudo-Mxima Verossimilhana e Matrizes
Robustas de Covarincia Assinttica
14.9 Aplicaes de estimao por Mxima Verossimilhana
14.10 Sumrio e concluses
98
14.1 Introduo
O mtodo dos momentos generalizados discutido no Captulo 13 e os
estimadores semi-paramtricos, no-paramtricos e Baysianos discutidos nos
Captulos 12 e 16 so amplamente utilizados na construo de modelos. No
obstante, o estimador de Mxima Verossimilhana discutido neste captulo se
mantm como o estimador preferido em muito mais aplicaes que os
anteriores.
99
(y1 ,L, y n | ) = ( yi | ) = L( | y )
(14-1)
i =1
100
LnL( | y ) = Ln( yi | )
(14-2)
i =1
1 n
= [Ln 2 + Ln(2 ) + ( yi -x i ) 2 2 ]
2 i =1
(14-3)
101
IDENTIFICAO:
Um assunto para a formulao do modelo
Deve ser resolvido antes que a estimao seja considerada
Considerando todas as informaes disponveis.
Podemos determinar valores nicos de da amostra
DEFINIO 14.1 IDENTIFICAO
O vetor de parmetros identificado (estimvel) se
para qualquer outro vetor de parmetros, * , para
algum dado y, L(*|y) L(|y).
102
2
2
2 i =1 2
LnL
1
=
( y ) = 0
2 i
LnL
n
2
(14-5)
(14-6)
( yi ) 2 = 0
2 i =1
4
(14-7)
( yi ) = 0
yi n = 0
n = yi
y
= i = y
ML
n
=0
4
2
n
2 1
= ( yi yn ) 2
n i =1
(14-8)
103
( i )2
1
2
e 2
2
Lembrando que i = yi xi e
f ( i | , 2 ) =
n
i2 =
i =1
(14-32)
L = (2 )
(14-33)
n
n
(y X )' (y X )
LnL = Ln 2 Ln 2
2
2
2 2
(14-34)
0
2
=
n
(
y
)'
(
y
)
Ln
0
+
2 2 2
2 4
(14-35)
104
e' e
(14-36)
n
2
M
.L. um estimador viesado da varincia, embora tenha boas
propriedades assintticas.
e' e
2
Lembre que OLS
que no-viesado.
=
nk
2
ML
=
105
LISTA DE EXERCCOS 2
1) (Hoffmann, p.240) Considere o modelo
Yj = + Xj + uj
2
2
Considere que a E(u j)= X j . Com base nos seguintes dados
X
Y
1
13
2
10
5
20
5
15
10
50
Obtenha as estimativas de e de , utilizando o mtodo mais adequado.
2) (Hoffmann, p.241) Considere o modelo
Yj = + Xj + uj
Considere as informaes:
X
Diagonal a
matriz V
0
4
1
2
8
1
4
3
0,5
6
6
1
8
1
0,5
Obtenha as estimativas de e de , utilizando o mtodo mais adequado.
3) Considere dados de corte sobre 41 pases.
lnYi = 1 + 2 lnX2i + 3 lnX3i + ui
Sendo que Y representa a razo entre tributes sobre comrcio (impostos sobre importao e
exportao) e receita total do governo; X2 = razo entre a soma das importaes e exportaes e o PNB
e X3 = PNB per capita. A estimativa da regresso para realizar o teste de White
R2 = 0,1148
4) (Hoffmann, exer. 7.1) Admite-se que X, Y esto relacionados de acordo com o modelo
Y j = + X j + uj
onde uj = 0,5 ut-1 + t e t so erros aleatrios independentes com mdia zero e varincia constante.
Xt
Yt
1
39
2
24
3
24
106
4
12
5
15
Obtenha as estimativas lineares no-tendenciosas de varincia mnima de e de .
5) (Gujarati, p. 442) Dada uma amostra de 50 observaes e 4 variveis explicativas, o que voc pode
dizer sobre a autocorrelao se (a) d = 1,05 ?
(b) d = 1,40 ?
(c) d = 2,50 ?
(d) d = 3,97 ?
6) Considere o seguinte modelo estimado,
DPCPt = 1.242,169 + 0,6033 RPDPt + 0,4106 DPCPt - 1
t = (3,0855) (4,0155)
(2,6561)
d = 1,0056
h de Durbin = 5,119
R2 = 0,9926
Em que,
Y1t = 0 + 1Y2t + 2 X 2t + 2t
onde as variveis endgenas Y1t e Y2t so a quantidade transacionada e o preo do produto,
respectivamente, no perodo t. As variveis X1t e X2t so exgenas. Admite-se que 1t e 2t so erros
aleatrios independentes com mdia zero e varincia constante e que o erro de um perodo
independente dos erros em outros perodos. Com base nos seguintes dados
X1t
X2t
Y1t
Y2t
1
1
3
3
5
5
7
7
1
1
3
3
3
3
1
1
2
1
4
3
3
5
2
4
1
3
1
3
3
3
5
5
Yt = + X t + ut
X t = + Z t + t
107
onde ut e t so variveis aleatrias com mdia zero e varincia constante, que apresentam correlao
assinttica negativa e que no so correlacionadas com Zt. dado a seguinte amostra de valores:
Yt
10
19
16
22
33
45
48
61
70
76
Xt
5
8
6
7
10
12
13
15
20
24
Zt
2
4
3
5
8
11
12
15
14
16
(oferta)
Y1t = 0 + 1Y2t + 2 X 2t + 3 X 3t + 2t
As variveis endgenas Y1t e Y2t so a quantidade transacionada e o preo do produto, respectivamente,
no perodo t.
As variveis exgenas X1t, X2t e X3t so, respectivamente, a renda per capita, o montante de subsdios
recebidos pelos produtores e o preo da matria-prima.
Admite-se que 1t e 2t so erros aleatrias com mdia zero e varincia constante, e que os erros de um
perodo, embora correlacionados entre si, so no correlacionados com os erros relativos a outros
perodos. Considere as seguintes informaes:
X1t
5
6
7
7
8
9
X2t
130
110
120
120
110
130
X3t
30
20
26
26
30
24
Y1t
18,5
20,0
19,5
18,5
19,5
24,0
Y2t
7,5
8,0
7,5
8,5
12,5
10,0
Sample 1
Sample 2
300 2100
108
50 300
300 2100
yX
[300 2000 ]
yy
2100
[300 2200 ]
2800
(a) Compute the least squares regression coefficients and the residual variances, s2, for each data set.
Compute the R2 for each regression.
(b) Compute the OLS estima12te of the coefficient vector assuming that the coefficients and
disturbance
variance are the same in the two regressions. Also compute the estimate of the asymptotic covariance
matrix of the estimator.
(c) Test the hypothesis that the variances in the two regressions are the same without assuming that the
coefficients are the same in the two regressions.
11) (Greene, p. 980) The following regression is obtained by ordinary least squares, using 21
observations. (Estimated asymptotic standard errors are show in parentheses)
Yt = 1.3 + 0.97 Yt-1 + 2.31 Xt
(0.3) (0.18) (1.04)
D-W =1.21
24
1
0
21
1 23 24
[ y1 y2 y3 y4] 21
+ [ x1 x2 x3 x4 x5 ] 31 32 33
0 = [ 1 2 3 4]
0 32 1 34
43 44
0
0
1
41 42 0
0 52
0
0
14. Considere o seguinte modelo de demanda e oferta de um produto:
Demanda :
Qtd = 0 + 1 Pt + u1t
Oferta :
Qt = 0 + 1 Pt + 2Tt + u 2t
em que
Q = Quantidade; P = Preo; T = Tarifas; u1 e u2 = termo de erro. Suponha que Q e P
sejam endgenas e T exgena. Coloque o sistema na forma reduzida.
o
GABARITO
1) estimativa para 1 10 e para 2 2
2) estimativa para 1 6 e para 2 -0,5
109