Ejercicios Capitulo 4
Ejercicios Capitulo 4
Ejercicios Capitulo 4
AUTOR:
Ramírez Moreno, Rosario
Villantoy Polo, Victor
Villegas Purca, Soledad
ASESOR:
LIMA- PERÚ
2020
EJERCICIOS
Si la media condicional de una variable aleatoria dado otra es cero, entonces las dos
variables aleatorias tienen covarianza cero y por lo tanto no están correlacionadas
Supongamos que una horticultora quiere estudiar los efectos de diferentes métodos
orgánicos de escardar (X) sobre la producción de tomates (Y) y el distinto crecimiento que
conlleva sobre las diferentes parcelas de tomate la utilización de diferentes técnicas
orgánicas de escardado. Si elige la técnica a usar (el nivel de X) sobre la i-ésima parcela y
se aplica la misma técnica a la i-ésima parcela en todas las repeticiones del experimento,
entonces el valor de Xi no cambia de una muestra a la otra. Por lo tanto Xi es no aleatoria
(aunque el resultado Yi sea aleatorio), por lo que el esquema muestral no es i.i.d. Los
resultados mostrados en este capítulo desarrollados para regresores i.i.d. son igualmente
ciertos si los regresores son no aleatorios. Sin embargo, el caso de un regresor no
aleatorio es bastante especial. Por ejemplo, los protocolos experimentales modernos
habrían asignanado para la horticultora el nivel de X para las diferentes parcelas utilizando
un generador de números aleatorios, eludiendo así cualquier posible sesgo por parte de la
horticultora (que podría utilizar su método favorito para escardar los tomates de la
parcela más soleada). Cuando se utiliza este protocolo experimental moderno, el nivel de
X es aleatorio y (Xi, Yi) es i.i.d.
se pueden tener datos sobre los niveles de inventario (Y) de una empresa y el tipo de
interés al que la empresa puede pedir prestado (X), donde estos datos se recogen para
una empresa concreta a lo largo del tiempo; por ejemplo, se podrían haber recopilado
cuatro veces al año (trimestral) durante 30 años. Este es un ejemplo de datos de series
temporales, y una característica crucial de los datos de series temporales es que las
observaciones que están cercanas en el tiempo unas de la otras no son independientes,
sino que más bien tienden a estar correlacionadas unas con otras; si los tipos de interés
ahora son bajos, es probable que sean bajos el trimestre próximo. Este patrón de
correlación viola el supuesto de i.i.d. en la parte de la «independencia». Los datos de
series temporales introducen un conjunto de complicaciones que se manejan mejor
después de desarrollar las herramientas básicas de análisis de regresión
Suponga que un investigador utiliza datos sobre el tamaño de las clases (TC) y de los
promedios de las calificaciones en los exámenes para 100 clases de tercer curso, para
estimar la regresión MCO
calificaci onexamen =520,4 - 5,82 x TC, R2 = 0,08, ESR =11,5.
=520,4 - 128,04
= 392,36
b) El año pasado, un aula tenía 19 estudiantes, y este año cuenta con 23 alumnos. ¿Cuál es la
predicción de la regresión para la variación en la media de las calificaciones en el examen para
la clase?
=520,4 - 110,58
=409,82
= 520,4 - 133,86
= 386,54
c) La media muestral del tamaño de la clase para 100 aulas es de es 21,4. ¿Cuál es la media
muestral de las calificaciones en el examen entre las 100 aulas? (Pista: repasar las fórmulas de
los estimadores MCO).
11,5(21,4) = B1
246,1 = B1
d) ¿Cuál es la desviación típica muestral de las calificaciones en los exámenes entre las 100
aulas? (Pista: repasar las fórmulas de R2 y del ESR).
R2 = SE/ST
0,08=SE/100
SE=8
ESR =11,5
U21 = 11,5/ 1- 8
=11,5/-7
= -1,64
Supóngase que se selecciona una muestra aleatoria de 200 varones de veinte años
de edad de una población y que se registra la altura y el peso de estos hombres. Una
regresión del peso sobre la altura da
=186.59
= 202.5
c) Supóngase que en lugar de medir el peso y la altura en libras y pulgadas, esas variables se
miden en centímetros y kilogramos. ¿Cuáles son las estimaciones de la regresión para esa
nueva regresión centímetros-kilogramos? (Proporcione todos los resultados, los coeficientes
estimados el R2 y el ESR).
Una regresión del promedio de los ingresos salariales semanales (ISM, medidos en
dólares) sobre la edad (medida en años), utiliza una muestra aleatoria de
trabajadores con estudios universitarios a tiempo completo entre 25 y 65 años de
edad, y obtiene lo siguiente:
El coeficiente 9.6 el efecto marginal. Se espera que aumente en $9,6 por cada adicional de
edad.
b) El error estándar de la regresión (ESR) es 624,1. ¿Cuáles son las unidades de medida del ESR?
(¿Dólares? ¿Años? ¿O el ESR no tiene unidades?).
ESR está en las mismas unidades que la variable dependiente, por lo tanto ESR se mide en
dólares por semana.
c) El R2 de la regresión es 0,023. ¿Cuáles son las unidades de medida de R2? (¿Dólares? Años?
¿O el R2 no tiene unidades?).
R2 es unidad libre
d) ¿Cuáles son los ingresos salariales pronosticados por la regresión para un trabajador de 25
años de edad? ¿Y para un trabajador de 45 años de edad?
e) ¿Será fiable la regresión en sus predicciones sobre un trabajador de 99 años de edad? ¿Por
qué o por qué no?
No, el trabajador de más edad en la muestra tiene 65 años, 99 años está muy lejos del rango
de los datos de la muestra.
f) Teniendo en cuenta lo que se sabe acerca de la distribución de los ingresos, ¿cree que es
posible que la distribución de los errores de la regresión sea normal? (Pistas: ¿piensa que la
distribución es simétrica o asimétrica?, ¿cuál es el menor valor de los ingresos? y ¿es
compatible con una distribución normal?).
No, la distribución de las ganancias está sesgada positivamente y tiene curtosis mayor que la
normal.
g) El promedio de edad de esta muestra es de 41,6 años. ¿Cuál es el valor medio muestral de
ISM? (Pista: repasar el Concepto clave 4.2)
^β 0=Ý − ^β 1 X́ ;para qué Ý = ^β0 + β^ 1 X́ por lo tanto, la media muestral es