Trabajo Estadictico Sebastian
Trabajo Estadictico Sebastian
Trabajo Estadictico Sebastian
el desarrollo”
ASIGNATURA : ESTADICTICA
TEMA : PRACTICA
PROFESOR : TORRES LOPEZ CASIO AURELIO
CICLO : CICLO 4
INTEGRANTES : ROJAS GARCIA SEBASTIAN
HUANCAYO – PERU
2023
UNIVERSIDAD PERUANA LOS ANDES
FACULTAD DE INGENIERIA
Escuela Profesional de Ingeniería de Sistemas y Computación
I EXAMEN FINAL
EXAMEN
Estudian Y
te X
1 84 66
2 70 77
3 87 84
4 68 56
5 81 86
6 96 81
7 90 79
8 82 82
9 89 81
10 70 84
11 88 81
12 65 74
13 87 74
14 89 74
15 69 74
16 80 71
17 75 94
18 84 83
19 76 68
20 74 69
Se pide:
a) El modelo teórico de regresión lineal simple
b) El modelo estimado de regresión
c) El coeficiente de correlación
d) El coeficiente de determinación
e) Si la calificación de las personas 21 y 22 son respectivamente 95 y 102, ¿cuáles son
las calificaciones finales?
REGRESION
Resumen del modelo
Variables introducidas/eliminadasb
Variables Variables
Modelo introducidas eliminadas Método
1 Calificacione
sa del examen . Introducir
I
a. Todas las variables solicitadas introducidas
b. Variable dependiente: Calificaciones del examen final
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 114.111 1 114.111 1.649 .215a
Residual 1245.689 18 69.205
Total 1359.800 19
a. Variables predictoras: (Constante), Calificaciones del examen I
b. Variable dependiente: Calificaciones del examen final
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 54.655 17.423 3.137 .006
Calificaciones
.277 .216 .290 1.284 .215
del examen I
a. Variable dependiente: Calificaciones del examen final
Correlaciones
Calificaciones
Calificaciones del examen
del examen I final
Calificaciones Correlación de Pearson 1 .290
del examen I Sig. (bilateral) . .215
N 20 20
Calificaciones Correlación de Pearson .290 1
del examen final Sig. (bilateral) .215 .
N 20 20
a.
b. ...............δ
c. Hallando el valor de I tenemos: 0.29
d. R2 = 0.084 Este valor indina que no se puede realizar pronósticos
Examen I (x) Examen final Valor
(Y) hallado
84 83 77.92
76 68 75.71
74 69 75.15
95 . 80.97
102 . 82.91
El indicador r = - 0.52 indica que la correlación es negativa y que no hay muy buena
correlación lineal ya que r < 0.7
Del enunciado podemos deducir que se trata de una relación directamente proporcional
3. Los datos de la tabla siguiente muestran la relación entre los CI verbales y no verbales de
la prueba de inteligencia de Lorge-Thorndike (LT) y el aprovechamiento en lectura y
aritmética medido por la prueba de Iowa de habilidades básicas (ITBS). En cada grado,
cada correlación está basada en aproximadamente 2,500 alumnos representativos de la
nación.
Nivel del grado CI verbal CI no verbal
3 5 7 3 5 7
Lectura .68 .76 .81 .53 .65 .67
Aritmética .66 .72 .74 .61 .68 .71
Basado en los datos anteriores, ¿las siguientes afirmaciones son verdaderas o falsas?
b) Los CI no verbales están correlacionados tan alto con el aprovechamiento como con
los CI verbales VERDADERO
c) Los CI verbal y no verbal tienden a correlacionarse ligeramente más alto con lectura
que con aritmética FALSO
d) La correlación entre ambas medidas de aprovechamiento y ambas medidas de
inteligencia es sustancial en cada uno de los tres grados FALSO
6. Se seleccionó una muestra aleatoria de seis estudiantes para hacer un estudio piloto a fin de
investigar la relación entre velocidad de lectura y redacción (X) medida en minutos
requeridos para leer la composición y recordar en detalle el contenido (Y) medido por un
examen sobre el material presentado en la composición. Calcular la r de Pearson basada
en los datos registrados a continuación.
Identificación del estudiante
a b c d e f
Velocidad de lectura, X 10 8 15 12 14 16
Retención del contenido, Y 17 17 13 16 15 12
Existe un fuerte grado de correlación entre velocidad de lectura y redacción (X) medida en
minutos requeridos para leer la composición y recordar en detalle el contenido (Y) medido
por un examen sobre el material presentado en la composición.
7. Suponga que por observaciones solamente, estimó las estaturas (X) y pesos (Y) de cada
uno de sus compañeros de clase y que calculó el coeficiente de correlación (r 1) entre
esas observaciones. ¿Cómo se compararía este coeficiente con el coeficiente (r 2)
usando datos de una báscula y una cinta métrica para determinar X y Y? ¿Por qué?
El coeficiente de correlación (r ₗ) nos muestra con que fuerza se asocian las variables, estas
variables se encuentran entre -1 y n entre -1 y 1, cuanto más cercano a uno existe cuanto más
cercano a uno existe un alto grado de co un alto grado de correlación, en este rrelación, en este
caso la variable altura y peso son variables relacionadas.
El coeficiente de correlación (r ₂) de la báscula nos ayuda a calcular el peso de nuestros
compañeros, y la peso de nuestros compañeros, y la cinta métrica nos cinta métrica nos ayuda a
medir la ayuda a medir la estatura, en este caso estatura, en este caso los resultados deberían ser
los resultados deberían ser los mismos, ya que los mismos, ya que son instrumentos necesarios
para recolectar nuestros datos precisos. s datos precisos investigar.
Y X
500 560
400 500
640 700
740 800
800 900
800 1000
900 1000
600 700
1100 1400
1200 1600
d. Predecir el gasto que correspondería a un ingreso de S/. 1800 y luego para S/. 2100
Si una familia recibe el ingreso de 1800 soles, gastaria aproximada 1388 soles
9. ¿Por qué son iguales los signos del coeficiente de correlación y de la pendiente de la
recta de regresión?
Porque los datos forman una recta lineal positiva, que al ser directamente
proporcional las variables, tiene una pendiente positiva y esto lo asegura el
coeficiente de correlación positiva que mide la intensidad de la relación lineal entre
dos variables, y esto demuestra aún más que entre las variables existe correlación.
10. Un Promotor de un CEP encargó un estudio para determinar la relación entre los
gastos de publicidad mensual por televisión y los ingresos por pensiones de enseñanza
de sus estudiantes. En el estudio se obtuvieron los siguientes resultados:
R´2 = 0.72
Bondad de ajustes : 72%
Eso significa que el 72% de las predicciones del modelo son correctas.
d) A partir del análisis realizado en c) ¿qué puede Ud. concluir acerca de la correlación
entre pago de pensiones de enseñanza y gastos de publicidad?
Existe una correlación lineal directa, si los gastos de publicidad aumentan, el pago de
pensiones de enseñanza también aumenta.
e) Determine los pagos de pensiones de enseñanza para los meses 12 y 13, para el efecto
proyecte los gastos de publicidad
Y= 10500 + 7370 (12)
Y= 98940
Se estima que para el doceavo mes los pagos de pensiones de enseñanza seria 98940
Y= 10500 + 7370 (13)
Y= 106310
Se estima que para el treceavo mes los pagos de pensiones seria 106310 soles
11. El número de horas de estudio invertidas y las calificaciones finales en un curso de
Matemáticas de una muestra de 8 alumnos ha dado los siguientes resultados:
Y= 5+0,5(x)
b) Calcular el grado de asociación y determine si es significativo al nivel del 5% mediante
la significación de la pendiente de regresión
12. En un estudio para determinar la relación entre la edad (X) y la presión sanguínea (Y) en
una muestra aleatoria de 9 mujeres ha dado los siguientes resultados:
X 54 40 70 35 62 45 55 50 38
Y 148 123 155 115 150 126 152 144 114
Y=69,96 + 1,33(x)
La presión sanguínea para una mujer de 75 años:
Y=69,96+1,33(75)
b) Utilice un procedimiento de análisis para probar de que no hay asociación lineal entre X
e Y.
Los reultados nos muestran que existe una fuerte correlacion entre la edad y presion
sanguinea
13. La función de inversión neta total para la infraestructura de un CEP se supone presenta la
forma:
Y = AXβ
En donde Y equivale a la inversión neta (en miles de dólares), X a la tasa de interés, y A, β
son constantes desconocidas. Se tiene la siguiente muestra:
X 12 8 10 7 6 5 5
Y 80 100 120 140 160 180 200
y = 128,9939
X 1 2 3 4 5 6
Y 2.40 3.21 4.12 4.30 4.90 5.40
En una muestra de 10 familias escogidas al azar se han encontrado los datos que se presentan
en la tabla que sigue:
Y X1 X2
45 10 8
40 9 8
38 8 6
35 7 6
32 7 5
30 6 4
28 6 3
27 4 2
25 3 2
22 2 1
a) Determinar la ecuación de regresión muestral de los datos mensuales con respecto a las
dos variables: Ingreso mensual y número de hijos
Y= 1,74+0,99(x)
r = 0,965
R´2=0,931
Las variables de ingreso mensual y tamaño familiar tienen un fuerte grado de relación,
97%, esto quiere decir que según aumente el tamaño familiar, también aumentaran los
ingresos mensuales.
r = 0,964
R´2 = 0,929
Las variables de gastos mensuales e ingreso mensual tienen un fuerte grado de relación,
96%, esto quiere decir que según aumente el ingreso mensual, también aumentaran los
gastos mensuales.
Las variables de gastos mensuales y tamaño familiar tienen un fuerte grado de relación,
97%, esto quiere decir que según aumente el tamaño familiar, también aumentaran los
gastos mensuales.
c) Estimar el gasto mensual para una familia de 8 hijos y cuyo ingreso mensual es $ 7,000
El gasto mensual es 17854,732 soles para una familia de 8 hijos, cuyo ingreso mensual es 7
dólares.
17. Se realizó un estudio de las relaciones entre las notas obtenidas en 4 materias por 10
estudiantes de ingeniería de sistemas seleccionados aleatoriamente. Las 3 variables
independientes X1, X2, X3 y la variable dependiente Y son:
Y X1 X2 X3
13 12 10 18
15 14 12 15
17 16 10 18
16 15 11 20
13 11 13 15
17 15 16 18
19 16 10 19
14 14 14 16
18 17 13 15
11 11 11 13
El grado de significancia es del 96%, esto quiere decir que existe correlación fuerte entre las
notas obtenidas en 4 materias por 10 estudiantes de Ingeniería de Sistemas y Computación
18. Ajustar los pares de datos (x, y) que se indican en la siguiente tabla a un polinomio de la
forma Y = a + bX +cX2.
X Y
1 1 8
2 2 4
3 3 1
4 4 5
5 5 7
Y = 1 / (A0 + A1X)
20. Los datos de la siguiente tabla recogen la inversión real (I) en educación, el rendimiento
académico (RA) en el sistema centesimal y la tasa de deserción media (r), correspondientes
al sistema educativo de un determinado país. Dichos datos corresponden al período 1981 -
2004 y está expresado en miles de unidades monetarias la primera variable y en tanto por
ciento la tasa de deserción.
AÑO I RA r
1981 80.2 10.2 9.2
1982 90.1 12.1 9.1
1983 92.3 14.4 9.0
1984 94.6 15.6 8.7
1985 110.2 18.2 9.0
1986 118.5 19.0 8.7
1987 131.6 21.7 8.3
1988 141.2 31.3 8.5
1989 147.5 34.6 8.7
1990 150.2 34.7 8.9
1991 152.3 33.5 9.1
1992 160.8 32.6 8.9
1993 182.3 41.5 8.3
1994 199.2 44.8 9.0
1995 221.4 46.7 9.1
1996 235.0 50.7 8.2
1997 248.9 56.8 8.1
1998 267.8 61.4 9.1
1999 301.2 72.5 8.7
2000 323.5 62.1 8.1
2001 345.7 61.1 8.6
2002 350.1 67.8 9.1
2003 352.8 68.9 8.5
2004 360.3 75.0 9.0
a) Formular un modelo teórico que permita saber los efectos que la tasa de deserción haya
tenido en el rendimiento académico
b) Estime el modelo anterior, luego:
b.1) Interprete los coeficientes obtenidos
Eso significa que el 94% de las predicciones del modelo son correctas.
Al relacionar el rendimiento académico con la tasa de deserción se obtienen predicciones
no tan correctas, pero al relacionar rendimiento académico con inversión en educación
se obtiene predicciones correctas altas.
Se pide:
a. Ajustar un modelo de regresión lineal múltiple. Obtener una estimación de los
parámetros del modelo y su interpretación