Trabajo Estadictico Sebastian

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 23

“Año de la unidad, la paz y

el desarrollo”

ASIGNATURA : ESTADICTICA
TEMA : PRACTICA
PROFESOR : TORRES LOPEZ CASIO AURELIO
CICLO : CICLO 4
INTEGRANTES : ROJAS GARCIA SEBASTIAN

HUANCAYO – PERU
2023
UNIVERSIDAD PERUANA LOS ANDES
FACULTAD DE INGENIERIA
Escuela Profesional de Ingeniería de Sistemas y Computación

PRACTICA DE REGRESION LINEAL Y NO LINEAL


1. La siguiente información corresponde a una muestra de 20 estudiantes en un Curso de
ESTADISTICA donde X = Calificaciones del I Examen e Y = Calificaciones del
Examen Final.

I EXAMEN FINAL
EXAMEN
Estudian Y
te X
1 84 66
2 70 77
3 87 84
4 68 56
5 81 86
6 96 81
7 90 79
8 82 82
9 89 81
10 70 84
11 88 81
12 65 74
13 87 74
14 89 74
15 69 74
16 80 71
17 75 94
18 84 83
19 76 68
20 74 69

Se pide:
a) El modelo teórico de regresión lineal simple
b) El modelo estimado de regresión
c) El coeficiente de correlación
d) El coeficiente de determinación
e) Si la calificación de las personas 21 y 22 son respectivamente 95 y 102, ¿cuáles son
las calificaciones finales?
REGRESION
Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 .290a .084 .033 8.319
a. Variables predictoras: (Constante), Calificaciones del
examen I

Variables introducidas/eliminadasb

Variables Variables
Modelo introducidas eliminadas Método
1 Calificacione
sa del examen . Introducir
I
a. Todas las variables solicitadas introducidas
b. Variable dependiente: Calificaciones del examen final

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 114.111 1 114.111 1.649 .215a
Residual 1245.689 18 69.205
Total 1359.800 19
a. Variables predictoras: (Constante), Calificaciones del examen I
b. Variable dependiente: Calificaciones del examen final

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 54.655 17.423 3.137 .006
Calificaciones
.277 .216 .290 1.284 .215
del examen I
a. Variable dependiente: Calificaciones del examen final

Correlaciones

Calificaciones
Calificaciones del examen
del examen I final
Calificaciones Correlación de Pearson 1 .290
del examen I Sig. (bilateral) . .215
N 20 20
Calificaciones Correlación de Pearson .290 1
del examen final Sig. (bilateral) .215 .
N 20 20

a.
b. ...............δ
c. Hallando el valor de I tenemos: 0.29
d. R2 = 0.084 Este valor indina que no se puede realizar pronósticos
Examen I (x) Examen final Valor
(Y) hallado
84 83 77.92
76 68 75.71
74 69 75.15
95 . 80.97
102 . 82.91

2. Ciertos investigadores mostraron una correlación de r = - 0.52 entre el salario


promedio de los maestros (X) y la proporción de estudiantes que abandonan la
Escuela antes de graduarse (Y) en 120 escuelas en un país. Concluyeron que incrementar
los salarios de los maestros reduciría la tasa de deserción. Comente esas conclusiones.

El indicador r = - 0.52 indica que la correlación es negativa y que no hay muy buena
correlación lineal ya que r < 0.7
Del enunciado podemos deducir que se trata de una relación directamente proporcional

3. Los datos de la tabla siguiente muestran la relación entre los CI verbales y no verbales de
la prueba de inteligencia de Lorge-Thorndike (LT) y el aprovechamiento en lectura y
aritmética medido por la prueba de Iowa de habilidades básicas (ITBS). En cada grado,
cada correlación está basada en aproximadamente 2,500 alumnos representativos de la
nación.
Nivel del grado CI verbal CI no verbal
3 5 7 3 5 7
Lectura .68 .76 .81 .53 .65 .67
Aritmética .66 .72 .74 .61 .68 .71

Basado en los datos anteriores, ¿las siguientes afirmaciones son verdaderas o falsas?

a) La correlación entre las medidas de inteligencia y aprovechamiento parece


incrementarse con el grado VERDADERO

b) Los CI no verbales están correlacionados tan alto con el aprovechamiento como con
los CI verbales VERDADERO
c) Los CI verbal y no verbal tienden a correlacionarse ligeramente más alto con lectura
que con aritmética FALSO
d) La correlación entre ambas medidas de aprovechamiento y ambas medidas de
inteligencia es sustancial en cada uno de los tres grados FALSO

4. Calcule “r” para los siguientes valores:

Identificación del estudiante


a b c d e f
Horas empleadas, 40 20 28 15 44 8
X
Horas de estudio, 20 24 16 30 18 28
Y
a. Predicciones: (Constante), IDENTIFICACION DEL ESTUDIANTE

5. Calcule” r” para los siguientes pares de valores:

Identificación del estudiante


a b c d e f g
Valores de actitud, 9 4 6 2 8 4 2
X
Valores de actitud, 4 7 8 3 6 2 4
Y

El nivel de correlación es 0,329.


El grado de correlación es bajo, esto quiere decir que no existe un nivel de correlación entre las
variables.

6. Se seleccionó una muestra aleatoria de seis estudiantes para hacer un estudio piloto a fin de
investigar la relación entre velocidad de lectura y redacción (X) medida en minutos
requeridos para leer la composición y recordar en detalle el contenido (Y) medido por un
examen sobre el material presentado en la composición. Calcular la r de Pearson basada
en los datos registrados a continuación.
Identificación del estudiante
a b c d e f
Velocidad de lectura, X 10 8 15 12 14 16
Retención del contenido, Y 17 17 13 16 15 12

Existe un fuerte grado de correlación entre velocidad de lectura y redacción (X) medida en
minutos requeridos para leer la composición y recordar en detalle el contenido (Y) medido
por un examen sobre el material presentado en la composición.

7. Suponga que por observaciones solamente, estimó las estaturas (X) y pesos (Y) de cada
uno de sus compañeros de clase y que calculó el coeficiente de correlación (r 1) entre
esas observaciones. ¿Cómo se compararía este coeficiente con el coeficiente (r 2)
usando datos de una báscula y una cinta métrica para determinar X y Y? ¿Por qué?
El coeficiente de correlación (r ₗ) nos muestra con que fuerza se asocian las variables, estas
variables se encuentran entre -1 y n entre -1 y 1, cuanto más cercano a uno existe cuanto más
cercano a uno existe un alto grado de co un alto grado de correlación, en este rrelación, en este
caso la variable altura y peso son variables relacionadas.
El coeficiente de correlación (r ₂) de la báscula nos ayuda a calcular el peso de nuestros
compañeros, y la peso de nuestros compañeros, y la cinta métrica nos cinta métrica nos ayuda a
medir la ayuda a medir la estatura, en este caso estatura, en este caso los resultados deberían ser
los resultados deberían ser los mismos, ya que los mismos, ya que son instrumentos necesarios
para recolectar nuestros datos precisos. s datos precisos investigar.

8. En un estudio sobre gastos (Y) e ingresos (X) mensuales, una muestra de 10


familias dio los siguientes datos (en nuevos soles):

Y X
500 560
400 500
640 700
740 800
800 900
800 1000
900 1000
600 700
1100 1400
1200 1600

a. Trazar el diagrama de dispersión e indicar la tendencia

b. Estimar la línea de regresión muestral


y = 128 + 0,7(x)
c. Interpretar el valor de los parámetros
b 0: Los gastos de las familias mensuales son de 128 soles suponiendo que no
reciban ingresos.
b 1: por un sol de ingresos de las familias, gastan 0,7 soles.

d. Predecir el gasto que correspondería a un ingreso de S/. 1800 y luego para S/. 2100

Si una familia recibe el ingreso de 1800 soles, gastaria aproximada 1388 soles
9. ¿Por qué son iguales los signos del coeficiente de correlación y de la pendiente de la
recta de regresión?

Porque los datos forman una recta lineal positiva, que al ser directamente
proporcional las variables, tiene una pendiente positiva y esto lo asegura el
coeficiente de correlación positiva que mide la intensidad de la relación lineal entre
dos variables, y esto demuestra aún más que entre las variables existe correlación.

10. Un Promotor de un CEP encargó un estudio para determinar la relación entre los
gastos de publicidad mensual por televisión y los ingresos por pensiones de enseñanza
de sus estudiantes. En el estudio se obtuvieron los siguientes resultados:

Semana Gastos de Publicidad (S/.) Ingresos por Pensiones (S/.)


1 3000 30000
2 2000 25000
3 4000 40000
4 3000 32000
5 5000 -
6 7000 75000
7 6000 63000
8 8000 93000
9 7000 70000
10 8000 84000
11 8500 90000

En el quinto mes por diversos motivos no se pudo hacer el estudio.

a) Determine la ecuación de regresión del pago de pensiones de enseñanza sobre gastos de


publicidad

b) ¿En cuánto estimaría el pago de pensiones del quinto mes?


Se estimaría en 47350 soles el pago de pensiones en el quinto mes.

c) Hacer un análisis de la bondad del ajuste de la ecuación de regresión lineal utilizando el


coeficiente de determinación

R´2 = 0.72
Bondad de ajustes : 72%
Eso significa que el 72% de las predicciones del modelo son correctas.

d) A partir del análisis realizado en c) ¿qué puede Ud. concluir acerca de la correlación
entre pago de pensiones de enseñanza y gastos de publicidad?

Existe una correlación lineal directa, si los gastos de publicidad aumentan, el pago de
pensiones de enseñanza también aumenta.

e) Determine los pagos de pensiones de enseñanza para los meses 12 y 13, para el efecto
proyecte los gastos de publicidad
Y= 10500 + 7370 (12)
Y= 98940
Se estima que para el doceavo mes los pagos de pensiones de enseñanza seria 98940
Y= 10500 + 7370 (13)
Y= 106310
Se estima que para el treceavo mes los pagos de pensiones seria 106310 soles
11. El número de horas de estudio invertidas y las calificaciones finales en un curso de
Matemáticas de una muestra de 8 alumnos ha dado los siguientes resultados:

Alumn Horas de estudio Calificación


o
A1 14 12
A2 16 13
A3 22 15
A4 20 15
A5 18 17
A6 16 11
A7 18 14
A8 22 16

a) Determine la recta de regresión de la calificación sobre el número de horas de estudios


invertidos

Y= 5+0,5(x)
b) Calcular el grado de asociación y determine si es significativo al nivel del 5% mediante
la significación de la pendiente de regresión

El grado de asociacion: 72%


Pendiente de la regresion: 0,5%
Si es significa al nivel del 5%

12. En un estudio para determinar la relación entre la edad (X) y la presión sanguínea (Y) en
una muestra aleatoria de 9 mujeres ha dado los siguientes resultados:
X 54 40 70 35 62 45 55 50 38
Y 148 123 155 115 150 126 152 144 114

a) Encuentre la ecuación de regresión estimada de Y en X y estime la presión sanguínea


para una mujer de 75 años

Y=69,96 + 1,33(x)
La presión sanguínea para una mujer de 75 años:
Y=69,96+1,33(75)
b) Utilice un procedimiento de análisis para probar de que no hay asociación lineal entre X
e Y.

Los reultados nos muestran que existe una fuerte correlacion entre la edad y presion
sanguinea

13. La función de inversión neta total para la infraestructura de un CEP se supone presenta la
forma:
Y = AXβ
En donde Y equivale a la inversión neta (en miles de dólares), X a la tasa de interés, y A, β
son constantes desconocidas. Se tiene la siguiente muestra:

X 12 8 10 7 6 5 5
Y 80 100 120 140 160 180 200

a) Determine la ecuación de regresión estimada


La recta de ajustes para los valores de X* e Y* es : y = 2,906 – 0,909(x)
Luego : A = anti log (2,906) = 805,3784 ; b = -0,909
Finalmente , la curva de ajuste esta dada por por la ecacucion:

b) Predecir la inversión cuando la tasa de interés sea de 7.5

y = 128,9939

14. Ajustar los siguientes datos a una curva de la forma:


Y = AeβX

X 1 2 3 4 5 6
Y 2.40 3.21 4.12 4.30 4.90 5.40

La recta de ajuste para los valores de X e Yes : y = 0,829 +0,153(x)

Finalmente, la curva de ajuste está dada por la ecuación:

15. Ajustar la ecuación de la forma Y = a + b a los datos:


X

X 1 0.5 0.4 0.25 0.2 5 5


Y 2 4 7 8 10 9 10
16. Se realiza un estudio de asociación entre las siguientes variables:

Y: gastos mensuales expresados en cientos de dólares


X1: ingreso mensual familiar en miles de dólares
X2: tamaño de la familia

En una muestra de 10 familias escogidas al azar se han encontrado los datos que se presentan
en la tabla que sigue:

Y X1 X2
45 10 8
40 9 8
38 8 6
35 7 6
32 7 5
30 6 4
28 6 3
27 4 2
25 3 2
22 2 1

a) Determinar la ecuación de regresión muestral de los datos mensuales con respecto a las
dos variables: Ingreso mensual y número de hijos

Y= 1,74+0,99(x)

b) Interpretar los coeficientes de la regresión

r = 0,965
R´2=0,931

Las variables de ingreso mensual y tamaño familiar tienen un fuerte grado de relación,
97%, esto quiere decir que según aumente el tamaño familiar, también aumentaran los
ingresos mensuales.

r = 0,964
R´2 = 0,929
Las variables de gastos mensuales e ingreso mensual tienen un fuerte grado de relación,
96%, esto quiere decir que según aumente el ingreso mensual, también aumentaran los
gastos mensuales.

Las variables de gastos mensuales y tamaño familiar tienen un fuerte grado de relación,
97%, esto quiere decir que según aumente el tamaño familiar, también aumentaran los
gastos mensuales.

c) Estimar el gasto mensual para una familia de 8 hijos y cuyo ingreso mensual es $ 7,000

El gasto mensual es 17854,732 soles para una familia de 8 hijos, cuyo ingreso mensual es 7
dólares.

17. Se realizó un estudio de las relaciones entre las notas obtenidas en 4 materias por 10
estudiantes de ingeniería de sistemas seleccionados aleatoriamente. Las 3 variables
independientes X1, X2, X3 y la variable dependiente Y son:

Y: notas en Estadística Aplicada


X1: nota en Matemática Básica
X2: nota en Lógica
X3: nota en Economía General
Los datos son los siguientes:

Y X1 X2 X3
13 12 10 18
15 14 12 15
17 16 10 18
16 15 11 20
13 11 13 15

17 15 16 18
19 16 10 19
14 14 14 16
18 17 13 15
11 11 11 13

a) Estimar el modelo de regresión

b) Probar la significación del modelo de regresión muestral

El grado de significancia es del 96%, esto quiere decir que existe correlación fuerte entre las
notas obtenidas en 4 materias por 10 estudiantes de Ingeniería de Sistemas y Computación

18. Ajustar los pares de datos (x, y) que se indican en la siguiente tabla a un polinomio de la
forma Y = a + bX +cX2.

X Y
1 1 8
2 2 4
3 3 1
4 4 5
5 5 7

19. Para los siguientes datos:


X 5 10 15 20 25 30 35 40 45 50
Y 19 16 15 5 15 9 11 13 8 10

Ajustar una curva de la forma:

Y = 1 / (A0 + A1X)

20. Los datos de la siguiente tabla recogen la inversión real (I) en educación, el rendimiento
académico (RA) en el sistema centesimal y la tasa de deserción media (r), correspondientes
al sistema educativo de un determinado país. Dichos datos corresponden al período 1981 -
2004 y está expresado en miles de unidades monetarias la primera variable y en tanto por
ciento la tasa de deserción.

AÑO I RA r
1981 80.2 10.2 9.2
1982 90.1 12.1 9.1
1983 92.3 14.4 9.0
1984 94.6 15.6 8.7
1985 110.2 18.2 9.0
1986 118.5 19.0 8.7
1987 131.6 21.7 8.3
1988 141.2 31.3 8.5
1989 147.5 34.6 8.7
1990 150.2 34.7 8.9
1991 152.3 33.5 9.1
1992 160.8 32.6 8.9
1993 182.3 41.5 8.3
1994 199.2 44.8 9.0
1995 221.4 46.7 9.1
1996 235.0 50.7 8.2
1997 248.9 56.8 8.1
1998 267.8 61.4 9.1
1999 301.2 72.5 8.7
2000 323.5 62.1 8.1
2001 345.7 61.1 8.6
2002 350.1 67.8 9.1
2003 352.8 68.9 8.5
2004 360.3 75.0 9.0

Con esta información se pide:

a) Formular un modelo teórico que permita saber los efectos que la tasa de deserción haya
tenido en el rendimiento académico
b) Estime el modelo anterior, luego:
b.1) Interprete los coeficientes obtenidos

b.2) Dar una medida de la bondad de ajuste, interpretando su significado

c) Si en la ecuación del rendimiento académico de (a) introducimos la inversión en


educación,
c.1) Formule el modelo teórico
c.2) Estime el modelo

c.3) Compare la bondad de ajuste con el modelo dado en (b)

Eso significa que el 94% de las predicciones del modelo son correctas.
Al relacionar el rendimiento académico con la tasa de deserción se obtienen predicciones
no tan correctas, pero al relacionar rendimiento académico con inversión en educación
se obtiene predicciones correctas altas.

c) Estime el rendimiento académico promedio para el 2005 en base a la proyección de la


inversión en educación y la tasa de deserción media que se mantiene constante e igual al
promedio del período.
21.Una empresa fabricante de cereales para el desayuno desea conocer la ecuación que permita
predecir las ventas (en miles de soles) en función de los gastos en publicidad infantil en
televisión (en miles de soles), la inversión en publicidad en radio (en miles de soles) y la
inversión en publicidad en los periódicos (en miles de soles). Se realiza un estudio en el
que se reúnen los datos mensuales correspondientes a los últimos 20 meses. Estos datos se
muestran en la siguiente tabla:

Ventas Publicidad - TV Publicidad - radio Publicidad - periódico


10.0 1.0 50.0 0.4
12.0 1.2 57.0 0.4
11.0 1.3 56.0 0.42
13.0 1.4 55.0 0.5
12.0 1.5 60.0 0.4
14.0 1.7 65.0 0.44
16.0 1.75 69.0 0.4
12.0 1.3 67.0 0.44
14.0 1.45 68.0 0.46
11.0 0.9 67.0 0.46
10.0 0.8 97.0 0.45
19.0 0.9 66.0 1.1
8.5 0.8 65.0 0.3
8.0 1.0 60.0 0.5
9.0 1.7 70.0 0.45
13.0 1.8 110.0 0.4
16.0 1.85 75.0 0.8
18.0 1.9 80.0 0.9
20.0 2.0 85.0 0.9
22.0 2.0 90.0 1.1

Se pide:
a. Ajustar un modelo de regresión lineal múltiple. Obtener una estimación de los
parámetros del modelo y su interpretación

Y= 2.108 + 11,347(x) + 3.432 (x´2)+ 0.001(x´3)

b. ¿Puede eliminarse alguna variable del modelo? Realiza los contrastes de


significación individuales
c. Coeficiente de determinación y de determinación corregido

Huancayo, noviembre del 2023

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy