Regresión Lineal
Regresión Lineal
Regresión Lineal
PROBABILIDAD Y ESTADÍSTICA
Diagrama de dispersión
Es la ubicación de los datos muestrales en un plano bidimensional, el cual proporciona
una imagen visual del tipo de relación involucrada y sugiere el tipo de ecuación que
mejor se ajustará a los datos.
1 3 5 11 4 8
2 2 4 12 8 4
3 4 4 13 3 7
4 12 9 14 12 6
5 11 8 15 9 8
6 8 9 16 8 5
7 9 7 17 11 10
8 7 8 18 7 7
9 6 5 19 8 6
10 5 6 20 10 5
Este criterio implica que la recta elegida para ajustar los puntos del diagrama de
dispersión sea tal que la suma de los cuadrados de las distancias verticales entre los
puntos y la recta sea lo más pequeña posible.
Y= a + bx
7 Claudia Leticia Cen Che
(x16, a+b x16)
Y1 – (a + b x 1)
Y2 – (a + b x 2)
Y3 – ( a + b x 3)
.
.
.
Y20 – (a + b x 20)
_________________
Y a bX 2
El criterio de mínimos cuadrados exige que sea la suma mínima. Entonces cualquier recta
que minimice esta cantidad recibe el nombre de RECTA DE MÍNIMOS
CUADRADOS.
9 Claudia Leticia Cen Che
a : es la intersección con el eje Y
b: es la pendiente de la recta
y
i 1
i a n b xi
i 1
n n n
x yi a xi b xi
2
i
i 1 i 1 i 1
2 2 4 8 4
3 4 4 16 16
4 12 9 108 144
5 11 8 88 121
6 8 9 72 64
7 9 7 63 81
8 7 8 56 49
9 6 5 30 36
10 5 6 30 25
12 8 4 32 64
13 3 7 21 9
14 12 6 72 44
15 9 8 72 81
16 8 5 40 64
17 11 10 110 121
18 7 7 49 49
19 8 6 48 64
20 10 5 50 100
n n
(1) y
i 1
i a n b xi
i 1
n n n
x yi a xi b xi
2
(2) i
i 1 i 1 i 1
Y= 4.55 + 0.272 x
14 Claudia Leticia Cen Che
Las fórmulas para a y b, pueden obtenerse resolviendo algebraicamente las ecuaciones (1) y (2).
Se tiene:
x y x xy
a
2
n x x 2 2
n xy x y
b
n x 2 x
2
a
1261131 147 1012 165191 148764 16427 4.55
20 1261 147 25220 21609
2
3611
Y= 4.55 + 0.272 x
15 Claudia Leticia Cen Che
16 Claudia Leticia Cen Che
Una vez que se determina la ecuación de la recta de mínimos cuadrados, es posible predecir el
desempeño académico de un estudiante en la universidad con base a su desempeño en bachillerato.
Ejemplo:
Si el PPC de un estudiante en bachillerato es 10; su PPC en la universidad puede predecirse
sustituyendo x=10 en la ecuación anterior:
Y = 4.55 + 0.27 x ------------------ y = 4.55 + 0.27 (10)
y= 4.55 + 2.7
y= 7.25
a) Ajusta una línea de mínimos cuadrados con la que se pueda predecir los residuos
de cloro en función del número de horas después de que al alberca ha sido tratada
con los productos químicos
b) Utiliza la ecuación de los mínimos cuadrados para estimar los residuos de cloro en
la alberca 5 horas después de que se ha tratado con productos químicos