Analisis de Regresion Y Correlacion Lineal: Enzo Aldo Bravo Burgos
Analisis de Regresion Y Correlacion Lineal: Enzo Aldo Bravo Burgos
Analisis de Regresion Y Correlacion Lineal: Enzo Aldo Bravo Burgos
ANALISIS DE REGRESION
Y CORRELACION LINEAL
DEFINICIÓN:
Simple 𝑌 = 𝛽0 + 𝛽 1 𝑋
REGRESIÓN
LINEAL
Múltiple 𝑌 = 𝛽0 +𝛽 1 𝑋 1 +...+𝛽 𝑘 𝑋 𝑘
Potencia 𝛽1
𝑌 = 𝛽0 𝑋
REGRESIÓN NO Exponencial 𝑌 = 𝛽0 𝛽 1 𝑋
LINEAL
Hiperbólico 𝛽1
𝑌 = 𝛽0 +
𝑋
DIAGRAMA DE DISPERSIÓN
X X X
𝑆 𝑥𝑦
∑ ( 𝑥𝑖− 𝑥) ( 𝑦 𝑖− 𝑦 )
𝑖=1
𝑟= =
√ √
𝑆𝑥 𝑆 𝑦 𝑛 𝑛
∑ (𝑥𝑖 − 𝑥 ) 2
∑ ( 𝑦 𝑖 − 𝑦 )2
𝑖 =1 𝑖 =1
𝑛 𝑛 𝑛
𝑛∑ 𝑋𝑖𝑌 𝑖 −∑ 𝑋 𝑖 ∑𝑌𝑖
𝑖= 1 𝑖= 1 𝑖=1
𝑟=
√
𝑛
𝑛 ∑ 𝑋 𝑖 −¿ ¿ ¿ ¿
2
𝑖= 1
Interpretación:
𝛽 0 , 𝛽1 = Parámetro de la ecuación
^𝛽= ,Estimadores
^𝛽 de la ecuación
0 1
= Intercepto. Valor de Y cuando X es igual a cero
𝛽 0 = Pendiente. Incremento de Y, cuando X aumenta en una
𝛽
unidad.
1
Ecuación Explícita de la Recta
Y y = β0+ β1 x
Δ𝑌
Δ𝑋 β1¿ Δ𝑌
Δ𝑋
β0
X
β0 :Ordenada en el orígen. Punto de corte con el eje de ordenadas o “eje y”.
En este punto x está en el “origen” es decir x=0
e = y – β0 - β1 x
ESTIMACIÓN DE LOS COEFICIENTES DE
REGRESIÓN: CRITERIO DEL MEJOR AJUSTE
𝒏 𝒏 𝒏
𝑺𝒓 =∑ 𝒆 = ∑ ( 𝒚 𝒊 ,𝒎𝒆𝒅𝒊𝒅𝒂 − 𝒚 𝒊 ,𝒎𝒐𝒅𝒆𝒍𝒐 ) = ∑ ( y – β0 − β1 x )
𝟐 𝟐 𝟐
𝒊
𝒊=𝟏 𝒊 =𝟏 𝒊 =𝟏
AJUSTE POR MÍNIMOS CUADRADOS
Derivando respecto a β0 y β1 .
𝑛 𝑛 𝑛
𝑆𝑟 =∑ 𝑒 =∑ ( 𝑦 𝑖 ,𝑚𝑒𝑑𝑖𝑑𝑎 − 𝑦 𝑖, 𝑚𝑜𝑑𝑒𝑙𝑜 ) =∑ ( 𝑦 𝑖 − β 0 − β 1 𝑥 𝑖 )
2
𝑖
2 2
Obtenemos
Igualando a 0
0=∑ 𝑦𝑖 −∑ β0 −∑ β1 𝑥𝑖
Despejando obtenemos las ecuaciones normales
ESTIMACIÓN DE LOS COEFICIENTES DE
REGRESIÓN
ECUACIONES NORMALES
Para estimar estos coeficientes de regresión,
primero se deben construir las ecuaciones
normales que son las siguientes:
𝑛 𝑛
∑ 𝑌 𝑖 =𝑛 𝛽 0+ 𝛽1 ∑ 𝑋 𝑖
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
∑ 𝑌 𝑖 𝑋 𝑖= 𝛽0 ∑ 𝑋 𝑖 + 𝛽1 ∑ 𝑋 𝑖
2
𝑖 =1
^
𝛽 0= ¯ ^
𝑦 − 𝛽1 ¯
𝑥
√
𝑛 𝑛 𝑛
∑ 𝑦𝑖 − ^
𝛽0 ∑ 𝑦𝑖 − ^
𝛽1 ∑ 𝑥𝑖 𝑦 𝑖
2
𝑖=1 𝑖 =1 𝑖 =1
𝑆 𝑦 .𝑥 =
𝑛− 2
MEDIDAS DE BONDAD DE AJUSTE
2. COEFICIENTE DE DETERMINACIÓN: r2, R2
El coeficiente de determinación mide el porcentaje de
variabilidad en Y que puede ser explicada por la variable
independiente X.
Se denota por R2 o r2
Para su cálculo se utiliza la siguiente fórmula:
𝑛 𝑛
^
𝛽0 ∑ 𝑦 𝑖 + ^
𝛽1 ∑ 𝑥𝑖 𝑦 𝑖 − 𝑛 𝑦
¯
2
2 𝑖=1 𝑖=1
𝑟 = 𝑛
∑ 2
𝑦𝑖 − 𝑛 ¯
𝑦
2
𝑖=1
120
Costo de mantenimiento $
100
80
60
40
20
0
0.5 1 1.5 2 2.5 3 3.5
MAQUINA X Y XY X2 Y2
1 1 30 30 1 900
2 1 40 40 1 1600
3 2 70 140 4 4900
4 2 80 160 4 6400
𝑛 𝑛 𝑛
𝑛 ∑ 𝑥𝑖 𝑦 𝑖 − ∑ 𝑥𝑖 ∑ 𝑦 𝑖 6(1030)−(12)(4 40)
^
𝛽 1=
𝑖 =1 𝑖=1 𝑖 =1
𝑛∑
𝑛
𝑥=
6 (28)− ¿¿
−(440/6)-37.5*(12/6)=-1.6667
2
¿¿¿
𝑖
𝑖 =1
^ 𝑦 −^
𝛽 0= ¯ 𝛽1 ¯
𝑥
Por lo tanto la ecuación de regresión es:
Y = -1.6667 + 37.5 X
Interpretación:
β0 = -1.67: Cuando la máquina no tienen ningún
año de funcionamiento su costo de
mantenimiento es de -1.67 dólares.
β1 = 37.5: Por cada año de funcionamiento de la
maquina su costo de mantenimiento aumenta
en 37.5 dólares.
2.- Pronostico cuando la máquina tienen 4 años
de funcionamiento:
Y=-1.6667+37.5*4=148.33
que significa, que el costo de mantenimiento
para la maquina si tiene 4 años de
funcionamiento es de 148.33$.
3.- Calculamos el error estándar de estimación:
√
𝑛 𝑛 𝑛
∑ 𝑖 − ^𝛽 0 ∑ 𝑦 𝑖 − ^𝛽1 ∑ 𝑥𝑖 𝑦 𝑖
𝑦
2
𝑖=1 𝑖 =1 𝑖=1
𝑆 𝑦 .𝑥 =
√
𝑛− 2
38 200+1.6667(4 40)−37.5(1030)
𝑆 𝑦 .𝑥 =
8.7797
4
El desvió promedio de los residuos a la recta
Y = -1.6667 + 37.5 X es de 8.7797
4.- Calculamos el Coeficiente de determinación: R2
𝑛 𝑛
^
𝛽0 ∑ 𝑦 𝑖 + ^
𝛽1 ∑ 𝑥 𝑖 𝑦 𝑖 − 𝑛 𝑦
¯2
2 𝑖=1 𝑖 =1
𝑅 = 𝑛
∑ 2
𝑦𝑖 − 𝑛 ¯
𝑦
2
𝑖=1
𝑅 =
2
− 1.6667 ∗ 440+37.5 ∗ 1030 − 6 ∗ ( 446
6 )2
38200 − 6 ∗ ( 440
6 )2
𝑅2 =0.948
E
120
Costo de mantenimiento $
100
80
60
40
20
0
0.5 1 1.5 2 2.5 3 3.5