Clase 12. Regresión

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 16

Covarianza,

Correlación lineal y
Regresión
Regresión Lineal
oConstruir un modelo de regresión lineal simple que describa
como influye una variable X sobre otra variable Y. 
oObtener estimaciones puntuales de los parámetros de dicho
modelo 
oComo base en el modelo hacer estimaciones de las variables  
VARIABLES ESTADÍSTICAS
BIDIMENSIONALES

• En el análisis estadístico es
conveniente a veces contrastar los
datos procedentes de dos
características estudiadas sobre
un mismo individuo.
• En este sentido se plantea la
consideración de variables
estadísticas bidimensionales, así
como la detección de posibles
relaciones entre los dos caracteres
investigados.
ística
el conjunto (X,Y)
eerentes
eden tomar dos
X eY
nsional
da uno de los
población o

s
rac
ísti
sX
Y se
no
na

ria
es y
ed

r
mba

an
ativ

mba

alit
vo

da
o;
u
z,

rac
es
an
ativ

ed
er
ria
es
tad
ca

nto
cr
as
mo
nti
as.
TABLAS DE CORRELACIÓN

Son la representación simultanea de dos observaciones X e Y por


ejemplo:
Consideremos la clasificación obtenidas por una muestra de treinta
(30) estudiantes en el examen de matemáticas (Saber Pro) (variable
X) y la nota final de su primer curso de matemáticas (variable Y).
• Notas del Examen de Matemáticas (saber Pro) (Xi)
• Primer curso de matemáticas (Yi)

Usualmente la identificación de la relación entre dos variables


como estas, comienza con el intento de descubrir la forma
aproximada de la relación mediante una gráfica de dispersión.
Nota primer
curso de Examen de
matemáticas Matemáticas
Nota primer Examen de (X) (Icfes) Y
curso de Matemáticas 3,2 3,3
matemáticas (X) (Icfes) Y 1,8 2,7
2,4 3 2,7 3,5
2,6 2,4 2,1 2,9
3 3,7 1,7 2,7
3,9 3,6 1,7 2,9
2,3 3,2
3,6 3,8 2,6 3,4
3 2,9 2,7 2,5
3,1 3,5
2,8 3
2,2 2,3
2,9 3
1,9 2,9
2,2 2,7
3,1 3,7
2,6 2,7
2,8 3,3
2,7 2,8
2,4 3,1
3 2,8
3,3 3
1,8 2,2
2,8 3,1
GRÁFICA
Diagrama de dispersión
4
Examen de matemáticas del Icfes

3.5 f(x) = 0.48 x + 1.76


3 R² = 0.4

2.5
2
Linear ()
1.5
1
0.5
0
1.5 2 2.5 3 3.5 4 4.5
Notas Primer curso de matemáticas
Covarianza

•   𝑑𝑎𝑡𝑜𝑠 sin⁡𝑎𝑔𝑟𝑢𝑝𝑎𝑟

𝑑𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎dos

 Propiedades:
La covarianza indica que tipo de relación hay entre las variables.
1. Si la relación directa
2. Si la relación es inversa
3. Si no hay relación lineal entre las variables.
Covarianza datos agrupados
Covarianza
Propiedad: ¿  𝐶𝑜𝑣( 𝑥 , 𝑦)∨≤ 𝑆 𝑥 𝑆 𝑦

El coeficiente de correlación lineal de Pearson es:


  𝐶𝑜𝑣 ( 𝑥 , 𝑦 )
𝑟=
𝑆𝑥 𝑆 𝑦
Covarianza

• Si
  , las variables están más correlacionadas cuanto
más próximo sea |r| a 1. Asi:
• Están poco correlacionadas
• la correlación débil
• la correlación es fuerte
• la correlación es Optima
Covarianza
Regresión Lineal
• Si utilizamos un sistema de coordenadas cartesianas para
representar la distribución bidimensional, obtenemos un
conjunto de puntos conocido como diagrama de dispersión.
La distribución requiere parámetros, denominados pendiente
e intercepto con el eje.
• Modelo de Regresión Lineal

y  a  bx
𝑛
  ∑ 𝑥𝑖 ∗ 𝑦 𝑖 − 𝑛 ´
𝑥 ´
𝑦
𝑏=
𝑖= 1


𝑛
𝑥
2
−𝑛 ¿ ¿ ¿
𝑎= ´𝑦 −𝑏 ´𝑥
 

𝑖=1
Ejercicio:
Análisis de varianza (tabla anova)

Fuente de Suma de Grados de Cuadrados F calculado


variación cuadrados libertad medios
Regresión SCR 1 CMR=SCR/1
Error SCE n-2 CME=SCE/n-2 Fc=CMR/CME
Total SCT n-1  

𝑛 𝑛
  2
𝑆𝐶𝑅=∑ ( 𝑌^ 𝑖 − 𝑌´ ) =𝑎 ∑ 𝑌 𝑖+𝑏 ∑ 𝑋 𝑖 𝑌 𝑖 −𝑛 𝑌´ 2
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
  2
𝑆𝐶𝐸 =∑ ( 𝑌 𝑖 − 𝑌^ 𝑖 ) =∑ 𝑌 2𝑖 − 𝑎 ∑ 𝑌 𝑖 −𝑏 ∑ 𝑋 𝑖 𝑌 𝑖
𝑖=1 𝑖=1 𝑖=1
𝑛
  2
𝑆𝐶𝑇 =∑ ( 𝑌 𝑖 − 𝑌´ ) =∑ 𝑌 2𝑖 −𝑛 𝑌´ 2
𝑖=1

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy