Clase Bidimensional 173 202120
Clase Bidimensional 173 202120
Clase Bidimensional 173 202120
La estadística descriptiva bivariada aborda el estudio de los sucesos en los que
intervienen dos variables simultáneamente.
1. DISTRIBUCIONES BIDIMENSIONALES
Ejemplo 1:
Tabaquismo Yj
Género Fumador No fumador Exfumador ni
Xi Varón 30 50 20 100
Mujer 30 10 10 50
nj 60 60 30 150
1
Las distribuciones de frecuencias conjuntas también pueden expresarse en términos
relativos
fij= nij/n
Tabaquismo Yj
Género Fumador No fumador Exfumador
Xi Varón 0,20 0,33 0,13 0,66
Mujer 0,20 0,07 0,07 0,34
0,40 0,40 0,20 1
Tabaquismo Yj
Género Fumador No fumador Exfumador pi
Xi Varón 0,30=30/100 0,50=50/100 0,20=20/100 1
Mujer 0,60=0,30/50 0,20=10/50 0,20=10/50 1
2
Ejemplo 2:
En el caso de la representación de dos variables cuantitativas las categorías de las
variables suelen ofrecerse agrupadas en intervalos.
Calificación Final
1-3 4-6 7-9 ni
Nivel de 1-5 1 4 2 7
ansiedad 6-10 7 0 0 7
nj 8 4 2 14
Medidas marginales
Calcular cual de las dos variables anteriores es más homogénea
Medidas condicionadas
Calcular el promedio registrado en el nivel de ansiedad para aquellos
alumnos que han obtenido calificación de hasta 6 puntos.
3
2. MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS
EJEMPLO:
50 38 70 40 35 60 40
4
2.2. Coeficiente de correlación de Pearson
La covarianza depende de los valores de las variables y por tanto de sus unidades.
Para tener una medida adimensional se utiliza el coeficiente de correlación de
Pearson
que nos indica qué tipo de relación existe entre dos variables (durecta o inversa),
así como calificar la magnitud de dicha correlación, siendo invariante frente a
transformaciones lineales (cambio de origen y escala) de las variables.
El Coeficiente de Correlación de Pearson mide la relación lineal entre dos variables
y se define como el cociente entre la covarianza y el producto de las desviaciones
típicas de ambas variables:
Propiedades:
Es un coeficiente adimensional. Es decir, que es independiente de las
unidades en que están expresadas las variables. Por ello sirve de valor de
comparación aunque la variables vengan expresadas en unidades diferentes.
-1 ≤ ≥1
5
EJEMPLO:
0.57 0.93 0.85 0.42 0.31 0.60 0.33
50 38 70 40 35 60 40
6
3.- REGRESIÓN LINEAL SIMPLE
Con este método se trata de seleccionar aquella recta que hace mínimo el resultado
de sumar el cuadrado de cada una de las distancias de los puntos de la nube a la
recta.
donde:
7
Calculando los valores de y podemos obtener el modelo
EJEMPLO:
50 38 70 40 35 60 40
8
3.2. Coeficiente de determinación
R2 = r2xy
Interpretación
0 ≤ R2 ≤ 1
Si R2 = 1 el ajuste es perfecto
Si R2 = 0 el ajuste es inadecuado.
La fiabilidad de la predicción será mayor cuanto mayor sea la correlación entre las
variables, R2 o rxy.
EJEMPLO:
50 38 70 40 35 60 40
9
EJERCICIOS DE ESTADÍSTICA BIDIMENSIONAL
1.- Los datos correspondientes al número de incendios forestales registrados en Chile (X) y
el número de hectáreas afectadas (Y) durante 15 años se recogen en la siguiente tabla:
X(miles)
[0,5) [5,10) [10,15) [15,20)
Y (miles)
[0,100) 0 0 2 0
[100,200) 1 4 1 1
[200,300) 0 2 1 0
[300,400) 0 0 0 1
[400,500) 0 0 1 1
10
2.- En seis modelos de zapatillas deportivas se ha estudiado el peso, en gramos, que tiene
(para el número 42) y su precio, en euros. La información obtenida se recoge en esta tabla:
11
3.- Se ha analizado en distintos modelos de impresoras cuál es el coste por página (en
céntimos de euro) en blanco y negro y cuál es el coste por página si esta es en color. La
siguiente tabla nos da los seis primeros pares de datos obtenidos:
12
4.- En una academia para aprender a conducir se han estudiado las semanas de asistencia a
clase de sus alumnos y las semanas que tardan en aprobar el examen teórico (desde que se
apuntaron a la autoescuela). Los datos correspondientes a seis alumnos son:
13