Geoestadistica
Geoestadistica
Geoestadistica
1. DISTRIBUCIONES BIDIMENSIONALES
Cuando queremos describir conjuntamente dos variables estadsticas, el primer
paso ser (al igual que en el caso de la estadstica univariada), representar los
datos en una tabla de frecuencias. Ahora, a cada caso le corresponde no un valor
sino dos (uno para cada una de las variables). As, en el caso de que intentemos
relacionar el peso y la altura de las personas, a cada persona le asociamos un par
de valores (peso, altura).
Los pares de valores as formados constituyen la distribucin bidimensional. La
tabla de frecuencias consiste en una tabla de doble entrada en la que se recogen
tanto las frecuencias de cada una de las variables por separado como los pares de
puntuaciones que cada caso obtiene en ambas variables (frecuencia conjunta).
j=1
n11
n21
n31
..
nI1
n1
j=2
n12
n22
n33
..
nI2
n2
..
..
..
..
..
..
J
n1J
n2J
n3J
..
nIJ
nJ
ni
n1
n2
n3
nI
N
Ejemplo
Gnero
Xi
Varn
Mujer
nj
Fumador
30
30
60
Tabaquismo Yj
No fumador
50
10
60
Exfumador
20
10
30
ni
100
50
150
Varn
Mujer
pj
Tabaquismo Yj
No fumador
0,33
0,07
0,40
Fumador
0,20
0,20
0,40
Exfumador
0,13
0,07
0,20
pi
0,66
0,34
1
Varn
Mujer
Fumador
0,30=30/100
0,60=0,30/50
Tabaquismo Yj
No fumador
0,50=50/100
0,20=10/50
Exfumador
0,20=20/100
0,20=10/50
pi
1
1
Varn
Mujer
pj
Tabaquismo Yj
Fumador
No fumador
0,50=30/60
0,83=50/60
0,50=30/60
0,17=10/60
1
1
Exfumador
0,67=20/30
0,33=10/30
1
De los fumadores un 50% son hombres y un 50% son mujeres; de los no fumadores
el 83% son varones, y el 17% son mujeres; de los exfumadores el 67% son varones
y el 33% son mujeres.
2. REPRESENTACIN GRFICA
La representacin grfica conjunta de dos variables cualitativas puede verse en las
siguientes grficas.
2
Nivel de
ansiedad
Bajo
Medio
Alto
Nota media
8
7
4
Nivel de
ansiedad
1-5
6-10
nj
1-3
1
7
8
Calificacin Final
4-6
7-9
4
2
0
0
4
2
ni
7
7
14
Propiedades:
Sxy es un valor que vara entre - y +
Si Sxy es positivo, entonces la correlacin es directa (a mayor valor de X, mayor
valor de Y) y, por tanto, la recta de regresin es ascendente.
Si Sxy es negativo, entonces la correlacin es inversa (a mayor valor de X, menor
valor de Y) y, por tanto, la recta de regresin es descendente.
Si Sxy es cero, entonces no hay correlacin entre X e Y.
Propiedades:
Es un coeficiente adimensional. Es decir, que es independiente de las
unidades en que estn expresadas las variables. Por ello sirve de valor de
comparacin aunque la variables vengan expresadas en unidades diferentes.
-1 rxy 1
Interpretacin:
Si rxy est prximo a 1 -1 la correlacin es fuerte (por encima de 0.8).
4
Interpretacin grfica:
Si rxy = 1 los puntos (x,y) forman una lnea ascendente.
Si rxy = -1 los puntos (x,y) forman una lnea descendente.
Si rxy > 0 los puntos (x,y) forman una nube ascendente ms cercana a una
recta cuanto ms cercano sea este valor a 1.
Si rxy < 0 los puntos (x,y) forman una nube descendente ms cercana a una
recta cuanto ms cercano sea este valor a -1.
Si rxy = 0 la nube de puntos sigue una distribucin totalmente aleatoria
(circular).
- 1 rs +1
Si rs = +1, hay correlacin directa mxima.
Si rs = -1, hay correlacin inversa mxima.
Si rs = +1, la correlacin es nula.
Donde :
es la puntuacin pronosticada en la variable Y para el caso i-simo.
6
Una vez obtenida la recta, debemos medir la exactitud de ese ajuste o fiabilidad de
sus predicciones:
Por esto se llama ajuste por mnimos cuadrados, porque se considera que se
aproxima lo ms posible cuando la suma de los cuadrados de las diferencias entre
cada valor yi de la variable y el valor y que predice la recta buscada sea lo menor
posible.