Introduccion A La Geoestadistica
Introduccion A La Geoestadistica
Introduccion A La Geoestadistica
GEOESTADÍSTICA
Edmundo Alarcón
1ra. PARTE
Origen de la “Geoestadística”
0 1 2 3 4 5 6 7 8 9 10
Escala graduada de la variable en estudio
Valores resumen: Dispersión
Rango de la distribución: Es la diferencia entre el valor máximo y el
mínimo observados.
Varianza: Describe la variabilidad de la distribución. Es la medida de la
desviación o dispersión de la distribución.
Se divide por (n-1) y no por n y se representa por S2 cuando se calcula con
una muestra observada porque proporciona mejor estimación de la
varianza de la población. (estimación insesgada).
Esto significa que si un experimento fuera repetido muchas veces se
podría esperar que el promedio de los valores así obtenidos para S2 (valor
muestral) igualaría a 2
Valores resumen
frequency
8
•Histogramas: 4
2
0
0 2 4 6 8
Copa 1
proportion
1,0% = 1,2 0,6
5,0% = 1,4
10,0% = 1,6 0,4
percentage
observados a la recta indica 80
50
Normal. 0 2 4 6 8
Copa 1
PLOTEOS TIPO Q-Q
• PLOTEOS CUANTIL-CUANTIL
Box-and-Whisker Plot
Comparación gráfica de
la variable silt
(sedimento) en los
distintos puntos de
muestreo (1 a 4):
PROMEDIO DE PDF
Mean(=4.1)
MODA DEL PDF
Max
Media en la CDF
VARIANZA
• EJEMPLO: • SI QUITAMOS EL VALOR MAS ALTO:
1, 1, 1, 2, 3, 3, 5, 7, 7 ,11 1, 1, 1, 2, 3, 3, 5, 7, 7
M=4.1 M= 3.33
S2= 1/9 {(1-4.1)2+ (1-4.1)2+ (1-4.1)2+ (2-4.1)2+ S2=1/8 {(1-3.33)2+ (1-3.33)2+ (1-3.33)2+ (2-
(3-4.1)2+ (3-4.1)2+ (5-4.1)2+ (7-4.1)2+ (7-4.1)2+ 3.33)2+ (3-3.33)2+ (3-3.33)2+ (5-3.33)2+ (7-
(11-4.1)2 } 3.33)2+ (7-3.33)2
= 1/9 (9.61+ 9.61+ 9.61+ 4.41+ 1.21+ 1.21+ = 1/8 (5.43+ 5.43+ 5.43+1.769+ 0.109+
0.81+ 8.41+ 8.41+ 47.61) 0.109+ 2.789+ 13.469+ 13.469)
= 100.9/9 = 48/8
= 11.21 =6
DESVIACIÓN ESTÁNDAR
S2= 11.21 → S = 3.348 S2 = 6 → S = 2.445
COEFICIENTE DE VARIACIÓN
CV = 3.348/4.1 =0.817 CV = 2.445/3.33=0.743
SESGO
CURVA DE
DISTRIBUCIÓN
NORMAL, Y
ACUMULADA
DISTRIBUCIÓN NORMAL ESTÁNDAR
Distribución Lognormal
Sesgado positivo
42
Transformaciones
Para modelos de interpolación del tipo regresión, las
hipótesis requieren, entre otras condiciones:
• Normalidad de los datos
• Homogeneidad en la varianza
Si en el análisis exploratorio no se observa simetría
en el histograma y con un contraste de bondad de
ajuste (prueba chi-cuadrado o Kolmogorov-Smirnov)
se confirma la falta de normalidad, se tendrá que
recurrir a algún tipo de transformación
“normalizante” de los datos.
Transformaciones Box-Cox o de potencia
• =2, Y=X2
• =1/2, Y=X1/2
Se busca que la variable transformada se parezca a una
distribución normal
Ejemplo:
X ~ Exp(3)
X ~ Beta(5,
• 2.5)
• CORRELACIÓN
• DISTRIBUCIÓN DE FRECUENCIAS • COEFICIENTE DE CORRELACIÓN
• HISTOGRAMAS • REGRESIÓN LINEAL
• TABLAS DE FRECUENCIA ACUMULATIVA • MAPAS DE UBICACIÓN DE DATOS
• PLOTEOS DE PROBABILIDAD • MAPAS DE CONTORNOS (CONTOUR
• PLOTEOS DE DATOS DISPERSOS MAPS)
(SCATTER PLOTS) • MAPAS DE SÍMBOLOS (IMPRESORA)
• PLOTEOS DE TIPO Q-Q • ESTADÍSTICA DE VENTANAS MÓVILES
• EFECTO PROPORCIONAL
HISTOGRAMAS PLOTEO DEL HISTOGRAMA
• DESPLIEGUE VISUAL DE LA
DISTRIBUCIÓN DE LOS DATOS
• LA DISTRIBUCIÓN BIMODAL
RESALTA
57
HISTOGRAMAS CON
DATOS SESGADOS HISTOGRAMAS CON
DATOS SESGADOS
• PUEDA SER QUE LOS DATOS NO DEN
UN HISTOGRAMA INFORMATIVO
59
PLOTEOS DE PROBABILIDAD
• MUESTRA SI LA
DISTRIBUCIÓN ES
NORMAL O
LOGNORMAL
• SE PUEDE VER SI HAY
POBLACIONES
MÚLTIPLES
• LA PROPORCIÓN DE
LEYES ALTAS (OUTLIERS)
RESALTA
60
PLOTEO DE DATOS DISPERSOS
• Es simplemente
una grafica x-y de
los datos
• Muestra que tanto
dos variables están
relacionadas
• Descubre pares de
datos no usuales o
anormales
Regresión Lineal
• y = ax + b + Ɛ
donde: a = pendiente de la recta a = r (y/x)
b = constante b = my - amx
REGRESIÓN LINEAL
• DIFERENTES RANGOS DE DATOS PUEDEN SER DESCRITOS DE FORMA ADECUADA
POR DIFERENTES REGRESIONES
r = 0.99 r = -0.97
CORRELACION CERCANA A CERO MIDE LA DEPENDENCIA LINEAL
r = -0.03
r = -0.08
UBICACIÓN DE LOS DATOS
67
MAPAS DE CONTORNOS (CU)
68
MAPAS DE SÍMBOLOS
• GENERALMENTE NO ES A ESCALA
69
ESTADÍSTICA DE VENTANAS MOVIBLE
• SE DIVIDE EL ÁREA DE ESTUDIO EN ÁREAS MAS PEQUEÑAS DEL MISMO
TAMAÑO
• SE CALCULAN LA ESTADÍSTICAS PARA CADA UNA DE LAS ÁREAS PEQUEÑAS
• ESTE PROCEDIMIENTO ES ÚTIL PARA INVESTIGAR SI HAY ANOMALÍAS EN EL
PROMEDIO Y EN LA VARIANZA
70
EFECTO PROPORCIONAL
Cuando en el cálculo del semivariograma se detecta que existe
una relación linear entre el valor medio de las muestras usadas
en el cálculo de cada g(h) y la desviación estándar
correspondiente, en la estadística básica para las variables
PMA (Promedio, Mediana, Asimetria), las tres variables tienen
una distribución asimétrica positiva, por lo que es necesario
evaluar si en estos casos se presenta el conocido “efecto
proporcional”, que es una forma particular de
heterocedasticidad (la variabilidad de los datos cambia a lo
largo del área de estudio), en particular para distribuciones
asimétricas positivas, la varianza local se incrementa conforme
se aumenta su media local, este efecto proporcional puede
hacer el variograma experimental no interpretable.
EFECTO PROPORCIONAL PLOT DEL EFECTO
PROPORCIONAL
CASOS POSIBLES:
EL PROMEDIO Y LA VARIABILIDAD SON
CONSTANTES
• EL PROMEDIO ES CONSTANTE, LA VARIABILIDAD
FLUCTÚA
• EL PROMEDIO VARIA, LA VARIABILIDAD ES
CONSTANTE
• AMBOS INDICADORES VARÍAN
• SE APLICA PARA PREDECIR LA NUEVA ESCALA DE
LA VARIANZA RELATIVA
73
CONTINUIDAD ESPACIAL
Los métodos estadísticos clásicos no hacen uso de la información
espacial presente en los datos georreferenciados con los que
habitualmente trabajamos en geociencias. La geoestadística, a
diferencia de la estadística clásica, nos ofrece una forma de
describir la continuidad espacial de los datos, que es una
característica fundamental de innumerables procesos naturales,
proveyéndonos de métodos de adaptación de las técnicas clásicas
de regresión para incluir en ellas la información disponible de la
continuidad espacial. Esta información es incorporada en los
métodos de estimación mediante alguna de las siguientes funciones:
covarianza, variograma o correlograma.
CONTINUIDAD ESPACIAL
• UNA SERIE DE PLOTEOS DE DATOS DISPERSOS (H-SCATTER PLOTS) PARA VARIAS
DISTANCIAS DE SEPARACIÓN PUEDE MOSTRAR COMO LA CONTINUIDAD ESPACIAL SE
DETERIORA CON EL AUMENTO DE LA DISTANCIA.
• TAMBIÉN SE PUEDE RESUMIR LA CONTINUIDAD ESPACIAL CALCULANDO EL ÍNDICE DE LA
FUERZA DE LA RELACIÓN APARENTE EN CADA PLOTEO DE DATOS DISPERSOS (H-SCATTER
PLOT)
• SE PLOTEA EL VALOR DE LA MUESTRA EN CADA UBICACIÓN VERSUS EL VALOR DE OTRA
UBICACIÓN CERCANA
MOMENTO DE INERCIA
Es habitual interpretar la inercia como una medida de la
dispersión de los datos respecto a un determinado punto -
muy habitualmente su centro de gravedad. En este sentido,
cuando los datos se encuentran muy dispersos entre sí su
inercia -respecto al centro de gravedad- aumenta y cuando
se encuentran poco dispersos su inercia disminuye.
La inercia es, por lo tanto, un concepto semánticamente
cercano al de varianza. En ambos casos se trata de medidas
de dispersión pero ¿qué diferencia a la varianza de la
inercia? La inercia se puede entender como una
generalización del concepto de varianza.
MOMENTO DE INERCIA
• PARA PLOTEOS DE DATOS DISPERSOS QUE SON
SIMÉTRICO ALREDEDOR DE LA LÍNEA X=Y, EL
MOMENTO DE INERCIA ALREDEDOR DE ESTA
LÍNEA PUEDE SER UTILIZADO COMO UN ÍNDICE Y
DE LA FUERZA DE LA RELACIÓN.
• LA NUBE DE LOS INDIVIDUOS ESTÁ DEFINIDA EN
UN ESPACIO DE DIMENSIÓN N Y NO SE PUEDE
VISUALIZAR CUANDO N > 3. PARA OBTENER X-Y
UNA REPRESENTACIÓN SINTÉTICA DE LOS
DATOS, LA IDEA ES PROYECTAR ESTA NUBE EN (X-Y)/2
UN SUB-ESPACIO DE DIMENSIÓN K ≤ N (EN LA (X,Y)
PRÁCTICA, SE SUELE TOMAR K = 2), ELIGIENDO
EL SUB-ESPACIO MÁS “CERCANO” A LA NUBE, A
X
SABER, EL QUE MINIMIZA SU MOMENTO DE
INERCIA.
PLOTEO DE
MOMENTO DE
INERCIA
https://www.youtube.com/watch?v=p8d1iKkeHM4
https://www.youtube.com/watch?v=jN-5i7WTx7I
Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.
Alternative Proxies: