Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
1
Introducción a la Geoestadística
Karl VanderlindenGrupo de Ríos y EmbalsesUniversidad de Granada
2
Contenido
• ¿Qué es la geoestadística?
• ¿Por qué geoestadística?
• Ámbitos de aplicación
• Un poco de historia ...
• ¿Dónde encontrar más información?
• Pasos de un estudio geoestadístico
Introducción a la geoestadística
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
3
¿Qué es la geoestadística ?• Definición:”Estudio estadístico de fenómenos naturales que se
distribuyen de forma continua en el espacio y/o el tiempo”
• Tradicionalmente: “GEO” = geología (minería)
Ahora: “GEO” = geográfico (SIG)
Definiciones alternativas:⇒ “Estadística aplicada a datos geográficos”
⇒ “Estadística espacial”⇒ “Gestión, tratamiento e interpretación de datos espaciales”
⇒ “Descripción cuantitativa de variables naturales que se distribuyen en el espacio o en el espacio y el tiempo”
(Chilès y Delfiner, 1999)
Introducción a la geoestadística
4
¿Por qué geoestadística? (1)Ejemplo (Webster y Oliver, 2001).• Un agricultor quiere que se le determine el contenido en fósforo del
suelo de su finca.• No quiere el valor medio de cada parcela, sino información más
detallada, de modo que pueda fertilizar solamente donde el suelo resulta deficiente en fósforo.
⇒ toma de muestras de suelo, secar, tamizar, extraer fósforo y medirlo en los extractos.
⇒ costoso, consume mucho tiempo
Contenido en fósforo en todos los puntos de muestreo
El agricultor quiere información continua, en todos los puntos de su finca.
Introducción a la geoestadística
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
5
¿Por qué geoestadística? (2)• ¿Cómo obtener información en puntos no
muestreados?• ¿Cómo se relacionan los pequeños volúmenes de suelo
de las muestras con los bloques de de tierra que trata el agricultor con su maquinaria (p. ej. 24 m de ancho).
• ¿Cuántas muestras de suelo hay que tomar, y dónde, para que esta información sea fiable.
• Gasto para obtener esta información (muestreo de suelo + análisis)
• Argumentos agronómicos• Argumentos ambientales
Beneficio económico de la aplicación localizada de fósforo (Agricultura de Precisión)
Usar datos dispersos y asequibles para estimar, o predecir, el contenido medio en fósforo en bloques de suelo de 24 x 24 m.
Introducción a la geoestadística
6
¿Por qué geoestadística? (3)Un agricultor (tecnológicamente avanzado) puede
hoy día:• Posicionar su maquinaria en el campo con una
precisión de < 2 m• Puede medir y registrar la producción de los
cultivos continuamente durante la cosecha• Puede regular la cantidad de fertilizante
suministrada según la cantidad requerida • ¿Pero cómo puede obtener la información
sobre el estado nutricional del suelo a un precio razonable?
GEOESTADÍSTICA
Introducción a la geoestadística
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
7
¿Por qué geoestadística? (4)Igualmente aplicable a:
• Salinidad del suelo• Contaminación por metales pesados• Precipitación• Presión atmosférica• Partículas en el aire• ...
⇒ Todas estas variables ambientales son continuas, pero sólo podemos observarlas en algunos puntos concretos.
⇒ Geoestadística: Estimar, o predecir espacialmente, sin sesgo y con un error mínimo.
Introducción a la geoestadística
8
Ámbitos de aplicación• Minería• Industria Petrolífera• Geología• Meteorología, Climatología• Cartografía de suelos, Edafología• Hidrología y Geohidrología• Silvicultura• Ecología• Patología vegetal• Epidemiología• Entomología• Ciencias Ambientales• Remediación de suelos contaminados• Salud Pública• ...
Introducción a la geoestadística
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
9
Un poco de historia ... (1)• Mercer y Hall (1911): varianza entre parcelas (producción) disminuye
cuando el tamaño de las parcelas aumenta, hasta un cierto límite.• “Student”: parcelas más cercanas dan resultados más similares
(dependencia espacial, alcance de correlación, efecto pepita).• Fisher (1925): análisis de varianza, reducir los efectos de la variabilidad
espacial.• Youden y Mehlich (1937): escala de variación espacial, variación para
diferentes distancias de separación y diseño de muestreos adicionales.• Kolmogorov (años 30): correlación espacial (y función estructural para
describirla, el variograma), interpolación óptima (kriging).• Matérn (1960): covariograma espacial, silvicultura • Gandin (1965): climatología, evaluación de redes de observatorios.• Años 40-50: Ingenieros de minas de oro de Sudáfrica (H. Sichel y D.G.
Krige) desarrollan un procedimiento empírico basado en la estimación ponderada.
Introducción a la geoestadística
10
Un poco de historia ... (2)
• Años 60: G. Matheron: “La teoría de las variables regionalizadas” (Escuela de Minas de Paris, Fontainebleau, Francia)⇒ poca difusión, muy complicado, base de la geoestadística de hoy día
• Años 70: Aparición de textos en Inglés ( A. Journel, Stanford, y M. David, Montreal). Aplicado principalmente a la minería.
• Años 80: Aplicación a las ciencias del suelo por R. Webster y estudiantes (P. Burrough, A. McBratney, ...)
• 1989: “An Introduction to applied geostatistics” (Isaaks y Srivastava): Texto muy didáctico.
⇒ Amplia difusión y aplicación de la geoestadística
Introducción a la geoestadística
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
11
¿Dónde encontrar más información ?
Armstrong, M., 1998. Basic Linear Geostatistics. Springer Verlag, Berlin.Chilés, J.P. y P. Delfiner, 1999. Geostatistics. Modeling Spatial Uncertainty. John Wiley & Sons, Nueva York.David, M., 1977. Geostatistical Ore Reserve Estimation. ElsevierScientific Publishing Company, Amsterdam.*Davis, J.C., 1973. Statistics and Data Analysis in Geology. John Wiley & Sons, Nueva York.*Deutsch, C.V. y A.G. Journel, 1998. GSLIB: Geostatistical Software Library and User’s Guide (segunda edición). Oxford University Press, Nueva York.
LIBROS (1)
Introducción a la geoestadística
12
¿Dónde encontrar más información ?
*Goovaerts, P., 1997. Geostatistics for Natural Resources Evaluation. Oxford University Press, Nueva York.*Isaaks, E.H., Srivastava, R.M., 1989. An introduction to applied geostatistics. Oxford University Press, Nueva York.Journel, A.G. y C.J. Huijbregts, 1978. Mining Geostatistics. Academic Press, Londres.*Oliver, M.A. y R. Webster, 1990. Statistical Methods in Soil and Land Resource Survey. Oxford University Press, Oxford.Pannatier, Y., 1996. VARIOWIN: Software for Spatial Data Analysis in 2D. Springer Verlag, Nueva York.
LIBROS (2)
Introducción a la geoestadística
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
13
¿Dónde encontrar más información ?
*Webster R. y M.A. Oliver, 2001. Geostatistics for Environmental Scientists. John Wiley & Sons, Chichester.Christakos, G., P. Bogaert y M.Serre, 2002. Temporal GIS. Advanced Functions for Field-Based Applications. Springer. Heidelberg.
LIBROS (3)
REVISTAS
Mathematical Geology, Geoderma, European Journal of Soil Sciences, Computers and Geosciences, Water Resources Research, Soil Science Society of America Journal, ...
Introducción a la geoestadística
14
¿Dónde encontrar más información ?
Enlaces www• Ai-geostats: http://www.ai-geostats.org• Geostatistical Analysis Tutor: http://uncert.mines.edu/tutor/• Pierre Goovaerts: http://www-personal.engin.umich.edu/~goovaert/• Workgroup on Pedometrics:
http://www-personal.engin.umich.edu/~goovaert/pedometrics.html.• The Australian Centre for Precision Agriculture:
http://www.usyd.edu.au/su/agric/acpa/
Programas informáticos
Geo-EAS, GSLIB, GSTAT, VARIOWIN, VESPER, R+, SADA, WINGSLIB, GS+, S+, MATLAB, IDRISI, SURFER, ARCGIS GEOSTATISTICAL ANALIST, ...
Introducción a la geoestadística
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
15
Pasos de un estudio geoestadístico.
1. Análisis exploratorio de los datos
2. Análisis estructural o variografía
3. Interpolación o estimación espacial - krigeado
4. Validación del modelo geoestadístico
Introducción a la geoestadística
16
Análisis exploratorio
Introducción a la geoestadística – Análisis exploratorio
• Primer paso de cualquier análisis -(geo)estadístico o no- de datos.
• “Go beyond the data” o familiarizarse con el conjunto de datos.
• Representar los datos en figuras y diagramas en vez de analizar directamente listados en formato tabular
• Identificar observaciones “sospechosas”• Calcular los estadísticos descriptivos: resumir los datos• Datos geográficos: controlar la posición• Identificar las poblaciones• Caracterizar la función de distribución y proponer alguna
transformación de los datos si no es normal.
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
17
Introducción a la geoestadística – Análisis exploratorio
0 25 50 75 100km
0 300 600 900 1200 1500 1800 2100 2400 2700 3000 3300 Altitud (m)
estaciones de interiorestaciones costeras
Representación espacialLocalización de 160 observatorios meteorológicos de interior (a más de 10 km de la costa) y 31 costeros en Andalucía. El mapa de fondo es el MDE junto con los limites de las 8 provincia.
18
Estadística descriptivaRepresentar la variación ...
El histograma
Introducción a la geoestadística – Análisis exploratorio
ETo (mm/año)
1445.01375.01305.01235.01165.01095.01025.0955.0
Núm
ero
40
35
30
25
20
15
10
5
0
ETo interior (mm/año)
1445.01375.01305.01235.01165.01095.01025.0955.0
Núm
ero
40
35
30
25
20
15
10
5
0
ETo costa (mm/año)
1445.01375.01305.01235.01165.01095.01025.0955.0
Núm
ero
40
35
30
25
20
15
10
5
0
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
19
Estadística descriptivaRepresentar la variación ...¿Qué aprendemos
del histograma?• Estimación de la función de densidad• Tipo de distribución (Normal, log-normal, ...)• Distribución uni-modal, multi-modal• Aparición de valores extremos y outliers• Variabilidad del fenómeno
Histograma bi-modal
Histograma acumulativo
Introducción a la geoestadística – Análisis exploratorio
20
Estadística descriptivaRepresentar la variación ...
Diagramas de “cajas y bigotes” (“Box & Whisker plots”)
0
4
8
12
16
z
-4
-2
0
2
4
ln(z
) cuartil superior (CS)
cuartil inferior (CI)
mediana (M)
Intervalo intercuartilico (IIC)
< CI – 1.5 IIC
> CS + 1.5 IIC
Introducción a la geoestadística – Análisis exploratorio
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
21
Estadística descriptivaRepresentar la variación ...
Diagramas de “cajas y bigotes” (“Box & Whisker plots”)
Estaciones de interior ↔ Estaciones costeras
DCNVOCSPAGJLJNMYABMZFBEN
ETo
(mm
/mes
)
250
200
150
100
50
0DCNVOCSPAGJLJNMYABMZFBEN
ETo
(mm
/mes
)
250
200
150
100
50
0
Introducción a la geoestadística – Análisis exploratorio
22
Estadística descriptivaRepresentar la variación ...
Tratar datos con una distribución sesgada: transformación logarítmica
-4 -3 -2 -1 0 1 2 3 4ln (z)
0
0.04
0.08
0.12
0.16
0.2
Frec
uenc
ia
-1 0 1 2 3 4 5 6 7 8 9z
0
0.04
0.08
0.12
0.16
0.2
Frec
uenc
ia
Introducción a la geoestadística – Análisis exploratorio
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
23
Estadística descriptivaMedidas de centralización ...
• La media aritmética: ⇒ sensible para valores extremos
• La moda: ⇒ insensible para valores extremos
• La mediana: ⇒ sensible para valores
extremos ⇒ sensible para la ausencia
de datos en la parte central de la distribución
( )µ = E Z u
El valor que aparece con mayor frecuencia
El valor central cuando los datos se ordenan de menor a mayor. El 50 % de los valores son inferiores y el 50 % superiores
( )αα =
= ∑1
1 n
m zn
u
Introducción a la geoestadística – Análisis exploratorio
24
Estadística descriptiva Medidas de centralización ...
Distribución simétrica: media = moda = mediana
z
f(z)
0
0.25
0.5
0.75
1
F(z)
función de densidadfunción de distribución
MCI CS
Introducción a la geoestadística – Análisis exploratorio
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
25
Estadística descriptivaMedidas de centralización ...
Distribución asimétrica: (moda – mediana) ≈ 2 × (mediana – media)
z
f(z)
0
0.25
0.5
0.75
1
F(z)
función de densidadfunción de distribución
M CSCI
Mod
a
Med
ia
Introducción a la geoestadística – Análisis exploratorio
26
Estadística descriptivaMedidas de dispersión ...
• La varianza: ( )
( ) ( )( )( )( )
( )( ) ( )( )
2
2
2
2 22 2
1 1
1 1n n
var Z u
E Z u E Z u
E Z u
s z u m z u mn nα α
α α
σ
µ
= =
= = − = −
= − = −∑ ∑
⇒ cuantifica la dispersión entorno a la media ⇒ en unidades de medición al cuadrado ⇒ aditivo ⇒ muy sensible para valores extremos ⇒ raíz cuadrada: la desviación típica, s
Introducción a la geoestadística – Análisis exploratorio
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
27
Estadística descriptivaMedidas de dispersión ...
• La varianza: Hay que corregir la fórmula anterior porque no podemos muestrearla población entera, solamente disponemos de una muestra que consiste de un limitado numero de observaciones
( )( )22
1
11
n
s z u mn α
α =
= −− ∑
• Error estándar: ( ) 2s m s n=
• Varianza de estimación: ( )2 2s m s n= ( )2E m µ −
⇒ La desviación típica de medias de muestras de n observaciones
⇒ Cuanto más grande la muestra, más confianza podemos tener en m
Introducción a la geoestadística – Análisis exploratorio
28
Estadística descriptivaMedidas de dispersión ...
⇒ Expresa la dispersión en términos relativos⇒ P.ej.: cuando una propiedad ha sido medida en dos zonas
diferentes con valores similares de s, pero diferentes de m.⇒ Medida de la asimetría de distribuciones positivamente sesgadas⇒ Indicador preliminar de posibles problemas para la estimación
local:
• El coeficiente de variación: 100 sCV %m
=
<100 % → sin problemas100-200 % → dificultades con valores extremos>200 % → grandes dificultades con valores extremos
• El Intervalo intercuartilico (IIC):
⇒ En unidades de medición⇒ Insensible para valores extremos
Introducción a la geoestadística – Análisis exploratorio
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
29
Estadística descriptivaMedidas de dispersión ...
⇒ Mide la asimetría de la distribución⇒ CS = 0 → distribución simétrica⇒ CS > 0 → sesgo positivo (la función de densidad muestra una
cola larga por la derecha)⇒ CS < 0 → sesgo negativo (la función de densidad muestra una
cola larga por la izquierda)
• El coeficiente de sesgo (CS):
• Tercer momento entorno a la media:
• El CS se define como:
( )( )33
1
11
n
m z u mn α
α =
= −− ∑
3 3 333
2 2 2
m m mCSsm m m
= = =
Introducción a la geoestadística – Análisis exploratorio
30
Estadística descriptivaMedidas de dispersión ...
CS < 0 CS = 0 CS > 0
• El coeficiente de sesgo (CS):
⇒ 0 < CS ≤ 0.5 → no es necesario transformar los datos⇒ 0.5 < CS ≤ 1 →⇒ CS > 1 → ln o log
⇒ Transformar los datos (Webster, 2001)
Introducción a la geoestadística – Análisis exploratorio
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
31
Estadística descriptivaMedidas de dispersión ...
⇒ Mide la forma del pico de la distribución de densidad⇒ CS = 0 → distribución normal⇒ CS > 0 → distribución más puntiaguda que la normal⇒ CS < 0 → distribución menos puntiaguda que la normal
• El coeficiente de curtosis (CC):
• Cuarto momento entorno a la media:
• El CC se define como:
( )( )44
1
11
n
m z u mn α
α =
= −− ∑
( )3 3
2 2 422
3 3 3m mmCCm ss
= − = − = −
Introducción a la geoestadística – Análisis exploratorio
32
Descripción bi-variada ⇒ cuando se dispone de observaciones de dos variables en
los mismos puntos, u
• Gráficos de dispersión
• Para distribuciones muy sesgadas se puede necesitar dos gráficospara representar con más detalle los puntos cerca del origen.
• Otra solución: usar una escala logarítmica
Introducción a la geoestadística – Análisis exploratorio
0 200 400 600 800 1000 1200 1400Elevation (m)
900
1000
1100
1200
1300
1400
1500
ETo
(mm
yea
r-1)
All stationsY = 1342.3 + 0.00697 X - 0.000234 X2
R2 = 0.628
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
33
Descripción bi-variada• Coeficiente de correlación:
2
2 2, y 1 1ij
ij ij
i j
s
s sρ ρ= − ≤ ≤
Introducción a la geoestadística – Análisis exploratorio
34
Descripción bi-variada• Coeficiente de correlación: deficiencias
• Mide la dependencia lineal
• Sensible para valores extremos
⇒ Requiere un control visual del gráfico de dispersión
Introducción a la geoestadística – Análisis exploratorio
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
35
Descripción bi-variada• Coeficiente de correlación de Spearman
(“Rank correlation coefficient”)
1. Ordenar todas las observaciones de menor a mayor
2. Calcular la correlación entre valores de orden de cada variable
Introducción a la geoestadística – Análisis exploratorio
36
Descripción bi-variada• Coeficiente de correlación de Spearman
(“Rank correlation coefficient”)
ρrank > ρ• Relación monótona pero no lineal• Algunos valores extremos
“estropean” una buena correlación
ρrank < ρ• Algunos valores extremos mejoran
artificialmente una mala correlación “estropean” una buena correlación
Introducción a la geoestadística – Análisis exploratorio
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
37
Análisis estructural o variografía
• Cuantificación de la correlación espacial y su estructura
• Cálculo del semivariograma muestral o experimental• Analizarlo e interpretarlo• Ajustar un modelo teórico
Introducción a la geoestadística – Variografía
38
La teoría de las variables regionalizadas (1)
• Las variables espaciales no suelen ser totalmente aleatorias, pero muestran una forma de estructura en su variabilidad espacial:
⇒ Los puntos cercanos en el espacio/tiempo suelen adoptar valores similares
Variable Regionalizada, VR (G. Matheron)
⇒ Geoestadística: “Aplicación de métodos probabilísticos a variables regionalizadas.”
= Variable Aleatoria (VA) que se distribuye espacialmente
Introducción a la geoestadística – Variografía
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
39
La teoría de las variables regionalizadas (2)
La teoría de las variables regionalizadas supone que se puede expresar la variación de cualquier variable como la suma de trescomponentes básicos:
• Componente estructural, µ (u): media constante o deriva, funcióndeterminística
• Componente aleatorio, espacialmente correlacionado, δ (u): estocástico, localmente variable y espacialmente dependiente, residuos de µ (u): la variable regionalizada
• “Ruido blanco”, espacialmente independiente, ε (u): error aleatorio residual con N(0,1)
( ) ( ) ( ) ( )Z µ δ ε= + +u u u u
Introducción a la geoestadística – Variografía
40
La teoría de las variables regionalizadas (3)
(i) (ii) (iii)( ) ( ) ( ) ( )Z m δ ε= + +u u u u
Introducción a la geoestadística – Variografía
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
41
La teoría de las variables regionalizadas (4)
El concepto de la Función Aleatoria (FA):
Introducción a la geoestadística – Variografía
42
La teoría de las variables regionalizadas (5)
Hipótesis de Estacionariedad:
• Suponer estacionariedad para poder tratar los datos en diferentes puntos como si fueran diferentes realizaciones de la propiedad.
• Estacionariedad significa que la función de distribución del proceso aleatorio tiene característicos que son iguales en todos los puntos (primer y segundo momento).
Introducción a la geoestadística – Variografía
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
43
La función de autocorrelación
( ) ( ) ( ) ( ) 2C C , con Cρ σ= =h h 0 0
⇒ la covarianza para el paso h =0, C(0), es igual a la varianza, σ2
⇒ sin dimensiones ⇒ bajo condiciones de estacionariedad de
segundo orden:
( ) ( ) ( ) ( ) ( ){ }C C C 1-γ ρ= − =h 0 h 0 h
( ) ( ) ( ){ }2 2C 1-γ σ σ ρ= − =h h h 0 h0
covarianza, C(h)
semivarianza, γ(h)
varianza, C(0) = σ2
( ) ( ) ( ){ } ( ){ }µ µ = = − − ,i j i jC C E Z Zu u h u u = −i jh u u
( ) ( ) ( ) ( ){ } ( )22var Z Z E Z Z γ − + = − + =
u u h u u h h
Introducción a la geoestadística – Variografía
44
⇒ C(h) y γ (h) son continuas en h =0
⇒ C(h): C(0) = σ2 → C(∞) = 0⇒ γ(h): γ(0) = 0 → γ(∞) = σ2
⇒ En la práctica: efecto pepita = error de medición + variación a distancias inferiores al intervalo de muestreo (“nugget variance” o “nugget effect”)
• Autocorrelación: -1 ≤ ρ(h) ≤ 1 y ρ(0) = 1
• Simetría en el espacio: C(h) = C(-h), ρ(h) = ρ(-h) y γ (h) = γ(-h) ⇒ representar solamente la parte derecha de las funciones ( h≥0)
• Continuidad espacial:
en teoría
efecto pepita
0 h0
γ(h)
en la práctica
Introducción a la geoestadística – Variografía
Características de las funciones de correlación espacial (1)
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
45
Características de las funciones de correlación espacial (2)
• Monótonamente creciente: la disimilitud aumenta cuando h aumenta
• Meseta y alcance (“sill” y “range”): bajo condiciones de estacionariedad de segundo orden el variograma alcanza un límite superior, la meseta, para un cierto h, el alcance.
alcance
efecto pepita
0 h0
γ(h)
mesetaσ2
dependenciaespacial
independenciaespacial
Introducción a la geoestadística – Variografía
46
Introducción a la geoestadística – Variografía
Características de las funciones de correlación espacial (3)
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
47
¿Cómo calcular el variograma? (1)
• (semi)variograma experimental = (semi)variograma muestral
• se calcula mediante un algoritmo que depende de la configuración espacial de los datos (1D, regular e irregular o 2D, regular e irregular).
( ) ( ) ( ) ( ){ }( )
2
1
1ˆ2
N
z zN α α
α
γ=
= − +∑h
h u u hh
• N(h): número de pares de observaciones separadas por el vector h
• h: vector de separación, determina la distancia entre dos observaciones en una cierta dirección
Introducción a la geoestadística – Variografía
48
h = 1: (10-7)2+(11-10)2+(13 - 11)2
+(12-13)2+(14-12)2+(12-14)2
+(13-12)2+(10-13)2+(11-10)2
+(9-11)2+(8-9)2 = 39
N(1) = 11
Muestreo regular en una dimensión:
1 2 3 4 5 6 7 8 9 10 11 12u
02468
101214
Z
7
10 1113 12
1412 13
10 119 8
( ) ( ) ( ) ( ){ }( )
2
1
1ˆ2
N
z zN α α
α
γ=
= − +∑h
h u u hh
( )ˆ 39 22 1.78γ = =1
h = 2: (11-7)2+(13 - 10)2 +(12-11)2
+(14-13)2+(12-12)2 +(13-14)2
+(10-12)2+(11-13)2 +(9-10)2
+(8-11)2 = 46
N(2) = 10
( )ˆ 46 20 2.30γ = =2
Introducción a la geoestadística – Variografía
¿Cómo calcular el variograma? (2)
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
49
Muestreo regular en una dimensión:
12
34
56
1110
98
76
3946
8889
10873
1.782.30
4.895.56
7.716.08
( ) ( ){ }( )
2
1
N
z zα αα=
− +∑h
u u h ( )γ̂ hh N(h)
0 1 2 3 4 5 6h
0
2
4
6
8
γ(h
)
Introducción a la geoestadística – Variografía
¿Cómo calcular el variograma? (3)
50
¿Cómo calcular el variograma? (4)Muestreo irregular en una dimensión:
u
⇒ agrupar en clases todas las distancias de separación⇒ clase hi = [hi - tol, hi + tol]⇒ como hi se emplea la h media de [hi - tol, hi + tol]⇒ elegir h con cuidado: demasiado grande (variograma demasiado
suavizado) ⇔ demasiado pequeño (variograma errático porque no hay bastante pares de puntos en cada clase de h)
⇒ punto de partida: h = distancia media hasta el punto más cercano y tol = h/2
Introducción a la geoestadística – Variografía
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
51
¿Cómo calcular el variograma? (5)Muestreo irregular en dos dimensiones:
⇒ agrupar en clases de h según la direccióny la distancia
x
yy
Introducción a la geoestadística – Variografía
52
¿Cómo calcular el variograma? (6)Mapas de semivarianza:
Semivarianza normalizada 0 0.5 1 1.5 2 2.5
-150 -100 -50 0 50 100 150
Distancia dirección E-O (km)
-100
-50
0
50
100
Dis
tanc
ia d
irecc
ión
N-S
(km
)
AÑO semivarianzade la variabletransformada
0 100 200 300Distancia dirección X (m)
-200
-100
0
100
200
Dis
tanc
ia d
irecc
ión
Y (m
)
0
0.5
1
1.5
2
2.5
3ETo en AndalucíapH parcela Guadiamar
Introducción a la geoestadística – Variografía
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
53
¿Cómo calcular el variograma? (7)Variabilidad anisotrópica:
1. Isotropía: La variación espacial de la variable bajo estudio es igual en todas la direcciones
2. Anisotropía: la semivarianza no depende solamente de h, pero también de la dirección
Anisotropía geométrica Anisotropía zonal⇒ en la práctica una combinación de ambos
0 h0
γ(h)
σ2
dir N-Sdir E-O
0 h0
γ(h)
σ2
dir N-Sdir E-O
Introducción a la geoestadística – Variografía
54
¿Cómo calcular el variograma? (8)Algunas reglas generales:
⇒N >100 en el caso de isotropía y N > 250 en el caso de anisotropía⇒ “Cuanto más puntos mejor” (el número de observaciones es en muchas
ocasiones restrictivo para la aplicación de geoestadística)⇒El número total de pares de observaciones = N(N-1)/2⇒El número de pares en el que se basa el cálculo de cada punto del
variograma debería ser por lo menos 30 – 50.⇒El paso h máximo del variograma experimental deberia ser inferior a la
mitad de la dimensión máxima de la zona de estudio: hmax ≤ L/2⇒efecto pepita = variabilidad inexplicada. Se debería de incorporar en
cada diseño de muestreo algunas observaciones a pequeñas distancias de otros para obtener información sobre el comportamiento del variograma en la cercanía el origen. Esto permitirá una descripción completa de la variabilidad espacial e incrementará la precisión de la interpolación espacial.
Introducción a la geoestadística – Variografía
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
55
Modelar el variograma (1)
⇒Ajustar un variograma teórico al variograma experimental que se ha calculado a partir de los datos
⇒Variograma teórico = función que representa el variograma real del fenómeno.
0 25 50 75 100 125 150 175 200 225 250Distancia (km)
0
2000
4000
6000
8000
10000
12000
Sem
ivar
iogr
ama
(mm
2)
ETo anual en Andalucía
Introducción a la geoestadística – Variografía
56
Modelar el variograma (4)Modelos (o funciones) autorizados
1. Efecto pepita puro:
0 h0
γ(h)
co= σ2
( ) 2ocγ σ= =h
retícula de 256 ×256 celdas
Introducción a la geoestadística – Variografía
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
57
Modelar el variograma (5)Modelos (o funciones) autorizados
2. Modelo lineal con meseta :( ) c
ac
para 0< a
para >aγ
≤ =
h hh
h
a0 h
0
γ(h)
c
Solamente CNSD en 1D !!!
Introducción a la geoestadística – Variografía
58
Modelar el variograma (6)Modelos (o funciones) autorizados
3. Modelo esférico :( )
33 12 2
ca a
c
para 0< aEsf
para >a
γ
− ≤ = =
h h hhha
h
⇒ De los más comunes en la edafología
⇒ CNSD en 1, 2 y 3-D
a0 h
0
γ(h
)
c
Introducción a la geoestadística – Variografía
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
59
Modelar el variograma (7)Modelos (o funciones) autorizados
3. Modelo esférico :
( )33 1
2 2c
a a
c
para 0< a
para >a
γ
− ≤ =
h h hh
h
c = 1.0a = 15
c = 1.0a = 25
c = 1.0a = 50
Introducción a la geoestadística – Variografía
60
Modelar el variograma (8)Modelos (o funciones) autorizados
4. Modelo exponencial : ( ) 1 0cr r
Exp exp para γ = = − − <
h hh h
a ≈ 3r0 h
0
γ(h)
c
r
γ(h) = 0.95 c ⇒ r = parámetro de distancia⇒ se aproxima asintóticamente a
la meseta
⇒ a (≈ 3r) es el alcance efectivo
⇒ a = h a la cual γ(h) = 0.95 c⇒ variograma de modelos
autoregresivos (Markov)
Introducción a la geoestadística – Variografía
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
61
Modelar el variograma (9)Modelos (o funciones) autorizados 4. Modelo exponencial :
co= 0c = 1.0r = 5
co= 0c = 1.0r = 16
co= 1/3c = 2/3r = 5
co= 1/3c = 2/3r = 16
Introducción a la geoestadística – Variografía
62
Modelar el variograma (10)Modelos (o funciones) autorizados
5. Modelo gaussiano : ( )2
21 0cr r
Gaus exp para γ = = − − <
h hh h
⇒ r = parámetro de distancia⇒ se aproxima asintóticamente a la
meseta⇒ a (≈ 1.73 r) es el alcance efectivo
⇒ a = h a la cual γ(h) = 0.95 c
⇒ fenómenos muy continuos⇒ se aproxima al origen con gradiente
= 0 → inestabilidad numérica cuando se resuelve el sistema de ecuaciones del krigeado
a ≈ 1.73 r0 h
0
γ(h)
c
r
γ(h) = 0.95 c
Introducción a la geoestadística – Variografía
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
63
Modelar el variograma (16)Combinaciones de modelos
( ) ( ) ( ) ( )1 2 3γ γ γ γ= + +h h h h …
Cuando el semivariograma tiene diferentes escalas de variación → intentar buscar una explicación física
0 25 50 75 100 125 150 175 200 225 250Distancia (km)
0
2000
4000
6000
8000
10000
12000
Sem
ivar
iogr
am
a (
mm
2)
ETo anual en Andalucía
Una combinación lineal de modelos CNSD es también un modelo CNSD
Introducción a la geoestadística – Variografía
64
Modelar el variograma (17)Combinaciones
de modelos
a20 h0
γ(h)
co+c1+c2
co
c2
c1
a1
( )
3 3
1 21 1 2 2
3
1 22 2
1 2
3 1 3 12 2 2 2
3 12 2
o
o
o
c c ca a a a
c c ca a
c c c
1
1 2
2
para 0< a
para a < a
para >a
γ
+ − + − ≤
= + + − ≤
+ +
h h h h h
h hh h
h
Modelo esférico doble
Introducción a la geoestadística – Variografía
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
65
Modelar el variograma (19)¿Cómo ajustar un modelo al variograma experimental?
⇒ Uno de los temas más controvertidos de la geoestadística ¿Por qué?
1. La mayoría de los modelos son no-lineales en uno o más parámetros.
2. La fiabilidad de los valores de semivarianza no es igual para todos los h
3. La dispersión en el variograma experimental puede hacer el ajuste automatizado numéricamente inestable
⇒ “ajuste a ojo” ⇔ ajuste por mínimos cuadrados
⇒ programa VARIOWIN : combinación de ambos⇒ Ponderar los valores experimentales del variograma según el
número de pares de observaciones que se han empleado para su cálculo
Introducción a la geoestadística – Variografía
66
Interpolación o estimación espacial - Krigeado
• Estimación en puntos donde no se dispone de observaciones (nodos de una retícula regular)
• Tener en cuenta la correlación espacial (el semivariograma)• Estimación puntual o en bloques (2, 3 D)• Krigeado simple, krigeado ordinario, krigeado universal, ...• Incorporar toda la información disponible: variables
secundarias, imágenes de satélite, MDE´s: ⇒ geoestadística multivariada
• Co-krigeado, Krigeado simple con media local variable, Krigeado con una deriva externa, ...
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
67
Introducción (1) Once a map is drawn people tend to accept it as reality
Bert Friesen
Mapa de suelos de Andalucía (1:400000)64 unidades cartográficas
,
Introducción a la geoestadística – Krigeado
68
Introducción (2)
0 2 4 6 8 10
0
2
4
6
8
10
1
2
3
4
5
3
4
2
4
6
?
¿Cómo calcular el valor en el punto rojo?
⇒ Interpolación espacial
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
69
Introducción (3)
0 2 4 6 8 10
0
2
4
6
8
10
1
2
3
4
5
3
4
2
4
6
?
λ1
λ3
λ5
λ4
λ2
( ) ( )n
o i ii
z z1
λ∗
=
= ∑u u
Estimación o Interpolación espacial
Media ponderada de los datos
⇒ λi = ?
Introducción a la geoestadística – Krigeado
70
Otros métodos de interpolación (1) 1. Polígonos de Thiessen (Voronoi, Dirichlet)
⇒cada predicción se basa en solamente una observación⇒mapa resultante es una superficie que varia de forma discontinua
i ii
V1 si 0 de otra forma
λ∈
=
u
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
71
1. Polígonos de Thiessen (Voronoi, Dirichlet)
0 1 2 3 4 5 6 7 8 9 10
X
0
1
2
3
4
5
6
7
8
9
10
Y
2
2.5
3
3.5
4
4.5
5
5.5
6
Otros métodos de interpolación (2) Introducción a la geoestadística – Krigeado
72
2. Triangulación
⇒ cada predicción se basa en solamente tres observacionen
( )( ) ( ) ( )( )( ) ( )( )x x x x x x x xx x x x x x x x
01 31 22 32 02 32 21 311
11 31 22 32 12 32 12 31
λ− − − − −
=− − − − −
{ }x x11 12,
{ }x x01 02,
{ }x x31 32,{ }x x21 22,
1λ
Otros métodos de interpolación (3) Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
73
2. Triangulación
0 1 2 3 4 5 6 7 8 9 10
X
0
1
2
3
4
5
6
7
8
9
10
Y
2
2.5
3
3.5
4
4.5
5
5.5
6
Otros métodos de interpolación (4) Introducción a la geoestadística – Krigeado
74
3. Inverso de la distancia
ii i in
ii
d dd
0
1
con 0 y α
αλ α
−
−
=
= > = −
∑u u
• muy popular, sobre todo para α=2• si z(uo) coincide con z(ui) ⇒ z(uo) =z(ui): interpolación exacta• λi disminuye rápidamente cuando di aumenta: localmente sensible• la elección de α es arbitraria• no tiene en cuenta la configuración de los datos• muy rápido• ocurrencia de “manchas” alrededor de los puntos de observación
(“Bull´s-eyes”)
Otros métodos de interpolación (5) Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
75
3. Inverso de la distancia
0 1 2 3 4 5 6 7 8 9 10
X
0
1
2
3
4
5
6
7
8
9
10
Y
2
2.5
3
3.5
4
4.5
5
5.5
6
0 1 2 3 4 5 6 7 8 9 10
X
0
1
2
3
4
5
6
7
8
9
10
Y
2
2.5
3
3.5
4
4.5
5
5.5
α = 2 α = 0.5
Otros métodos de interpolación (6) Introducción a la geoestadística – Krigeado
76
plano:
superficie cuadrática:
⇒ ajuste por mínimos cuadrados
4. Regresión polinómica
Otros métodos de interpolación (7)
• regresión múltiple donde las variables independientes son las coordenadas espaciales. Por ej.:
( ) ( ) ε= +, ,z x y f x y
z(x,y) : el valor estimado en el punto {x,y}f : una función de las coordenadas espacialesε : término de error, independiente e idénticamente distribuido (iid)
con media = 0
= + +1 2oz b b x b y
= + + + + +2 21 2 3 4 5oz b b x b y b x b y b xy
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
77
4. Regresión polinómica
Otros métodos de interpolación (8)
0 1 2 3 4 5 6 7 8 9 10
X
0
1
2
3
4
5
6
7
8
9
10
Y
2
2.5
3
3.5
4
4.5
5
5.5
6
0 1 2 3 4 5 6 7 8 9 10
X
0
1
2
3
4
5
6
7
8
9
10
Y
1234567891011
= + +1 2oz b b x b y = + + +1 2 3oz b b x b y b xy
Introducción a la geoestadística – Krigeado
78
TeoríaKrigeado Ordinario (KO) (1)
( )( )
( )n
iKO o KO i
iZ Z
1λ∗
=
= ∑u
u u
¿Cómo calcular la media ponderada para estimar el valor en el punto uo usando la información disponible en los puntos ui?
0 2 4 6 8 10
0
2
4
6
8
10
1
2
3
4
5
3
4
2
4
6
?
λ1
λ3
λ5
λ4
λ2
•Estimación basada en el conocimiento de las covarianzas (semivariograma) entre los VA en los puntos de observación.
•Regresión múltiple puesto en un contexto espacial: krigeado (según D.G. Krige)
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
79
TeoríaKrigeado Ordinario (KO) (2)
( )( )
( )λ∗
=
= ∑1
nKO
KO i ii
Z Zu
u u
Hay que calcular los factores de ponderación de tal modo que se satisfagan dos condiciones:
1. Estimación insesgada:
2. Estimación con varianza del error de estimación mínima:
( ) ( )KOZ ZE 0∗ − = u u
( ) ( )var minimaKOZ Z∗ − = u u
⇒ Interpolación óptima
Introducción a la geoestadística – Krigeado
80
TeoríaKrigeado Ordinario (KO) (3)
Se supone que la VR, Z(u) es estacionaria, con media µ constante dentro de un área limitado, centrado en u.
1. Estimación insesgada:
( ) ( ) ( )µ = = E EZ Z iu u uLa media del error de estimación es igual a: ( ) ( )
( )
( ) ( )
( )
( ) ( )
( )( )
λ
λ µ µ
µ λ
∗
=
=
=
− = −
= −
= −
∑
∑
∑
1
1
1
E E
1
nKO
KO i ii
nKOi
i
nKOi
i
Z Z Z Zu
u
u
u u u u
u u
u( )
λ=
⇒ =∑1
1n
KOi
i
uLa estimación insesgadarequiere que la suma de los factores de ponderación sea igual a 1
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
81
TeoríaKrigeado Ordinario (KO) (4)
2. La varianza del error de estimación es mínima:
varianza de estimación expresada mediante la covarianza:
( ) ( ) ( ) ( )( )( )( ) ( )( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( )( )( )
KO KO
KO KO
KO KO
n nn
i j i j i ii j i
Z Z Z Z
Z Z Z Z
Z Z Z Z
22E
2 2
( )
1 1 1
var E
E 2
var var 2var
C C 2 C
σ
λ λ λ
∗ ∗
∗ ∗
∗ ∗
= = =
= − = − = + −
= + −
= − + − − −∑∑ ∑u uu
u u u u
u u u u
u u u u
u u u u u u
varianza de estimación expresada mediante la semivarianza:
( )( )
( ) ( )( )
σ λ γ λ λ γ γ= = =
= − − − − −∑ ∑ ∑( )
2E
1 1 12
n n nKO KO KOi i i j i j
i i j
u u u
u u u u u u
Introducción a la geoestadística – Krigeado
82
TeoríaKrigeado Ordinario (KO) (5)
2. La varianza del error de estimación es mínima:
Minimizar la varianza de estimación teniendo en cuenta la condición de estimación insesgada: derivada =0
( )( )
λ φ σ φ λ=
= − − ∑2
E1
, 2 1n
KO KOi i
if
u
( )
( )
( )
1
,0
,0
,0
KOi
KOi
n
KOi
f
f
f
λ φ
λ
λ φ
λ
λ φ
φ
∂ =
∂⇒ ∂
= ∂∂ = ∂
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
83
TeoríaKrigeado Ordinario (KO) (6)
2. La varianza del error de estimación es mínima:
Sistema de ecuaciones de krigeado ordinario en términos de la semivarianza
( ) ( ) ( )( )
( ) ( ) ( )( )
( )
λ γ φ γ
λ γ φ γ
λ
=
=
=
− + = −
⇒
− + = −
=
∑
∑
∑
1 11
1
11
nKOj j
j
nKOj n j n
j
nKOj
j
u
u
u
u u u u u
u u u u u
Cuando se resuelve este sistema de ecuaciones se obtienen los n factores de ponderación, λ i.
Introducción a la geoestadística – Krigeado
84
TeoríaKrigeado Ordinario (KO) (7)
2. La varianza del error de estimación es mínima:
El valor mínimo de la varianza = varianza de krigeado
( ) ( ) ( )( )
σ λ γ φ=
= − +∑2
1
nKO
KO i ii
u
u u u u
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
85
TeoríaKrigeado Ordinario (KO) (8)
Formulación matricial:
( ) ( )
( ) ( )
( )
( )( )
( )
( )
11 1 1 1
1
1
11 1 0 1
KOn
KOnn n n n
φ
λγ γ γ
λγ γ γφ
− − − = − − −
A bλ
uu u u u u u
uu u u u u uu
⇒ La solución es ... 1
φ−
= ⋅
λA b
Introducción a la geoestadística – Krigeado
86
TeoríaKrigeado Ordinario (KO) (9)
Resumen:
1
φ−
= ⋅
λA b
( )( )
( )λ∗
=
= ∑1
nKO
KO o i ii
Z Zu
u u
( ) ( ) ( )( )n
KOKO o j i o o
i
2
1σ λ γ φ
=
= − +∑u
u u u u
0 2 4 6 8 10
0
2
4
6
8
10
1
2
3
4
5
3
4
2
4
6
?
λ1
λ3
λ5
λ4
λ2
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
87
EjemploKrigeado Ordinario (KO) (10)
0 2 4 6 8 10
0
2
4
6
8
10
1
2
3
4
5
3
4
2
4
6
?
λ1
λ3
λ5
λ4
λ2
0 2 4 6 8 10 12 14 16 18h0
2
4
6
8
10
12
γ(h)
( ) 2.5 7.5 Esf10
γ = + hh
i x y z12345
2 2 33 7 49 9 26 5 45 3 6
matriz de los datos:
⇒ Resolver: 1
φ−
⋅ =
λA b
Introducción a la geoestadística – Krigeado
88
EjemploKrigeado Ordinario (KO) (11)
0 2 4 6 8 10
0
2
4
6
8
10
1
2
3
4
5
3
4
2
4
6
?
λ1
λ3
λ5
λ4
λ2
i 1 2 3 4 512345
0.0 5.099 9.899 5.000 3.1625.099 0.0 6.325 3.606 4.4729.899 6.325 0.0 5.0 7.2115.0 3.606 5.0 0.0 2.2363.162 4.472 7.211 2.236 0.0
matriz de distancias a partir de la cual se calcula A
i o12345
4.2432.8285.6571.02.0
vector de distancias a partir del cual se calcula b
⇒ Sustituir estas distancias en el semivariograma para obtener A y b
Introducción a la geoestadística – Krigeado
( ) 2.5 7.5 Esf10
γ = + hh
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
89
EjemploKrigeado Ordinario (KO) (12)
i 1 2 3 4 5 6123456
2.5 7.739 9.999 7.656 5.939 1.07.739 2.5 8.667 6.381 7.196 1.09.999 8.667 2.5 7.656 9.206 1.07.656 6.381 7.656 2.5 4.936 1.05.939 7.196 9.206 4.936 2.5 1.01.0 1.0 1.0 1.0 1.0 0.0
=A
i o123456
7.1515.5978.8153.6214.7201.0
=b
0 2 4 6 8 10 12 14 16 18h0
2
4
6
8
10
12
γ(h)
1
φ−
⋅ =
λA b
⇒ Invertir A
Introducción a la geoestadística – Krigeado
90
EjemploKrigeado Ordinario (KO) (13)
i 1 2 3 4 5 6123456
-1
.172 .050 .022 .026 .126 .273
.050 .167 .032 .077 .007 .207
.022 .032 .111 .066 .010 .357
.026 .077 .066 .307 .190 .030
.126 .007 .010 .190 .313 .134
.273 .207 .357 .003 .134 6.873
− −−
= − −− −
− −−
A
( ){ }TAdj1 1− =A A
A
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
91
EjemploKrigeado Ordinario (KO) (14)
i o123456
1
.0175
.2281
.0891
.6437
.1998
.1182
φ−
⋅ = = −
λA b
distancias4.2432.8285.6571.0002.000
1⇒ =∑
φ⇒
0 2 4 6 8 10
0
2
4
6
8
10
1
2
3
4
5
3
4
2
4
6
?
λ1
λ 3
λ5
λ4
λ2
Introducción a la geoestadística – Krigeado
92
EjemploKrigeado Ordinario (KO) (15)
i o123456
.0175
.2281
.0891
.6437
.1998
.1182
φ
= −
λ1⇒ =∑
φ⇒
i x y z12345
2 2 33 7 49 9 26 5 45 3 6
( ) ( )λ∗
=
=
= × + × − × + × + ×=
∑5
1,
.0175 3 .2281 4 .0891 2 .6437 4 .1998 6
KOKO i i
i
z z5 5 u
4.560
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
93
EjemploKrigeado Ordinario (KO) (16)
i o123456
.0175
.2281
.0891
.6437
.1998
.1182
φ
= −
λ1⇒ =∑
φ⇒
( ) ( ) ( )( )
σ λ γ φ=
= − +
= × + × − ×+ × + × +=
∑2
1, ,
0175 7.151 .2281 5.597 .0891 8.815.6437 3.621 .1998 4.720 .1182
nKO
KO i i oi
u
5 5 u u 5 5
4.008
i o123456
7.1515.5978.8153.6214.7201.0
=b
Introducción a la geoestadística – Krigeado
94
EjemploKrigeado Ordinario (KO) (17)
0 1 2 3 4 5 6 7 8 9
X
0
1
2
3
4
5
6
7
8
9
Y
0
0.5
1
1.5
2
2.5
3
3.5
0 1 2 3 4 5 6 7 8 9
X
0
1
2
3
4
5
6
7
8
9
Y
2
2.5
3
3.5
4
4.5
5
5.5
6
Interpolación mediante KO puntual
Mapa del error del krigeado = la desviación típica del krigeado
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
95
Krigeado por bloques
Krigeado Ordinario (KO) (18)
0 2 4 6 8 10X
0
2
4
6
8
10
Y
1
2
3
4
5
3
4
2
4
6
?
λ1
λ3
λ5
λ4
λ2
( ) ( ) ( )( )
( ) ( ) ( )( )
( )
1 11
1
11
nKOj j
j
nKOj n j n
j
nKOj
j
λ γ φ γ
λ γ φ γ
λ
=
=
=
− + = −
⇒
− + = −
=
∑
∑
∑
u
u
u
u u B u B
u u B u BB
( ) ( )1 di iγ γ− = −∫B
u B u u uB
Introducción a la geoestadística – Krigeado
96
Krigeado por bloques
Krigeado Ordinario (KO) (19)
1
φ−
= ⋅
λA b
( )( )
( )λ∗
=
= ∑1
nKO
KO i ii
Z Zu
B u
( ) ( ) ( )( )
( )σ λ γ φ γ=
= − + − −∑2
1
nKO
KO i ii
u
B u B B B B
( )
( )
1
1n
γ
γ
− = −
u B
bu B
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
97
Ejemplo
Krigeado Ordinario (KO) (20)
Interpolación mediante KO por bloques
Mapa del error de krigeado = la desviación típica del krigeado
0 1 2 3 4 5 6 7 8 9 10
X
0
1
2
3
4
5
6
7
8
9
10
Y
2
2.5
3
3.5
4
4.5
5
5.5
6
0 1 2 3 4 5 6 7 8 9 10
X
0
1
2
3
4
5
6
7
8
9
10
Y0
0.5
1
1.5
2
2.5
3
3.5
Introducción a la geoestadística – Krigeado
98
Información secundaria ⇒Geoestadística multivariada: tratamiento geoestadístico simultáneo de
dos o más variables correlacionadas⇒Tradicionalmente: co-krigeado, requiere un modelo de co-
regionalización⇒En el caso de información secundaria exhaustiva (se conoce el valor
de la variable secundaria en cada nodo de la retícula) se puedenaplicar varios metodologías o técnicas:
Krigeado dentro de clases o estratos (KDC)Krigeado simple con media local variable (KSml)Krigeado con una deriva externa (KDE)Co-krigeado co-localizado (CKc)
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
99
Ejemplo: ETo anual en Andalucía
0 200 400 600 800 1000 1200 1400Altitud (m)
900
1000
1100
1200
1300
1400
1500
ET o
(m
m/a
ño)
Todas las estacionesY = 1342.3 + 0.00697 X - 0.000234 X2
R2 = 0.628
0 200 400 600 800 1000 1200 1400Altitud (m)
900
1000
1100
1200
1300
1400
1500
ETo
(mm
/año
)
Estaciones de interiorY= 1394.9 - 0.161 X - 0.000118 X2
R2 = 0.759
Zonas de interior (>20 km de la costa): ETo según ajusteZonas costeras (< 5 km de la costa): ETo media aritméticaZonas intermedias: combinación lineal progresiva
Media local (ml):
Introducción a la geoestadística – Krigeado
Información secundaria
100
Información secundariaEjemplo: ETo anual en Andalucía
Variografía
0 25 50 75 100 125 150 175 200 225 250Distancia (km)
0
2000
4000
6000
8000
10000
12000
Sem
ivar
iogr
ama
(mm
2 )
isotrópicodireccional 35ºresidual
ETo anual
Introducción a la geoestadística – Krigeado
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
101
Ejemplo: ETo mensual en Andalucía
Evolución de la ETo a lo largo del año (KSml)
0 25 50 75 100 km
20 40 60 80 100 120 140 160 180 200 220
ETo (mm/mes)
Introducción a la geoestadística – Krigeado
Krigeado simple con media local variable
102
Validación del modelo geoestadístico
• Validación cruzada y “Jack-knifing”• Validar el modelo teórico del semivariograma• Validar los parámetros del algoritmo de interpolación• Comparar y evaluar diferentes procedimientos de
interpolación
Introducción a la geoestadística - Validación
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
103
Validación cruzada (1) • Existen varios parámetros en el Krigeado que se pueden
optimizar antes de interpolar y elaborar el mapa:
1. Los parámetros del semivariograma teórico: efecto pepita, alcance y meseta.
2. Importancia de considerar anisotropía o no3. El mínimo número de puntos vecinos que van a participar
en el krigeado4. El máximo número de puntos vecinos que van a participar
en el krigeado5. El radio del área de búsqueda alrededor del punto u6. El grado del polinomio en KD (K)
• Comparar diferentes tipos de krigeado o compararlos con otros métodos de interpolación.
⇒ Validación cruzada
Introducción a la geoestadística - Validación
104
Validación cruzada (2) Existen dos maneras:
1. Retirar cada dato a su vez del conjunto y estimar su valor con los datos que quedan ⇒ comparar los valores estimados con los observados
⇒Evalúa el modelo solamente en los puntos donde disponemos de datos
⇒No disponemos de información sobre la exactitud de la interpolación en otros puntos
2. Eliminar ± 25 % de los datos y calcular el semivariograma y interpolar con el 75 % restante ⇒ compara los valores estimados con los observados
⇒Despilfarro de información⇒Solamente apto para trabajos de investigación
Introducción a la geoestadística - Validación
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
105
Validación cruzada (3) ⇒Comparar los valores estimados con los calculados a través de
diferentes parámetros estadísticos (N = número de datos):
1. El Error Medio (EM):
⇒≈ 0⇒krigeado es un interpolador “exacto”
( ) ( ){ }1
1EMN
i ii
z zN
∗
=
= −∑ u u
2. El Error Medio Cuadrático(EMC):
⇒≈ varianza de krigeado⇒mide la exactitud media de las estimaciones⇒muy sensible para grandes errores
( ) ( ){ }2
1
1EMCN
i ii
z zN
∗
=
= −∑ u u
Introducción a la geoestadística - Validación
106
Validación cruzada (4) ⇒Comparar los valores estimados con los calculados a través de
diferentes parámetros estadísticos (N = número de datos):
3. Razón de Desviación Medio Cuadrático (RDMC)
⇒≈ 1
( ) ( )1
1EMN
i ii
z zN
∗
=
= −∑ u u4. El Error Medio Absoluto(EMA):
⇒mide la exactitud media de las estimaciones⇒mismas unidades que la variable⇒menos sensible para grandes errores
( ) ( ){ }( )
2
21
1EMCN
i i
i K i
z zN σ
∗
=
−= ∑
u uu
Introducción a la geoestadística - Validación
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
107
Validación cruzada (4) ⇒Comparar los valores estimados con los calculados a través de
diferentes parámetros estadísticos (N = número de datos):
5. Error Medio Relativo (EMR):
⇒0<EMR<1⇒no apto si hay observaciones con valores negativos,
iguales a 0 o muy pequeños⇒ Ideal para comparar la precisión de la interpolación para
diferentes variables
6. Coeficiente de correlación
( ) ( )( )1
1EMRN
i i
i i
z zN z
∗
=
−= ∑
u uu
Introducción a la geoestadística - Validación
108
Krigeado- ValidaciónEjemplo: ETo anual en Andalucía
EM (mm)
EMA (mm)
REMC (mm)
R (%)
2.4
51.2
66.2
74.4
KO
1.9
41.9
53.5
84.2
KDE
1.4
41.4
52.9
84.9
KSml
0 25 50 75 100km
KO
700 800 900 1000 1100 1200 1300 1400
ETo anual (mm)
<<
0 25 50 75100 km
KDE
700 800 900 1000 1100 1200 1300 1400
ETo anual (mm)
<<
0 25 50 75 100 km
KSml
700 800 900 1000 1100 1200 1300 1400< <
ETo anual (mm)
Introducción a la geoestadística – Validación
Grupo de Ríos y Embaleses, Universidad de Granada
Córdoba, ETSIAM, 22/05/2003
109
¿Quieres más información ?
Karl VanderlindenGrupo de Ríos y EmbalsesUniversidad de GranadaParque de las Ciencias-C.E.A.M.A.Avda. del Mediterráneo s/n18006 Granada
Gracias por vuestra atención !
Estudio piloto para la gestión integrada de la cuenca hidrográfica del río
Guadalfeo.