Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura...

19
Dpto Estudios Ambientales Laboratorio de Ecología 2 Estructura de las comunidades Una guía de análisis de datos utilizando R Por Eduardo Klein. Mayo 2004. Introducción El interés básico del análisis de la estructura de las comunidades es conocer cuales especies existen en el sistema, cuantos individuos de cada especie y como están “repartidos”. Un paso siguiente es conocer la biodiversidad y posiblemente como están agrupadas las muestras que hemos extraído de la comunidad (ordenadas o clasificadas). Nuestras muestras pueden a su vez representar áreas a lo largo de un gradiente ambiental, por ejemplo, en función del impacto de la ola en una plataforma rocosa, un gradiente de nutrientes en un río o el ecotono entre un bosque y una sabana. El paso siguiente es establecer entonces las posibles relaciones entre las muestras y analizarlas a la luz de las variaciones ambientales y/o las asociaciones intra o interespecies. El análisis de la estructura de una comunidad es básicamente un problema multivariado. En cada muestra se pueden identificar un número s de especies. La estructura de datos básica es lo que se conoce como matriz ecológica. Esta matriz, organizada de forma de que la filas representen las muestras y las columnas las especies, contiene alguna variable comunitaria estimada como por ejemplo abundancia, cobertura o un índice de Importancia. Esta guía tiene como objeto asistir al estudiante en los pasos básicos para el análisis de una matriz ecológica de datos. Existen muchos paquetes de análisis de datos que permiten realizar la mayor parte de los pasos fundamentales, algunos incluso de dominio público y de licencia abierta. Para este caso hemos seleccionado el paquete R, un programa muy flexible que permite un manejo adecuado de la matriz ecológica, que contiene las funciones básicas a ser utilizadas y que ha sido empleado en el curso de estadística 2. Utilizaremos en este caso el paquete “mva” (multivariate analysis) que acompaña la versión estándar de R y el paquete “vegan” (vegetation analisys) que debe ser bajado de la red y que se encuentra dentro de la sección de módulos distribuidos y soportados por R. Instalación del paquete R Para instalar el paquete R en su computadora, si aún no lo tiene instalado, vaya al sitio del programa htpp://www.r-project.org y siga las instrucciones de instalación. Una vez cargado en su computadora, baje el paquete “vegan” del mismo sitio. Este paquete viene comprimido y debe ser descomprimido en el subdirectorio “library” del directorio donde está instalado R. Existe excelente documentación sobre el uso de R en el Internet. Para refrescar el uso del programa se recomienda leer los documentos “R for beginners” y “Using R for Data Analysis and Graphics: An Introduction” que pueden ser bajados del sitio oficial de R Análisis de la estructura de una comunidad pag. 1 de 19 E Klein v 2004_05

Transcript of Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura...

Page 1: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

Estructura de las comunidades Una guía de análisis de datos utilizando R

Por Eduardo Klein. Mayo 2004. Introducción El interés básico del análisis de la estructura de las comunidades es conocer cuales especies existen en el sistema, cuantos individuos de cada especie y como están “repartidos”. Un paso siguiente es conocer la biodiversidad y posiblemente como están agrupadas las muestras que hemos extraído de la comunidad (ordenadas o clasificadas). Nuestras muestras pueden a su vez representar áreas a lo largo de un gradiente ambiental, por ejemplo, en función del impacto de la ola en una plataforma rocosa, un gradiente de nutrientes en un río o el ecotono entre un bosque y una sabana. El paso siguiente es establecer entonces las posibles relaciones entre las muestras y analizarlas a la luz de las variaciones ambientales y/o las asociaciones intra o interespecies. El análisis de la estructura de una comunidad es básicamente un problema multivariado. En cada muestra se pueden identificar un número s de especies. La estructura de datos básica es lo que se conoce como matriz ecológica. Esta matriz, organizada de forma de que la filas representen las muestras y las columnas las especies, contiene alguna variable comunitaria estimada como por ejemplo abundancia, cobertura o un índice de Importancia. Esta guía tiene como objeto asistir al estudiante en los pasos básicos para el análisis de una matriz ecológica de datos. Existen muchos paquetes de análisis de datos que permiten realizar la mayor parte de los pasos fundamentales, algunos incluso de dominio público y de licencia abierta. Para este caso hemos seleccionado el paquete R, un programa muy flexible que permite un manejo adecuado de la matriz ecológica, que contiene las funciones básicas a ser utilizadas y que ha sido empleado en el curso de estadística 2. Utilizaremos en este caso el paquete “mva” (multivariate analysis) que acompaña la versión estándar de R y el paquete “vegan” (vegetation analisys) que debe ser bajado de la red y que se encuentra dentro de la sección de módulos distribuidos y soportados por R. Instalación del paquete R Para instalar el paquete R en su computadora, si aún no lo tiene instalado, vaya al sitio del programa htpp://www.r-project.org y siga las instrucciones de instalación. Una vez cargado en su computadora, baje el paquete “vegan” del mismo sitio. Este paquete viene comprimido y debe ser descomprimido en el subdirectorio “library” del directorio donde está instalado R. Existe excelente documentación sobre el uso de R en el Internet. Para refrescar el uso del programa se recomienda leer los documentos “R for beginners” y “Using R for Data Analysis and Graphics: An Introduction” que pueden ser bajados del sitio oficial de R

Análisis de la estructura de una comunidad pag. 1 de 19 E Klein v 2004_05

Page 2: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

Elaboración de la matriz ecológica de datos. Como se mencionó anteriormente, los datos de abundancia o cobertura o cualquier otro índice comunitario estimado para cada muestra, debe organizarse en una estructura matricial, donde las filas representan las muestras y las columnas las especies. Existen muchas maneras de introducir sus datos de campo en el computador y tal vez una de las mas sencillas sea utilizando el programa MS-Excel. Construya la tabla de acuerdo a las especificaciones estándar (fila=muestras, columnas=especies), colocando en la primera columna el nombre de las muestras y en la primera fila el nombre de las especies. La celda A1 debe quedar en blanco. No deje filas o columnas en blanco. Se recomienda utilizar nombres cortos, sin caracteres especiales como @#$%^&* ni vocales acentuadas. Evite igualmente el uso de varias palabras para describir las muestras o las especies. Si requiere hacerlo es conveniente utilizar el guión de subrayado para separar las palabras. Así, si quiere introducir Caulerpa racemosa puede hacerlo como Caulerpa_racemosa (esto tiene la desventaja que R convierte los _ en puntos). También se acostumbra abreviar los nombres de las especies y un buen uso podría ser usar las tres primeras letras del género y las tres primeras de la especie combinadas en una sola palabra (cauras) o cuatro letras (caulrace). Esto facilita la colocación de etiquetas (labels) en las tablas y gráficos. NOTA: si decide usar los nombres abreviados de las especies debe incluir en su informe una tabla donde se nombren las especies con su género y especie completos y el código utilizado para la nomenclatura abreviada. La figura 1 muestra un ejemplo hipotético de matriz ecológica.

Figura 1. Matriz ecológica ejemplo, archivo prueba_2.csv. Los datos de las celdas son las abundancia de la especie i en la muestra j. Note que la celda A1 está en blanco.

Análisis de la estructura de una comunidad pag. 2 de 19 E Klein v 2004_05

Page 3: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

Importando los datos a R

a matriz ecológica de datos que introdujo en Excel puede ser fácilmente importada a

o .csv) En

2. o

hora estamos listos para importar los datos a R

. Inicie el programa R de trabajo al directorio donde tiene la matriz de datos en

5. tos en

6. Puede visualizar los datos importados simplemente llamando a la variable:

spa spb spc spd spe spf spg sph spi spj spk 1

8

8 7 5 8

a tienes los datos importados en R!. Recuerda que siempre puedes grabar una copia

LR, pero requiere ciertos cuidados. La idea es convertir esta matriz en un archivo de texto donde cada fila es una muestra y las abundancias de las especies en cada fila están separadas por una coma. Para hacer esto realice los siguientes pasos:

1. Grabe la matriz como una tabla de datos separados por coma (formatel menú de archivo –guardar como... seleccione el tipo de archivo “CSV (delimitado por coma)”. Este método produce un archivo cuya primera línea tiene como primer carácter una coma (recuerde que dejamos la celda A1 en blanco) Para eliminar la primera coma, utilice el programa NOTEPAD (o cualquier otreditor de texto) y bórrela del archivo. Grabe de nuevo el archivo (puede sobre escribirlo)

A 34. Cambie el directorio

formato csv. Esto se hace en el menú File – Change dir... de la interfase gráfica de R (también lo puede hacer con el comando setwd(“nuevo directorio”)) Utilice el comando read.csv(“nombre del archivo csv) y almacene los dauna variable. Ej. (recuerde que > es el prompt de R)

> datos2 <- read.csv("prueba_2.csv")

> datos2

m 21 203 155 362 0 0 0 0 0 0 0 m2 12 306 0 34 0 0 0 0 0 0 0 m3 16 282 47 38 0 0 0 0 0 0 0 m4 0 480 0 87 0 0 0 0 0 0 0 m5 18 118 90 177 0 0 0 0 0 0 0 m6 388 0 0 0 1 34 45 0 0 0 0 m7 349 0 0 0 1 54 95 0 0 0 0 m8 259 0 0 0 16 23 77 0 0 0 0 m9 319 0 0 0 14 55 34 0 0 0 0 m10 315 0 0 0 30 43 46 0 0 0 0 m11 241 0 0 0 11 21 41 0 0 0 0 m12 289 0 0 0 15 13 39 0 0 0 0 m13 318 0 0 0 12 44 16 0 0 0 0 m14 310 0 0 0 15 75 66 0 0 0 0 m15 175 0 0 0 0 0 0 11 12 30 20m16 153 0 0 0 0 0 0 403 111 347 200 m17 179 0 0 0 0 0 0 400 98 48 210 m18 196 0 0 0 0 0 0 398 56 437 253 m19 178 0 0 0 0 0 0 225 75 373 222 m20 215 0 0 0 0 0 0 150 90 157 213 Yde tu espacio de trabajo, en el menú File – Save Workspace... Es una buena práctica hacerlo regularmente, sobre todo si se trabaja en el modo de línea de comando, para evitar perder las variables que se han creado.

Análisis de la estructura de una comunidad pag. 3 de 19 E Klein v 2004_05

Page 4: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

Algunos cálculos rápidos

odemos ahora utilizar toda la potencia de R para trabajar nuestros datos.

ara calcular la media de las abundancias de cada una de las especies en las

apply(datos2,2,mean) d spe spf spg sph spi spj spk

5 0 5 5

comando apply aplica la función especificada a cada una de las filas o columnas de

ualmente podemos calcular la desviación estándar de la abundancia por muestra:

spc spd spe spf spg 33378 138.074532 111.088526 2185 677 63696 30.375674

51664 45.539197 .707201 88541

el coeficiente de variación en porcentaje (CV%=100*sd/mean). Para eso creamos una

pc spd spe spf spg sph 884 1142 9883 4351 9873 50108 5588 4825

51597 81248 0971

l coeficiente de variación también se puede calcular operando los resultados de los

,2,mean)

lo que es lo mismo: d)/apply(datos2,2,mean)

teresante: si bien las abundancias varían considerablemente entre las muestras

P Pmuestras: >spa spb spc sp197.5 69.45 36.15 34.90 5.75 18.1 22.95 84.70 27.8 83.3 65.30 El la tabla de datos. El índice 2 significa que se aplique a las columnas (1 para las filas) Ig> apply(datos2,2,sd) spa spb 126.1 88.31 8.607 24.1sph spi spj spk 149.4 150 102.7 Ofunción primero y después se la aplicamos a las columnas de los datos. > coefvar<-function(x){100*sd(x)/mean(x)} > apply(datos2,2,coefvar) spa spb s63.84 198.8 307.2 253.0 149.6 133. 132.3 176.4spi spj spk 163. 180. 157.4 Ecomandos mean y sd: > media<-apply(datos2> desviacion<-apply(datos2,2,sd)> 100*desviacion/media O> 100*apply(datos2,2,s In(algunas en mas del 100% del valor de la media), la especie a es la que menos varía su abundancia entre las muestras y que presenta la abundancia promedio más altas. La especie c presenta la abundancia promedio mas baja y el mayor coeficiente de variación. Esto se visualiza muy bien utilizando los “boxplots”. Estos gráficos inventados por Tukey, se construyen con una caja cuyos límites son la desviación estándar, una línea que marca la media y unas líneas verticales a partir de los extremos de la caja (bigotes o “whiskers”) que muestran un intervalo de confianza de 95%. Los valores extremos (“outlayers”) son mostrados como puntos (R utiliza la definición original

Análisis de la estructura de una comunidad pag. 4 de 19 E Klein v 2004_05

Page 5: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

utilizando en lugar de la media, desviación estándar y IC95%, la mediana, el rango intercuartílico y los percentiles 5% y 95%) > boxplot(datos2, ylab="abundancia", xlab="especies")

igura 2. Boxplot de la abundancia de las especies en la variable datos2.

íjense que un bajo coeficiente de variación indica que la especie está presente en bundancias similares en muchas muestras, posiblemente con ninguno o muy pocos

s p a s p b s p c s p d s p e s p f s p g s p h s p i s p j s p k

010

020

030

040

0

e s p e c ie s

abun

danc

ia

F Faceros. Pasa lo contrario con aquellas especies con alto CV%: están presentes en algunas pocas muestras y en otras no están o tienen muy bajas abundancias. Si nuestras muestras han sido tomadas siguiendo un gradiente, podría pensarse que la especie a no se ve afectada fuertemente por este gradiente, al menos no como para hacer que ella desaparezca completamente de algunas muestras. Miren de vuelta la tabla de datos y traten de obtener conclusiones análogas para las otras especies ¿Hay alguna otra especie que está bien adaptada al gradiente? . Interesante ¿no?. Volver a la tabla de datos y observar los números siempre es una buena costumbre cuando se están analizando datos. Si para muchos una figura vale mas que mil palabras (o mil números) (y me incluyo definitivamente en este grupo), no hay que olvidarse de los datos que originaron la figura. Una observación a los datos, dirigida por lo que hayamos podido observar en una figura, permite confirmar en muchos casos nuestras observaciones.

Análisis de la estructura de una comunidad pag. 5 de 19 E Klein v 2004_05

Page 6: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

Agrupando la matriz ecológica

upongamos que nuestras muestras provienen de un gradiente ambiental que hemos udio. Una vez visto el sitio, decidimos separar cuatro

ubzonas, cada una correspondiente a una porción del gradiente y nombradas del 1 al

zonas <- c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,4)

unimos a la variable datos2 mediante la función cbind() y creamos una nueva s

datos2z<-cbind(zonas,datos2)

e spf spg sph spi spj spk 362 0 0 0 0 0 0 0

12 306 0 34 0 0 0 0 0 0 0 3

9

8 7 5 8 3 1 7 0 0 0

s naliza b plot r zon . Un man sen la d e per ve fi nte) te r su onju s d atos no a ca o gr rlo

ermite dividir la pantalla de graficación en subpantallas y eso es lo que vamos a hacer.

atro “subpantallas” dentro de la pantalla de graficación y ando screen(n) (donde en este caso n=1..4) seleccionamos cada una de las

uatro pantallas para graficar. Esta serie de comandos selecciona cada una de las

Sdetectado en nuestra zona de ests4. En cada zona se ubicaron 5 unidades muestreales de forma aleatoria de donde se obtuvieron los datos de abundancia. En el caso de una plataforma rocosa, la zona 1 correspondería al frente donde las olas ejercen su mayor impacto y la 4 a la laguna interna con bajo impacto de la ola. Análogamente, en un río la zona 1 correspondería a la zona prístina, de bajo orden y la 4 a la zona mas afectada y de mayor orden. En el ecotono, 1 sería el bosque y 4 la sabana, quedando 2 y 3 entre ambas. En R, vamos a construir una nueva matriz, incorporándole una columna adicional al principio que indique a que zona pertenece cada muestra. >> zonas [1] 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 Ahora la variable llamada datos2z, por datos2 zona>> datos2z zonas spa spb spc spd spm1 1 21 203 155 m2 1 m 1 16 282 478 38 0 0 0 0 0 0 0 m4 1 0 480 0 87 0 0 0 0 0 0 0 m5 1 18 118 90 177 0 0 0 0 0 0 0 m6 2 388 0 0 0 1 34 45 0 0 0 0 m7 2 34 0 0 0 1 54 95 0 0 0 0 m8 2 259 0 0 0 16 23 77 0 0 0 0 m9 2 319 0 0 0 14 55 34 0 0 0 0 m10 2 315 0 0 0 30 43 46 0 0 0 0 m11 3 241 0 0 0 11 21 41 0 0 0 0 m12 3 289 0 0 0 15 13 39 0 0 0 0 m13 3 318 0 0 0 12 44 16 0 0 0 0 m14 3 310 0 0 0 15 75 66 0 0 0 0 m15 3 175 0 0 0 0 0 0 11 12 30 20m16 4 153 0 0 0 0 0 0 40 11 34 20m17 4 179 0 0 0 0 0 0 40 98 48 21m18 4 196 0 0 0 0 0 0 398 56 437 253 m19 4 178 0 0 0 0 0 0 225 75 373 222 m20 4 215 0 0 0 0 0 0 150 90 157 213 Vamo a r los ox po as a era cil e hac rlo ( o tal z notan e cie es ob ne bc nto e d , u par da z na y afica s. Rp> split.screen(c(2,2),erase=T) [1] 1 2 3 4 Con este comando creamos cucon el comc

Análisis de la estructura de una comunidad pag. 6 de 19 E Klein v 2004_05

Page 7: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

pantallas, hace un boxplot de cada subconjunto usando la función subset y adorna la gráfica con algunos títulos (función title) > screen(1) > boxplot(subset(datos2z,zonas==1,select=spa:spk)) > title(sub="zona 1", xlab="Especies", ylab="Abundancia")

unas.

> screen(2) > boxplot(subset(datos2z,zonas==2,select=spa:spk)) > title(sub="zona 2", xlab="Especies", ylab="Abundancia") > screen(3) > boxplot(subset(datos2z,zonas==3,select=spa:spk)) > title(sub="zona 3", xlab="Especies", ylab="Abundancia") > screen(4) > boxplot(subset(datos2z,zonas==4,select=spa:spk)) > title(sub="zona 4", xlab="Especies", ylab="Abundancia") El resultado es la figura 3.

0

Figura 3. Abundancias de las especies en las muestras por zonas

Esto confirma lo que habíamos observado antes: la especie a está presente en todas

spa spc spe spg sp i spk

010

030

0

zona 1E species

Abu

ndan

cia

spa spc spe spg sp i spk

010

020

030

040

zona 2E species

Abu

ndan

cia

spa spc spe spg sp i spk

010

020

030

0

zona 3E species

Abu

ndan

cia

spa spc spe spg sp i spk

010

030

0

zona 4E species

Abu

ndan

cia

las zonas, mientras que otras especies sólo están presentes en alg Cancelen la opción de partir la pantalla con el comando: > close.screen(all.screen=T)

Análisis de la estructura de una comunidad pag. 7 de 19 E Klein v 2004_05

Page 8: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

Diversidad y Equidad Uno de lo parámetros ecológicos de mayor interés es la diversidad de una comunidad.

ue ha sido muy controversial y existen muchos índices que tentan cuantificarla. El índice sin duda mas conocido es el H’ de Shannon (o índice de

: library(vegan)

instalado antes de que pueda ser usado.

a diversidad de Shannon se obtiene mediante el comando diversity

1 m2 m3 m4 m5 m6 m7 m8 0.8189317 0.8864746

m12 m13 m14 m15 m16 30092 0.8842302 72136 58259 07186 25827 69871 1.5008807

40065 5917 8356 4426

te cas

diversity(datos2,index="shannon",base=2)

0.6675169 1.2986282 0.6183803 1.7235107 0.8428576 1.1814686 1.2789126 m13 m14 m15 m16

40705 1.2756746 68552 05838 87885 42863 18306 2.1653131

55532 2.0985323 0188 3416

ién pu alcula índice impson y el recípro o de Simp n: d x "

1 m2 m3 m4 m5 m6 m7 m8 8817 0.4752356

12 m13 m14 m15 m1640004 0.4473762 81699 58743 97896 04625 37283 0.7567180

62641 0.7466396 9756 2527

Esta es una medida qinShannon-Wiener). También se usa el índice de Simpson y la riqueza de especies como indicadores de la diversidad. La mayoría de los índices de diversidad también incluyen una medida de equidad, que representa como están proporcionalmente representadas las especies dentro de la muestra. Una referencia interesante para empezar es el libro de Krebs, Ecological Methodology1 El paquete “vegan” de R permite el cálculo de estas variables. Para usar el módulo, primero debe cargarlo en la memoria> Tomen nota que el módulo debe estar L> diversity(datos2,"shannon") m1.1329374 0.4626875 0.9001404 0.4286286 1.1946466 0.5842244m9 m10 m11 0.79 0.76 0.66 0.65 0.95 1.54m17 m18 m19 m20 1.40 1.454 1.504 1.567 En es o se utilizó por defecto el logaritmo natural, pero esta base puede cambiarse fácilmente:>m1 m2 m3 m4 m5 m6 m7 m8 1.6344831 m9 m10 m11 m12 1.14 1.10 0.96 0.93 1.37 2.23m17 m18 m19 m20 2.02 2.171 2.261 Tamb ede c rse el de S c so> diversity( atos2,inde ="simpson ) m0.6417305 0.2337939 0.5325840 0.2597912 0.6694949 0.2981317 0.462m9 m10 m11 m0.40 0.38 0.32 0.31 0.51 0.77m17 m18 m19 m20 0.71 0.759 0.784

1 Krebs, C 1995. Ecological Methodology.

Análisis de la estructura de una comunidad pag. 8 de 19 E Klein v 2004_05

Page 9: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

> diversity(datos2,index="invsimpson") 1 m2 m3 m4 m5 m6 m7 m8 .791195 1.305132 2.139422 1.350970 3.025672 1.424769 1.861787 1.905617

m13 m14 m15 m16 7853 1.809549 1.634441 3403 0133 2745 9466 4.110457

4404 3.946946 4.166244 4.635052

úme espec or mu : 2

1 m2 m3 m4 m5 m6 m7 m8 m9 m10 m11 m12 m13 m144 4 4 4 4 4 4

m19 m20

rifi n e in ac en ma de tos

se n que el análisis se hace ahora sobre las muestras y no sobre las especies los resultados de forma gráfica:

arplot(diversity(datos2,index="shannon",base=2),col="grey")

Por qué, si todas tienen aproximadamente el mismo número de especies?. La equidad (s):

m2m9 m10 m11 m12 1.67 1.48 1.47 2.04 4.41m17 m18 m19 m20 3.52 Y el n ro de ies p estra> specnumber(datos ) m4 3 4 2 4 4 4 m15 m16 m17 m18 5 5 5 5 5 5 Ve que sta form ión la triz da . > Ob rvecomo veníamos haciéndolo anteriormente. Veamos> b> title(main="Diversidad de Shannon base 2", xlab="muestras", ylab="H'")

D iv e r s id a d d e S h a n n o n b a s e 2

Figura 4. Diversidad de Shannon (base 2) de las muestras. Observen que ahora las muestras 15-20 son las que presentan una mayor diversidad.

m 1 m 3 m 5 m 7 m 9 m 1 1 m 1 3 m 1 5 m 1 7 m 1 9

0.0

0.5

1.0

1.5

2.0

m ue s tra s

H'

¿es la respuesta. Calculemos la equidad de Pielou como 1/log

Análisis de la estructura de una comunidad pag. 9 de 19 E Klein v 2004_05

Page 10: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

> log2(specnumber(datos2)) m1 m2 m3 m4 m5 m6 m7 m8

.000000 1.584963 2.000000 1.000000 2.000000 2.000000 2.000000 2.000000m12 m13 m14 m15 m16

.000000 2.000000 2.000000 2.000000 2.000000 2.000000 2.321928 2.321928

, r la u a s.

p a u lizando lo números e Hill, quien encontró ue una familia de funciones puede describir la diversidad, formando parte de ella la

cíproco de Simpson. Aparte de una posible interpretación ecológica de los resultados,

3 4 2.459949 2.139422 4 35151 50970

ct ( a entes de la familia de funciones de Hill.

ve d es e a medida que aumenta el coeficiente de la función. íjense que para un coeficiente de 0, H0 es igual a la riqueza de especies.¿Cuál índice

los valores de s diferentes índices de Hill en tres paneles simultáneamente y analizar los resultados.

2m9 m10 m11 2m17 m18 m19 m20 2.321928 2.321928 2.321928 2.321928 En efecto las muest as 15-20 presentan mayor eq idad de l s muestras obtenida También odemos c lcular la diversidad ti s dqriqueza de especies, el antilogaritmo natural de H’ (calculado con log base e) y el rea medida que el exponente de la función aumenta, se le va restando peso a las especies menos frecuentes. Así, la riqueza (H0) considera todas las especies y el antilogaritmo de Shannon (H1) toma en cuenta mas especies que el recíproco de Simpson (H2). La función renyi del paquete vegan calcula los números de Hill: > renyi(datos2,c(0,1,2),hill=TRUE) 0 1 2 m1 4 3.104763 2.791195 m2 3 1.588337 1.305132 mm 2 1.5 1.3m5 4 3.302391 3.025672 m6 4 1.793599 1.424769 m7 4 2.268075 1.861787 m8 4 2.426560 1.905617 m9 4 2.210037 1.677853 m10 4 2.421120 1.809549 m11 4 2.153757 1.634441 m12 4 1.946097 1.483403 m13 4 1.916918 1.470133 m14 4 2.592396 2.042745 m15 5 4.697296 4.419466 m16 5 4.485638 4.110457 m17 5 4.071480 3.524404 m18 5 4.282735 3.946946 m19 5 4.503413 4.166244 m20 5 4.794371 4.635052 El ve or c 0,1,2) indic los expon La di rsi ad entonc disminuyFusar? Esta decisión es del investigador. Como ejercicio, pueden graficar lo

Análisis de la estructura de una comunidad pag. 10 de 19 E Klein v 2004_05

Page 11: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

Análisis de clasificación

parentemente y de acuerdo a lo que hemos venido analizando, parecen existir iferencias en cuanto a la composición de especies entre las zonas donde se ubicaron

nas especies están presentes en todas las muestras (como l caso de la especie a) y otras sólo están en algunas muestras de alguna zona en

multáneamente. Es decir, combinar las abundancias de las si especies resentes en la muestra i y las abundancias de las sj especies presentes en la muestra j

ría un valor alto de asociación entre la uestras. La función cor de R permite calcular diferentes índices de correlación:

4547 65978

c -0.48945235 0.4346431 1.0000000 0.3485605 -0.2288218 -0.2565847 .59574755 0.4695100 0.3485605 1.0000000 -0.2778837 -0.3115992

pe 96931 36852 88218 78837 0000 60276

pe 9867 851156 3002936 8889277 671111

abla de p s d ón t simétrica re su dia de a e de Pearson.

d l e g e o elaciones as altas entre muestras pertenecientes a una misma zona. Es decir, las muestras

Adlas unidades muestreales. Ueparticular. Se trata entonces de analizar cuanto se parecen (o cuanto difieren) entre si las muestras, utilizando la información contenida en la abundancia de cada especie por muestra sipy estimar las diferencias a través de un valor único. Ese valor debería ser alto si las muestras se parecen y bajo si no se parecen. Una manera de hacer esto es utilizar el coeficiente de correlación (r de Pearson) calculado entre pares de muestras, operando todas las posibles combinaciones de pares de muestras. Un valor alto de r, indicam > cor(datos2) spa spb spc spd spe spf spa 1.00000000 -0.7852091 -0.4894523 -0.5957475 0.5589693 0.753pb -0.78520909 1.0000000 0.4346431 0.4695100 -0.3536852 -0.39s

spspd -0s 0.558 -0.35 -0.22 -0.27 1.000 0.63spf 0.75345468 -0.3965978 -0.2565847 -0.3115992 0.6360276 1.0000000 spg 0.71320274 -0.4000293 -0.2588048 -0.3142953 0.5649867 0.7882742 sph -0.08496814 -0.3000666 -0.1941325 -0.2357566 -0.3985116 -0.4468629 spi -0.08804912 -0.3237986 -0.2094862 -0.2544023 -0.4300294 -0.4822047 spj -0.07878965 -0.2928240 -0.1894467 -0.2300662 -0.3888928 -0.4360770 spk -0.07514647 -0.3363594 -0.2176126 -0.2642711 -0.4467111 -0.5009104 spg sph spi spj spk spa 0.7132027 -0.08496814 -0.08804912 -0.07878965 -0.07514647 spb -0.4000293 -0.30006664 -0.32379855 -0.29282400 -0.33635938 spc -0.2588048 -0.19413246 -0.20948616 -0.18944672 -0.21761257 spd -0.3142953 -0.23575659 -0.25440229 -0.23006618 -0.26427110 s 0.564 -0.39 -0.4 -0.3 -0.44 spf 0.7882742 -0.44686286 -0.48220470 -0.43607702 -0.50091044 spg 1.0000000 -0.45072932 -0.48637696 -0.43985016 -0.50524455 sph -0.4507293 1.00000000 0.80737971 0.78336419 0.89462441 spi -0.4863770 0.80737971 1.00000000 0.78303786 0.93112735 spj -0.4398502 0.78336419 0.78303786 1.00000000 0.88633247 spk -0.5052446 0.89462441 0.93112735 0.88633247 1.00000000 La t resultados roducida e una matriz e correlaci , obviamen e sob gonal, don cada celd representa l valor de la correlación Un análisis etallado de a matriz mu stra que en eneral, se ncuentran c rrmprovenientes de una misma zona son “mas similares” que aquellas provenientes de zonas distintas. Hemos calculado entonces un índice de similaridad entre muestras. Sin embargo, hacer este análisis sobre la matriz de correlación puede resultar engorroso.

Análisis de la estructura de una comunidad pag. 11 de 19 E Klein v 2004_05

Page 12: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

Por otro lado, el coeficiente de correlación no es necesariamente el mejor índice para medir similaridad, ya que este mide el grado de asociación lineal entre los objetos. Por

jemplo, una relación parabólica perfecta entre dos muestras producirá un coeficiente

de disimilaridad (distancia) que mide la distancia geométrica entre dos muestras ubicadas en un hiperespacio definido

la comunidad. Requiere que los planos

2.

de una muestra con respecto a otra. Este

3.

e efectivamente está midiendo. Está acotado entre

Tanto edistanc el coeficiente de orrelación, todas las rutinas producen una matriz de distancia (o similaridad)

m4 m5 m6 m7 1 0.00000 377.22540 464.29624 420.49970 213.73816 578.05623 561.96441

252.84185 489.23410 469.364463 29624 478.63556 0.00000 94711 58201 57874 48232

0 5

48

4

ede correlación de cero. Existen muchos índices para medir el grado de similaridad (o distancia) entre un conjunto de muestras. Para una excelente revisión de la mayoría de los índices disponibles y una clasificación sistémica de los mismos, consulten el libro de Lengendre y Lengendre Numerical Ecology 2 Entre los índices más comunes se encuentran:

1. Distancia Euclidiana: Es un índice

por tantos ejes como especies contenga sean ortogonales entre si. También considera los casos en los cuales existe una especie común a dos muestras pero con abundancia cero (lo que se llama “doble ceros”). Esta particularidad no es siempre deseable ya que un par de muestras en el cual coincidan todas las especies con idénticas abundancias está a exactamente la misma distancia que otro par de muestras donde todas las especies tienen abundancia cero. El índice de Bray Curtis: Es tal vez uno de los índices mas usados en tiempos recientes en estudios ecológicos. Se basa en el cálculo del porcentaje de cambio en la abundancia de las especiesíndice no considera los dobles ceros y ha demostrado un buen comportamiento cuando se realizan análisis numéricos sobre datos de un gradiente ambiental basados en este estimador. El índice de Jaccard: Se basa en datos de presencia ausencia, sin considerar las abundancia específicas de cada especie. Es un índice bastante robusto y debe ser usado considerando lo qu0 y 1 por lo que su interpretación es relativamente sencilla.

l paquete vegan como el paquete mva presentan rutinas para calcular índices de ia. En todos los casos y al igual que el ejemplo anterior con

ccalculadas a partir de la matriz ecológica. Calculemos entonces la matriz de distancias euclidianas de nuestros datos de prueba, utilizando la rutina dist del paquete mva > dist(datos2,method="euclidean",upper=T, diag=T) m1 m2 m3 mm2 377.22540 0.00000 478.63556 182.28823m 464. 519. 443. 671. 657.m4 420.4997 182.28823 519.94711 0.00000 384.14581 625.85541 609.68188m5 213.73816 252.8418 443.58201 384.14581 0.00000 439.81246 418.15786m6 578.05623 489.23410 671.5787 625.85541 439.81246 0.00000 66.49060 m7 561.96441 469.36446 657.48232 609.6818 418.15786 66.49060 0.00000 m8 509.54489 403.13149 612.54796 558.35831 343.7266 134.20507 98.03061 m9 538.01394 439.79313 636.89717 586.60634 385.13764 74.10803 69.21705 m10 536.26393 437.56828 635.38807 584.85810 382.65781 79.06959 67.22351m11 496.91146 386.62126 601.93023 546.16206 324.53813 147.96621 125.57468

2 Legendre P y L Legendre 1999. Numerical Ecology.

Análisis de la estructura de una comunidad pag. 12 de 19 E Klein v 2004_05

Page 13: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

m12

3 54796 636.89717 635.38807 3023 0528 1651 5505

8 7 2

3 6651 814.46915 742.98654 4442 1297 7513

0 5

8

at la s na uestras, e n d n e via ente los

alores de la diagonal son cero, ya que la distancia de una muestra con ella misma es

519.63160 416.45648 621.20528 568.68708 358.76037 102.34256 92.80625 m13 535.55859 436.76538 634.81651 584.31926 381.69228 77.21399 86.15683 m14 538.52112 440.22949 637.25505 586.74952 385.77584 91.66242 54.76313 m15 621.55933 536.37953 707.86651 659.49678 494.31164 463.56553 456.68370m16 740.83804 670.68025 814.46915 772.34513 637.74368 627.33245 620.88405m17 661.24882 581.96993 742.98654 697.14991 543.39856 512.70947 506.80371m18 802.13528 738.35357 870.84442 832.40795 708.20548 675.69520 672.21202m19 682.34156 605.81433 761.81297 717.15828 568.87257 540.31935 534.64568m20 578.38741 486.43499 670.57513 620.33217 439.06719 365.68976 361.26998 m8 m9 m10 m11 m12 m13 m14 m1 509.54489 538.01394 536.26393 496.91146 519.63160 535.55859 538.52112m2 403.13149 439.79313 437.56828 386.62126 416.45648 436.76538 440.22949m 612. 601.9 621.2 634.8 637.2m4 558.35831 586.60634 584.85810 546.16206 568.68708 584.31926 586.74952m5 343.72664 385.13764 382.65781 324.53813 358.76037 381.69228 385.77584m6 134.20507 74.10803 79.06959 147.96621 102.34256 77.21399 91.66242 m7 98.03061 69.21705 67.22351 125.57468 92.80625 86.15683 54.76313 m8 0.00000 80.47981 68.50547 40.60788 49.44694 87.51571 73.66817 m9 80.47981 0.00000 23.66432 85.42833 51.86521 21.21320 38.80722 m10 68.50547 23.66432 0.00000 79.66179 43.01163 35.12834 40.91455 m11 40.60788 85.42833 79.66179 0.00000 48.86717 84.16650 91.20307 m12 49.44694 51.86521 43.01163 48.86717 0.00000 48.37355 70.80960 m13 87.51571 21.21320 35.12834 84.16650 48.37355 0.00000 59.44746 m14 73.66817 38.80722 40.91455 91.20307 70.80960 59.44746 0.00000 m15 424.39604 437.55571 436.81461 415.86176 425.7381 434.88734 441.33094m16 594.21292 605.86467 605.18427 587.47425 596.28014 603.9039 608.27132m17 478.66690 489.88264 489.25351 471.26956 479.60713 487.50897 493.3305m18 653.60615 660.32113 659.95757 648.68020 653.51511 658.58788 663.11387m19 507.87597 518.57593 517.97394 500.87424 508.82119 516.33226 521.81702m20 330.55711 340.31015 339.82790 321.77166 328.64723 336.99110 346.19214 m15 m16 m17 m18 m19 m20 m1 621.55933 740.83804 661.24882 802.13528 682.34156 578.38741 m2 536.37953 670.68025 581.96993 738.35357 605.81433 486.43499 m 707.8 870.8 761.8 670.5 m4 659.49678 772.34513 697.14991 832.40795 717.15828 620.33217 m5 494.31164 637.74368 543.39856 708.20548 568.87257 439.06719 m6 463.56553 627.33245 512.70947 675.69520 540.31935 365.68976 m7 456.68370 620.88405 506.80371 672.21202 534.64568 361.26998 m8 424.39604 594.21292 478.66690 653.60615 507.87597 330.55711 m9 437.55571 605.86467 489.88264 660.32113 518.57593 340.31015 m10 436.81461 605.18427 489.25351 659.95757 517.97394 339.82790 m11 415.86176 587.47425 471.26956 648.68020 500.87424 321.77166 m12 425.73818 596.28014 479.60713 653.51511 508.82119 328.64723 m13 434.88734 603.90397 487.50897 658.58788 516.33226 336.99110 m14 441.33094 608.27132 493.33052 663.11387 521.81702 346.19214 m15 0.00000 289.47021 382.66696 321.45140 137.77518 161.00311 m16 289.47021 0.00000 300.59108 125.72987 186.45375 323.36203 m17 382.66696 300.59108 0.00000 393.98858 370.03243 275.22718 m18 321.4514 125.72987 393.98858 0.00000 188.86768 378.18117 m19 137.77518 186.4537 370.03243 188.86768 0.00000 232.28431 m20 161.00311 323.36203 275.2271 378.18117 232.28431 0.00000 La m riz producida (simétrica) muestra s distancia euclidea s entre las mdond mayores valores indica mayores istancias e tre las mu stras. Ob mv

Análisis de la estructura de una comunidad pag. 13 de 19 E Klein v 2004_05

Page 14: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

siempre cero. De manera análoga al coeficiente de correlación, pareciera que las muestras provenientes de una misma zona están mas cercas en el espacio euclidiano, es decir, son más similares entre sí. Ahora utilice la función vegdist para estimar la similaridad de Jaccard y el índice de Bray-Curtis. Recuerde cargar el paquete vegan si aún no lo ha hecho. La sintaxis de la

nción es la siguiente: fu

onde

x matriz ecológica Indice de disimilaridad, puede ser: "manhattan", "euclidean",

"canberra", "bray", "kulczynski", "jaccard", "gower", "morisita", rn" r "mo

Por razones de espacio el resultado de estas rutinas sobre nuestros datos de prueba están en el anexo. Realícelo usted mismo y extraiga conclusiones de las matrices. ¿Sigue verificándose que las muestras provenientes de las mismas zonas son menos

as similares a través de la matriz puede ser un roceso complicado. Para ello se utiliza un análisis de agregados (“Cluster Analysis” en

a. Como entrada requiere una matriz de distancia y el sultado puede ser visualizado mediante la función plot. Veamos como se hace:

vegdist(x, method="bray", diag=FALSE, upper=FALSE) d

method

"ho o untford". diag Calcula la diagonal de la matriz upper Imprime solo la diagonal superior

disímiles que las de zonas diferentes? Como habrán podido notar, y sobre todo si analizamos un gran número de muestras, la visualización de los grupos de muestrpinglés) que aglomera la matriz de (di)similaridad en un gráfico conocido como dendrograma. En esta representación gráfica, las muestras se van uniendo entre sí de una forma jerárquica, comenzando por las mas similares y finalizando por las más disímiles. Pueden consultar el libro de Lengendre y Legendre para información mas detallada sobre este análisis El análisis de cluster (la modalidad más sencilla y utilizada) puede ser hecho mediante la rutina hclust del paquete mvre > plot(hclust(vegdist(datos2,method="jaccard")),hang=-1, + main="Análisis de Cluster", xlab="Muestras", ylab="Disimilariad Jaccard")

Análisis de la estructura de una comunidad pag. 14 de 19 E Klein v 2004_05

Page 15: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

m1

m5

m3

m2

m4

m12 m

8

m11 m

7

m14 m

6

m10 m

9

m13

m20

m15

m19

m17

m16

m18

0.0

0.2

0.4

0.6

0.8

1.0

A n á lis is d e C lu s te r

hc lus t (* , " c o m p le te " )M ue s tra s

Dis

imila

riad

Jacc

ard

Figura 5.Análisis de Cluster de las muestras utilizando el coeficiente de disimilaridad de Jaccard Vamos por partes: El comando utilizado en realidad son tres comandos en uno. Primero calculamos la matriz de distancia de Jaccard (vegdist), después invocamos la rutina hclust para aglomerar las muestras similares y luego graficamos el resultado (plot). El comando hclust tiene varias opciones para aglomerar las muestras y que se basan en la manera cómo consideran las distancias entre los grupos que se van formando. Por defecto, la rutina utiliza la opción complete que se basa en la máxima distancia posible. También se pueden utilizar single la distancia mínima y average la distancia promedio. Utilicen el comando help(hclust) para que tengan información sobre los detalles de la función. En principio, si la estructura obtenida por la aglomeración es robusta, es decir no cambia según el método de aglomeración empleado, podemos estar bastante seguros de que esa es en efecto la clasificación de nuestras muestras. Ahora fíjense en el dendrograma. Este fue obtenido mediante la función plot utilizando como insumo la salida de hclust. Utilizamos la opción hang=-1 para que el gráfico tenga una línea de base en cero (háganlo sin la opción hang para que observen los resultados). El eje vertical muestra los valores de disimilaridad (en este caso Jaccard, que fue el que solicitamos en la función vegdist) y el eje horizontal ubica a las muestras. Mientras mas bajo se encuentre el punto de unión entre dos muestras o grupos de muestras, más similares estas son. Así, las muestras m9 y m13 son las muestras más similares. Como se trata de una clasificación jerárquica, el grupo compuesto por las muestras 9 y 13 se agrupan con la muestra 10 y este grupo a su vez con la 6, y así sucesivamente. Del gráfico puede observarse la clara formación de tres grupos de muestras:

Análisis de la estructura de una comunidad pag. 15 de 19 E Klein v 2004_05

Page 16: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

• Grupo 1: Muestras 1,5,3,2,4 con un nivel máximo de disimilaridad de aprox 0.75. Corresponden a la zona 1.

• Grupo 2: Muestras 12,8,11,7,14,6,10, 9 13, con un máximo de disimilaridad aprox de 0.4.Corresponden a las zonas 2 y 3

• Grupo 3: Muestras 20,15,19,17,16 y 18. Corresponden a la zona 4, a excepción de la muestra 15 que es de la zona 3.

Este análisis confirma en cierta forma lo que hemos estado observando en los análisis previos: parece existir un efecto del gradiente en la composición de las muestras. Las muestras provenientes de la zona 1 son mas similares entre si que entre las muestras de otras zonas. ¿Qué pasa con la muestra 15 que queda ubicada en el grupo 3 y no en el 2 como las otras provenientes de la misma zona? Es una pregunta que ustedes deben responder... Ahora bien, ¿Cuáles especies son las que están presentes en cada grupo de muestras? Esta pregunta es importante desde el punto de vista ecológico ya que pudiera darnos indicios sobre el rol ecológico de ellas frente al gradiente identificado. Para hacer esto, vamos a construir un Cluster de especies, no de muestras. El procedimiento es idéntico al descrito anteriormente a excepción de un paso previo en el cual la matriz ecológica se transpone. La función en R que transpone una matriz t() > datos2t <- t(datos2)

datos2t

m1 m2 m3 m4 m5 m6 m7 m8 m9 m10 m11 m12 spa 21 12 16 0 18 388 349 259 319 315 241 289 spb 203 306 282 480 118 0 0 0 0 0 0 0 spc 155 0 478 0 90 0 0 0 0 0 0 0 spd 362 34 38 87 177 0 0 0 0 0 0 0 spe 0 0 0 0 0 1 1 16 14 30 11 15 spf 0 0 0 0 0 34 54 23 55 43 21 13 spg 0 0 0 0 0 45 95 77 34 46 41 39 sph 0 0 0 0 0 0 0 0 0 0 0 0 spi 0 0 0 0 0 0 0 0 0 0 0 0 spj 0 0 0 0 0 0 0 0 0 0 0 0 spk 0 0 0 0 0 0 0 0 0 0 0 0

m13 m14 m15 m16 m17 m18 m19 m20 318 310 175 153 179 196 178 215 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 12 15 0 0 0 0 0 0 44 75 0 0 0 0 0 0 16 66 0 0 0 0 0 0 0 0 118 403 400 398 225 150 0 0 127 111 98 56 75 90 0 0 305 347 48 437 373 157 0 0 208 200 210 253 222 213

Observen que se han cambiado las filas por las columnas. Ahora realizamos el análisis de Cluster:

Análisis de la estructura de una comunidad pag. 16 de 19 E Klein v 2004_05

Page 17: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

> plot(hclust(vegdist(datos2t,"jaccard"),"complete"),hang=-1, + main="cluster de especies", xlab="especies", ylab="disimilaridad Jaccard") Y el dendrograma obtenido es el representado en la figura 6.

igura 6. Agregación de especies mediante un análisis de cluster utilizando el

olviendo a la matriz de datos para interpretar los resultados del cluster de especies,

inalmente, el módulo mva posee una función interesante que permite visualizar una

ara usar heatmap primero hay que convertir nuestra matriz ecológica en una

x <- as.matrix(datos2) ction(c) vegdist(c,"jaccard"),col=topo.colors(16))

l resultado es la figura 7

spe

spf

spg

spd

spb

spc

spa

spi

spj

sph

spk

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

c lu s te r d e e s p e c ie s

hc lus t (* , " c o m p le te " )e s p e c ie s

disi

mila

ridad

Jac

card

Fcoeficiente de disimilaridad de Jaccard Vnoten como las especies e,f,g están presentes en las muestras de la zona 2 y 3, las especies b,c,d en las de la zona 1 y las especies h,i,j,k en las de las zona 4. La especie a aparece junto al grupo de especies que identifican a la zona 4 ¿Por qué? Fmatriz de datos coloreada en base a los valores del índice de disimilaridad y junto con los clusters de muestras y especies. La función es heatmap() y a veces resulta bien útil para visualizar las relaciones entre las filas y las columnas de una matriz. Pverdadera matriz (sensu strictu R) mediante la función as.matrix(). Después sólo basta especificar la función de distancia, los colores y los ejes. El procedimiento es como sigue: >> heatmap(x, distfun= fun E

Análisis de la estructura de una comunidad pag. 17 de 19 E Klein v 2004_05

Page 18: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

Figura 7. Mapa de calor (heatmap) de los datos de disimilaridad de Jaccard.

spe

spf

spg

spd

spc

spb

spa

spi

spj

spk

sph

m5

m1

m3

m2

m4

m12

m11

m8

m14

m7

m6

m10

m13

m9

m20

m15

m19

m17

m16

m18

Pueden ver como las especies que se agrupan de acuerdo a valores semejantes de

isimilaridad de Jaccard corresponden a muestras que a su vez corresponden a zonas

s robusta, repitan los análisis utilizando iferentes índices de disimilaridad y diferentes métodos de agregación.

dde muestreo en un gradiente predeterminado. Para estar seguros de que la clasificación ed

Análisis de la estructura de una comunidad pag. 18 de 19 E Klein v 2004_05

Page 19: Estructura de las comunidades - Usuarios de prof.usb.veprof.usb.ve/eklein/labeco2/biblio/Estructura de las comunidades.pdf · El interés básico del análisis de la estructura de

Dpto Estudios Ambientales Laboratorio de Ecología 2

Conclusiones El último paso que falta no se puede hacer con ningún paquete de análisis de datos: hay que tratar de explicar el por qué de la clasificación obtenida. Aquí el conocimiento de la ecología de las especies y en especial de sus interacciones con otras especies y con el ambiente mismo que define el gradiente, forman la clave para encontrar una respuesta satisfactoria a esa pregunta. La forma como están dispuestas muchas poblaciones e inclusive muchos de los organismos de una población en el espacio dependen de las estrategias reproductivas, relaciones de competencia o de depredación. Igualmente importante son los límites de tolerancia ante diferentes factores ambientales. No dejen de consultar la bibliografía ya que es posible que algún investigador ya haya analizado el caso en un ambiente similar o análogo. Como habrán visto, todos los análisis realizados no implican una prueba estadística de hipótesis. Estos análisis pueden ser muy útiles para formular hipótesis sobre el por qué están esas especies donde están... entonces propongan ustedes las hipótesis que pudieran derivarse de los análisis. El análisis de cluster es uno de los dos tipos de análisis multivariados empleados en la literatura ecológica. Existen los métodos de ordenación, mucho mas desarrollados y que permiten comparar la estructura de datos comunitarios con la estructura de datos ambientales, establecer relaciones causa efecto entre matrices comunitarias y ambientales o entre dos o mas matrices comunitarias. Sin embargo, esto se escapa del alcance de esta pequeña guía. Un último punto de reflexión: En nuestra matriz ecológica de prueba, ¿Está bien representado el gradiente con las cuatro zonas definidas a priori? ¿Las zonas de muestreo han podido simplificarse? ¿Cómo lo haría de nuevo, si tuvieran que muestrear esta comunidad de vuelta?

Análisis de la estructura de una comunidad pag. 19 de 19 E Klein v 2004_05