Guia Ntsys

307
1 UNIVERSIDAD AUTÓNOMA CHAPINGO COORDINACIÓN DE POSGRADO EN HORTICULTURA “Enseñar la explotación de la tierra, no la del hombre” UNIVERSIDAD DE LEÓN España CURSO INTENSIVO DE POSGRADO: CARACTERIZACIÓN DE RECURSOS GENÉTICOS. 100 horas: 5 créditos MÓDULO I: CARACTERIZACIÓN MORFOLÓGICA Y MOLECULAR. 55 horas: 3 créditos Calendario y horario de impartición del Módulo I. Del 15 al 29 de agosto de 2012 ambos incluidos Las clases son de lunes a viernes de las 16:00 a las 21:00 horas Ponente del Módulo I. Dr. Fernando González Andrés. Departamento de Ingeniería y Ciencias Agrarias. Instituto de Medio Ambiente, Recursos Naturales y Biodiversidad. Universidad de León, León (España).

Transcript of Guia Ntsys

Page 1: Guia Ntsys

1

UNIVERSIDAD AUTÓNOMA CHAPINGO COORDINACIÓN DE POSGRADO EN

HORTICULTURA“Enseñar la explotación de la tierra, no la del

hombre”

UNIVERSIDAD DE LEÓN España

CURSO INTENSIVO DE POSGRADO: CARACTERIZACIÓN DE RECURSOS GENÉTICOS.

100 horas: 5 créditos

MÓDULO I: CARACTERIZACIÓN MORFOLÓGICA Y MOLECULAR. 55 horas: 3 créditos

Calendario y horario de impartición del Módulo I.

Del 15 al 29 de agosto de 2012 ambos incluidos Las clases son de lunes a viernes de las 16:00 a las 21:00 horas

Ponente del Módulo I.

Dr. Fernando González Andrés.Departamento de Ingeniería y Ciencias Agrarias. Instituto de Medio Ambiente, Recursos Naturales y Biodiversidad. Universidad de León, León (España).

Page 2: Guia Ntsys

2

Programa del Módulo I.

INTRODUCCIÓNObjetivos y enfoques de la caracterización de Recursos Genéticos. Caracterización morfológica vs. caracterización molecular. Bases de datos empleadas para la descripción de recursos genéticos.

LECCIÓN 1. Caracterización morfológica del germoplasma vegetal. 1.1. Planteamiento de un trabajo de caracterización morfológica. 1.2. Criterios para la elección de la unidad básica de caracterización. 1.3. Tipos de caracteres y descriptores. Criterios para su elección. 1.4. Normas para realizar muestreos y tamaño de muestra.

LECCIÓN 2. Fundamentos del análisis multivariante y su aplicación al análisis de los resultados de un estudio de caracterización morfológica.

2.1. Concepto y tipos de análisis multivariante. 2.2. Construcción de la matriz básica de datos. 2.3. Estimación de la similitud/disimilitud mediante análisis multivariante. 2.4. Análisis de Componentes Principales: Objetivos. Aplicación. 2.5. Análisis de Agrupamientos: Objetivos. Aplicación. 2.6. Estabilidad y valor discriminante de caracteres. Congruencia de resultados.

LECCIÓN 3. Caracterización con marcadores moleculares. 4.1. Tipos y evolución de los marcadores moleculares. 4.2. Marcadores moleculares – ADN: Tipos de marcadores y sus aplicaciones en la caracterización de germoplasma vegetal. 4.3. Secuenciación de genes como herramienta para la identificación de recursos microbianos.

LECCIÓN 4. Análisis de resultados de un estudio de caracterización molecular. 5.1. Posibles enfoques. 5.2. Análisis de la diversidad genética. 5.3. Análisis de relaciones fenotípicas y filogenéticas.

PRÁCTICAS EN LABORATORIO DE CÓMPUTO. � Registro de caracteres en imágenes digitales con el programa IMAGE TOOL. � Manejo de los programas NTSYS, SPSS y POPGENE. � Aplicación e interpretación del análisis de componentes principales. � Aplicación e interpretación del análisis de agrupamiento. � Obtención de parámetros poblacionales con el programa POPGENE. � Tratamiento de los resultados de secuenciación de genes: Construcción del

“contig” con Chromas y DNAStar, comparación con las secuencias depositadas en las bases de datos y construcción del árbol filogenético con MEGA.

Page 3: Guia Ntsys

3

MÓDULO II: ANÁLISIS ESTADÍSTICOS DE LOS RESULTADOS DE LA CARACTERIZACION.

45 horas; 2 créditos (obligatorio para estudiantes inscritos del Posgrado)

Calendario y horario de impartición del Módulo II.

A concretar.

Ponentes del Módulo II.

Dres. J. Enrique Rodríguez Pérez, Alejandro F. Barrientos Priego, Raúl Nieto Ángel.Instituto de Horticultura, Universidad Autónoma Chapingo

Programa del Módulo II.

LECCIÓN 5. Bases estadísticas para la caracterización. 5.1. Escalas de medición. 5.2. Matrices de datos.5.3. Concepto de distancia multivariada. 5.4. Coeficientes de similitud y disimilitud. 5.5. Criterios para el empleo de coeficientes de similitud y disimilitud. 5.6. Elección de variables informativas.

LECCIÓN 6. Análisis de componentes principales. 6.1. Objetivos y descripción. 6.2. Aplicaciones, ventajas y desventajas.

LECCIÓN 7. Análisis de agrupamiento.7.1. Objetivos y descripción. 7.2. Aplicaciones, ventajas y desventajas. 7.3. Criterios para definir agrupamientos. 7.4. Árbol de consenso.

LECCIÓN 8. Análisis discriminante. 8.1. Objetivos y descripción 8.2. Aplicaciones, ventajas y desventajas 8.3. Definición de variables canónicas.

LECCIÓN 9. ANÁLISIS DE CASOS. 9.1. Se analizarán trabajos de caracterización llevados a cabo por el equipo de

profesores, tanto en México como en España.

Page 4: Guia Ntsys
Page 5: Guia Ntsys

Introducción 1

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Introducción 1 1

INTRODUCCIÓN 1. La caracterización de recursos genéticos. Objetivos y enfoques.

Introducción 1 2

• Caracterizar es establecer un elenco lo más amplio posible de caracteres de un ente animado o inanimado.� Este conjunto de caracteres permitirá�Diferenciarlo de otros entes más o menos similares�Averiguar sus relaciones filogenéticas con otros entes

� En el caso del germoplasma vegetal, un conjunto completo de caracteres debe ser capaz de diferenciar a nivel de:

• Especie • Variedad botánica• Población?• Subpoblación?• Individuo?

• Especie• Variedad botánica• Variedad de cultivo o

cultivar• Clon

Especies con menor grado de domesticación

Especies cultivadas

El concepto de CARACTERIZACIEl concepto de CARACTERIZACIÓÓNN

Introducción 1 3

Germoplasma de

cierta especie

Tipos y técnicas de

caracterización

Problema que resolver

Características intrínsecas

Objetivos de la caracterización

Página 1

Page 6: Guia Ntsys

Introducción 1

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Introducción 1 4

– Sistemática: Clasificación de un organismo. – Conservación y utilización racional del germoplasma, en especial

cultivos olvidados y subutilizados y variedades monoritarias.– Gestión de bancos de germoplasma.– Definición y gestión de variedades comerciales.– Identificación o determinación de la variedad a la que pertenece un

individuo problema.– Mejora vegetal: marcadores útiles.

Objetivos de la caracterizaciObjetivos de la caracterizacióónn

Introducción 1 5

Tipos de caracteres utilizados:• Morfológicos.• Citológicos.• Bioquimicos.

– Compuestos de bajo peso molecular• Flavonoides; Alcaloides; Aminoácidos no proteicos;Aceites

esenciales.– Moléculas proteicas: Proteínas reserva; Isoenzimas.

• Marcadores ADN.• Ecológicos.• Geográficos.• Fisiológicos/Agronómicos• Organolépticos y bioquímicos de los productos consumidos (fruto)

Marcadores ADN.Moléculas proteicas: Proteínas reserva; Isoenzimas.Moléculas proteicas: Proteínas reserva; Isoenzimas.

Marcadores ADN.

Morfológicos.

Enfoques de la caracterizaciEnfoques de la caracterizacióón vegetaln vegetal

MARCADORES MOLECULARES

Introducción 1 6

Página 2

Page 7: Guia Ntsys

Introducción

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Sistemática y Taxonomía

• La sistemática es el estudio científico de las clases, de la diversidad de los organismos y de sus interrelaciones.�Consiste en decidir a qué clase pertenece un organismo,

hasta el momento no clasificado o que se prejuzgue incorrectamente clasificado.

�Deberá estudiarse profundamente la diversidad de la población a la que pertenece el organismo en cuestión, y sus relaciones con otros grupos de organismos

Sistemática y Taxonomía (2)

• La taxonomía es el estudio teórico de la clasificación, incluyendo sus bases, principios, procedimientos y reglas. �Es la disciplina que trata de explicar como se

clasifica.�Estudia las clasificaciones �

De gran utilidad para analizar la variabilidad intra-taxon, variedades de una especie cultivada

Obsoleta

Filogenéticas: Filogenia estudia relaciones evolutivas entre organismos

Tipos de clasificaciones

�Esencialismo�Cladismo�Evolucionismo�Feneticismo

Página 3

Page 8: Guia Ntsys

Introducción

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Esencialismo• “La clasificación no se construye sino que se descubre”• Basado en la lógica Aristotélica: Pre-existe en la naturaleza y

la misión del ser humano es descubrirla.• Postulados básicos:

– Los seres vivos reflejan una serie básica de tipos y formas inmutables– Los organismos miembros de un mismo taxon reflejan la misma

naturaleza esencial– No admite que puede existir variación dentro de un mismo taxon.

Cladismo (Henning, 1966)

• Basada en la secuencia hipotética de la historia evolutiva de los grupos o taxones

• Los únicos grupos que tienen existencia real son los monofiléticos (grupo constituido por todos los descendientes de un antepasado común)

Cladismo (2)

• Cada grupo filético se denomina “linaje” o “clado” (= rama en griego), y los dendrogramas “cladogramas”.

• Caracteres utilizados por el cladismo:– Plesiomórficos (primitivos)�Poco valiosos por aparecer en antepasados del grupo.

– Apomórficos (derivados de los primitivos). �Son los más valiosos por aparecer y evolucionar dentro del grupo.

Página 4

Page 9: Guia Ntsys

Introducción

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Evolucionismo (Eichler, 1875-1878; Engler, 1892)

• Enfoque ecléctico que combina información genealógica (filogenia) con otros criterios:– Grado de diversificación evolutiva desde un antecesor común.– Homogeneidad interna en cada taxon.– Asociación del taxon con un determinado hábitat.– Rango adjudicado al taxon consecuente con su tamaño.– Equivalencia entre las categoría adjudicadas a grupos afines.

�� CladismoCladismo expresa en la clasificación fielmente las ramificaciones del árbol evolutivo y evolucionismoevolucionismo solo trata de se consecuente con él considerando otros criterios.

Feneticismo (Sneath, Michener, Sokal, 1957)

Clasificaciones basadas en un gran número de caracteres

... tomados de todas las partes del cuerpo de un organismo

... de todo su ciclo vital

�No cuestiona la teoría de la evolución, pero excluye en el proceso de la clasificación la información filogenética.

Feneticismo (2)Principios teóricos:1. Clasificación ideal: máximo contenido de información basado

en el mayor número de caracteres posibles.2. Todos los caracteres misma significación e importancia en la

formación de grupos.3. Similitud total entre dos entidades es la suma de la similitud

en cada uno de los caracteres utilizados.4. Se pueden reconocer taxones distintos cuando la correlación

entre caracteres difiere dentro del grupo estudiado.

Página 5

Page 10: Guia Ntsys

Introducción

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Feneticismo (3)5. Las relaciones filogenéticas se pueden obtener de la

estructura taxonómica del grupo y de la correlación de los caracteres cuando se dan ciertas suposiciones acerca de los pasos y mecanismos evolutivos.

6. La taxonomía se considera y se practica como una ciencia empírica.

7. Las clasificaciones se basan en semejanzas fenéticas, independientemente de las consideraciones filogenéticas.

8. El número de taxones establecio en cualquier rango es arbitrario, aunque debe ser coherente con los resultados obtenidos.

Página 6

Page 11: Guia Ntsys

Introducción

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Identificar áreas con:•Mayor diversidad genética•Alelos complementarios

Finalidad conservacionista

• Conocer diversidad genética– Interpoblacional– Intrapoblacional

Conservación y utilización racional del gemoplasma

�Conservación in situ:• Reforzamiento poblaciones.• Creación de reservas.• Estudio del sistema reproductivo.

�Conservación ex situ:• Desarrollo de estrategias de recolección.

Utilización de recursos fitogenéticos

• Estudio de la diversidad genética en poblaciones básicas de partida

Morfológica (descriptores)Molecular (marcadores que ya forman parte de listas de descriptores)

• Identificación de los materiales más distantes genéticamenteSobre los que realizar evaluación agronómica y organoléptica.Germoplasma superior para cruzamientos.

• Identificación del germoplasma con mejores características agronómicas y organolépticas

Conservación y utilización racional del gemoplasma (2).

Página 7

Page 12: Guia Ntsys

Introducción

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

• Evitar duplicados.• Identificar sinonimias (mismo material diferentes nombres).• Identificar homonimias (materiales diferentes mismos

nombres).• Detectar pérdida de diversidad en la población inicialmente

recolectada• Crear la “colección nuclear” (core collection).

Colección más pequeña en la que está representada toda o gran parte de la diversidad de la colección total, con el mínimo de redundancia.

• Detectar variantes somaclonales en los bancos que conservan material in vitro.

Caracterización para la gestión de bancos de germoplasma

Página 8

Page 13: Guia Ntsys

Introducción

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Introducción (1)

Definición de variedad comercial

• Claramente definida por numerosos caracteres de diversa índole

• Distinguible de cualquier otra por estos caracteres

• Suficientemente homogénea para esos caracteres

• Debe mantener estos caracteres en sucesivos procesos de reproducción/multiplicación

“Conjunto de individuos botánicos cultivados que se distinguen por determinados caracteres morfológicos, fisiológicos, citológicos, químicos u otros de carácter agrícola o económico y que, en reproducción sexual o en

multiplicación vegetativa conservan sus caracteres distintivos”

Introducción (1)

......................RV. Protegidas

.................................................. R.V. Comerciales

....................................................................... Certificación

Regulación legal del registro y comercialización de variedades

• Evaluación y caracterización de las variedades previa a la comercialización de sus elementos de reproducción y multiplicación– Protección de obtenciones vegetales– Garantizar que las variedades comercializadas cumplen

requisitos mínimos• Control de los elementos de reproducción que se

comercializan

Introducción (1)

Registro de Variedades Protegidas

• La variedad se somete a ensayos de identificación para demostrar que es:– Nueva– Diferente/Uniforme/Estable (DUE)

�Protección de los derechos de los obtentores

Página 9

Page 14: Guia Ntsys

Introducción

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Introducción (1)

Registro de Variedades Comerciales

• Con carácter general deben superar ensayos:– Identificación: Diferente/Uniforme/Estable (DUE)– Valor agronómico

Introducción (1)

Certificación de semillas

• Para variedades identificadas y aprobadas• Toda semilla certificada debe tener descendencia directa de

material parental auténtico• El proceso de producción y el producto final están sometido a

Inspección y Control oficial• El material vegetal, se somete a

– Comprobación de su identidad para controlar:• Pertenencia a la variedad a que se atribuye• Pureza del material

– Análisis de otras características técnicas de las simientes

Introducción (1)

Ensayos de identificación: Caracteres utilizados

• Fundamentalmente de tipo morfológico, contenidos en la legislación

Porte de la banderolaGlauescenciaVellosidad nudo superiorPigmentación antociánica anterasForma de la espigaVarias cc. de la glumaForma del grano

Porte de la plantaIntensidad pigmentación antociánica aurículas banderola

• ¿Marcadores moleculares?

Ejemplo: Cereales de invierno�Encañado�Espigado�Floración�Maduración�Ahijamiento

Página 10

Page 15: Guia Ntsys

Introducción

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Identificación y determinación• Ubicación de un vegetal en la clase o grupo al que

corresponde, conforme a una clasificación construida previamente.

• Suelen existir “claves” adaptadas a determinados ámbitos.�Están basadas en unos pocos caracteres:

• Claros• Poco plásticos• Necesitan métodos y materiales sencillos

�En general suelen ser caracteres morfológicos*

Página 11

Page 16: Guia Ntsys

Introducción

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

• CONCEPTO DE MARCADOR: Cualquier diferencia fenotípica controlada genéticamente que pueda ser utilizada en el análisis genético.�Ligado a un gen mayor o a un QTL.

• Utilidad e interés de los marcadores en procesos de mejora y selección.

–Selección asistida por marcadores• Introgresión asistida por marcadores.• Desarrollo de líneas puras.• Mejora caracteres cuantitativos.

–Desarrollo de plantas transgénicas.• Introgresión de genes mediante ingeniería genética.• Clonaje posicional.• Mapeo comparativo.

Búsqueda de marcadores útiles en mejora vegetal.

• Naturaleza:–Marcadores morfológicos.�Ej. Tomate: Ausencia antocianina en plántula � resistencia al

TMV.–Marcadores moleculares.�Ej.

Naturaleza de los marcadores de caracteres agronómicos.

Página 12

Page 17: Guia Ntsys

Introducción 2

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 2 1

INTRODUCCIÓN 2. Caracterización morfológica vs. caracterización molecular.

Introducción 2 2

• Morfología vs. morfometría• Niveles

– Macroscópico.– Microscópico.

CaracterizaciCaracterizacióón morfoln morfolóógica.gica.

Introducción 2 3

• Tipos de caracteres morfológicos.– Según su relación con la planta

• Externos – Internos• Embriológicos• Citológicos• Ultraestructurales

– Según sus características intrinsecas• Continuos – Discontinuos• Absolutos – Relativos• Objetivos - Subjetivos• Estables – Inestables• Cuantitativos - Cualitativos

CaracterizaciCaracterizacióón morfoln morfolóógica (2).gica (2).

Página 13

Page 18: Guia Ntsys

Introducción 2

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 2 4

CONCEPTO DE MARCADOR MOLECULAR“Secuencia de ADN o proteína que puede ser fácilmente detectable y cuyo mecanismo hereditario puede ser analizado.”

CaracterizaciCaracterizacióón molecular.n molecular.

Introducción 2 5

Cualidades que deben cumplirlos marcadores moleculares• Polimórficos. • Que sean específicos de un determinado locus.• Heredable y preferentemente con herencia codominante.• Neutro �Las sustituciones alélicas no tengan otros efectos fenotípicos sobre los

que actúe la selección. • Distribución en el genoma amplia o específica: Según objetivos. • Expresión no afectada por el ambiente. • Reproducible entre laboratorios y dentro de un mismo laboratorio.• Fácil, rápido y económico de detectar.

CaracterizaciCaracterizacióón molecular (2).n molecular (2).

Introducción 2 6

Para algunos caracteres necesario completar ciclo vital

Para el análisis suele ser suficiente una pequeña cantidad de tejido vegetal (en MM -ADN de cualquier órgano)

Mayor posibilidad de epistasia o pleiotropía

Mínimo o nulo efecto epistático o pleiotrópico

Con frecuencia caracteres poligénicos

Un solo cistrón implicado (isoenzimas) o un número limitado de bases del ADN (MM)

Importante interacción G x EMM - ADN no afectados por el ambiente

Número limitadoMás abundantes. MM ADN solo limitados por el tamaño del genoma

MORFOLÓGICOS .MOLECULARES.

ComparaciComparacióón caracteres n caracteres morfolmorfolóógicos vs. marcadores moleculares.gicos vs. marcadores moleculares.

Página 14

Page 19: Guia Ntsys

Introducción 2

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 2 7

• Mejores resultados �Integración de caracterización morfológica y molecular.� En definición y gestión de variedades

• Las listas de descriptores están basadas fundamentalmente en caracteres morfológicos y agronómicos, aunque incluyan algunos moleculares.

• Definición legal de variedades (prueba DUE) basada en caracteres morfológicos, aunque está en fase avanzada de estudio el uso de MM - ADN.

• Hay un grupo encargado del estudio técnico y legal para incluir marcadores moleculares: UPOV Working group on Biochemical and Molecular Techniquesand DNA profiling in particular.

• La tendencia actual para identificar variedades de vid: Primero microsatélites, después ampelografía.

� En estudios de sistemática vegetal basados en la filogenia. • Es necesario elegir caracteres de probada herencia filogenética: Caracteres

conservados.• Para esto deben elegirse bien los métodos y los caracteres (no todos valen).

• Ejemplo de marcadores moleculares útiles: Secuenciación del gen ITS.

Mejores resultados �Integración de caracterización morfológica y molecular.Mejores resultados �Integración de caracterización morfológica y molecular.Mejores resultados �Integración de caracterización morfológica y molecular.

¿¿Se ha quedado obsoleta Se ha quedado obsoleta la caracterizacila caracterizacióón morfoln morfolóógica?gica?

Introducción 2 8

�Muy importante para cualquier cultivo.�Se trata de caracteres influidos por el

ambiente, por lo que es necesario ensayos repetidos en diferentes localidades y tratamientos estadísticos de los resultados.

�Algunos ejemplos de caracteres agronómicos:

– Componentes del rendimiento �Producción.

– Adaptación a estrés abiótico: Salinidad, temperaturas altas o bajas, encharcamiento.

– Resistencia natural a plagas o enfermedades.

CaracterizaciCaracterizacióón agronn agronóómica.mica.

Introducción 2 9

�Ejemplo de caracteres organolépticos (cereza):– Crocancia– Jugosidad– Dulzor– ...

�Ejemplo de caracteres boquímicos:– Grados Brix– Acidez total– ....

Sala para catas.

CaracterizaciCaracterizacióón organoln organolééptica y bioquptica y bioquíímica.mica.

Página 15

Page 20: Guia Ntsys

Introducción 2

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 2 10

• Descriptor: Cada uno de los rasgos a describir para la caracterización de una determinada especie.

• Listas de descriptores: – Por cultivos.– Conjunto de descriptores elaborados por los expertos en

cada cultivo, para ser utilizados en ese cultivo.

Descriptor: Concepto.Descriptor: Concepto.

Introducción 2 11

• Bioversity International (CGIAR)/FAO. Antiguo IPGRI e IBPGR.http://www.bioversityinternational.org/?id=3737

• Otras listas de descriptores.– Para determinados cultivos (vid OIV, ...) – Lista de descriptores de pasaporte para cultivos múltiples (DPCM).�Solo contiene información de Pasaporte.�Desarrolladas por Bioversity International para ser compatibles con las listas de

sus descriptores (antiguo IPGRI e IBPGR) y con los descriptores WIEWS – FAO.– UPOV: Guidelines for the conduct of tests for distinctness, uniformity and stability. Ej.

Tejocote http://www.upov.int/en/publications/tg-rom/tg239/tg_239_1.pdf

� Cada lista de descriptores proporciona un formato internacional y un lenguaje universalmente comprensible para almacenar e intercambiar datos referentes a los recursos fitogenéticos.

� Permite intercambio y almacenamiento de información referente a RR.FF. de un modo rápido, confiable y eficiente

Listas de descriptores.Listas de descriptores.

Introducción 2 12

Formato “clásico”. • DATOS DE PASAPORTE:

– Registro de la accesión en el banco de germoplasma.– Información proporcionada por los recolectores. Parámetros que se deberían

observar cuando se recolecta originalmente la accesión.• CARACTERIZACIÓN: Medición o evaluación de aquellos caracteres

que son altamente heredables, que pueden ser fácilmente observados y que se expresan en todas las condiciones ambientales.

Listas de descriptores de BIOVERSITYListas de descriptores de BIOVERSITY

Página 16

Page 21: Guia Ntsys

Introducción 2

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 2 13

Formato “clásico” (2) • EVALUACIÓN PRELIMINAR: Medición o evaluación de un número

limitado de caracteres complementarios y acordados por consenso entre las personas que trabajan con un material vegetal concreto.

• EVALUACION POSTERIOR:– Rendimiento, productividad agronómica, susceptibilidad al estrés

(útiles en la mejora de un cultivo)– Caracteres bioquímicos, citológicos o moleculares.�Muchos de los descriptores de esta categoría son susceptibles a las

variaciones ambientales, por lo que suelen requerir ensayos replicados dilatados en el tiempo.

Listas de descriptores de BIOVERSITY (2)Listas de descriptores de BIOVERSITY (2)

Introducción 2 14

Formato actual• DATOS DE PASAPORTE• DESCRIPTORES DE MANEJO: Proporcionan las bases para el manejo

de accesiones en el banco de germoplasma y ayudan durante su multiplicación / regeneración.

• DESCRIPTORES DEL SITIO Y MEDIO AMBIENTE:– Parámetros específicos del sitio y ambientales donde realizan

pruebas de caracterización y evaluación. Pueden ser importantes para la interpretación de los resultados de esos procesos.

– Descriptores del sitio de recolección del germoplasma (también se incluyen en esta categoría)

Listas de descriptores de BIOVERSITY (3)Listas de descriptores de BIOVERSITY (3)

Introducción 2 15

Formato actual (2)• DESCRIPTORES DE CARACTERIZACIÓN:

– Caracteres altamente heredables, pueden ser fácilmente detectados a simple vista y se expresan igualmente en todos los ambientes.

– Además pueden incluir un número limitado de caracteres adicionales que son deseables según el consenso de los usuarios de un cultivo en particular.

• DESCRIPTORES DE EVALUACIÓN: (Análogo a evaluación posterior en el “formato clásico”).

Listas de descriptores de BIOVERSITY (4)Listas de descriptores de BIOVERSITY (4)

Página 17

Page 22: Guia Ntsys

Introducción 2

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 2 16

DOCUMENTO: De Vicente, C. Metz, T and Alercia, A. 2004. Descriptors for Genetic Markers Technologies. International Plant Genetic Resources Institute. Rome, Italy.�http://www.bioversityinternational.org/nc/publications/publication/iss

ue/descriptors_for_genetic_markers_technologies.html– Definen la información mínima que se necesita para describir la

tecnología de un marcador genético (entendiendo como tales a los marcadores moleculares).

Descriptores BIOVERSITY para marcadores Descriptores BIOVERSITY para marcadores moleculares.moleculares.

Introducción 2 17

Información contenida:1. Identificación del marcador y nombres.

– Universal Marker Identifier (UMI)Es la identificación única de un marcador y nunca debe ser reasignada.

– Nombre canónico del marcador:Este nombre debe incluir información sobre el nombre del marcador, y según corresponda las secuencias de cebadores utilizados, el número de serie de un kit comercial, una combinación de enzimas de restricción, etc.

2. Taxonomía de la especie– Número de accesión del material vegetal a caracterizar en el banco de

germoplasma del que procede.– Sistemática del material vegetal analizado.

Género – Especie – Niveles taxonómicos inferiores.

Descriptores BIOVERSITY para marcadores Descriptores BIOVERSITY para marcadores moleculares (2).moleculares (2).

Introducción 2 18

3. Naturaleza y tipo de los marcadores – Marcadores basados en proteínas

• Isoenzimas• Proteínas de reserva (en las semillas)• Proteínas solubles totales

– Marcadores basados en compuestos metabólicos• Perfiles de polifenoles• Flavonoides• Carbohidratos• Aceites• Otros metabolitos secundarios

Descriptores BIOVERSITY para marcadores Descriptores BIOVERSITY para marcadores moleculares (3).moleculares (3).

Página 18

Page 23: Guia Ntsys

Introducción 2

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 2 19

– Marcadores basados en el ADN• Basados en técnicas de hibridación: RFLP• Que utilizan de alguna manera la reacción de la PCR:

– RAPD– Microsatélites– AFLP– CAPS– EST (no desarrollado explícitamente en el descriptor)– Inter-SSR (no desarrollado explícitamente en el descriptor)– SNPs (no desarrollado explícitamente en el descriptor)– SCAR (no desarrollado explícitamente en el descriptor)– Secuenciación de productos de PCR (no desarrollado explícitamente

en el descriptor)– Marcadores basados en el fenotipo

3. Naturaleza y tipo de los marcadores

Descriptores BIOVERSITY para marcadores Descriptores BIOVERSITY para marcadores moleculares (4).moleculares (4).

Introducción 2 20

4. Condiciones experimentales. Recopila información detallada de acerca de las condiciones técnicas de los procesos de:

• extracción de isoenzimas o ADN• amplificación en el caso de la PCR• electroforesis para la separación de isoenzimas o fragmentos ADN• visualización o revelado.

5. Interpretación de los marcadores.– Isoenzimas:

• Control genético: Número de genes involucrados; número de alelos/gen• Estructura molecular del enzima

– Marcadores moleculares-ADN• Marcador de tamaños moleculares utilizado• Longitud de los productos de amplificación• Número de bandas únicas o alelos obtenidos para los genotipos empleados como

referencia.• Tipo de dominancia: Si el marcador es dominante o codominante

Descriptores BIOVERSITY para marcadores Descriptores BIOVERSITY para marcadores moleculares (5).moleculares (5).

Introducción 2 21

6. Utilización de los resultados.– Fingerprinting (e.g. Identificación duplicados)– Medición de la diversidad o distancia genética– Clasificación taxonómica– Identificación de susceptibilidades al estrés biótico o abiótico.– Localización en el mapa genético.– Marcadores de caracteres de interés– Análisis del sistema reproductivo (porcentajes de alogamia y flujo de genes)

Descriptores BIOVERSITY para marcadores Descriptores BIOVERSITY para marcadores moleculares (6).moleculares (6).

Página 19

Page 24: Guia Ntsys

Introducción 2

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 2 22

TTéécnicas utilizadas en los trabajos de caracterizacicnicas utilizadas en los trabajos de caracterizacióón de n de germoplasma vegetal publicados en el quinquenio 2007germoplasma vegetal publicados en el quinquenio 2007--20122012

Morfología y marcadores moleculares

100

Morfología, marcadores moleculares e

isoenzimas6

Isoenzimas solo10

Morfología solo187

Marcadores moleculares solo

374

Introducción 2 23

TTéécnicas moleculares utilizadas en los trabajos de cnicas moleculares utilizadas en los trabajos de caracterizacicaracterizacióón de germoplasma vegetal publicados en n de germoplasma vegetal publicados en el quinquenio 2007el quinquenio 2007--20122012

0

50

100

150

200

250

300

350

400

Núm

ero

de p

ublic

acio

nes

en e

l SC

I

Micros

atellite

RAPDAFLP

ISSRRFLP

Microa

rray

SRAPDArT

Introducción 2 24

Página 20

Page 25: Guia Ntsys

Introducción 3

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 3 1

INTRODUCCIÓN 3. Las redes y bases de datos de Recursos Fitogenéticos.

Introducción 3 2

Redes de Redes de RR.FFRR.FF..

Tipos de redes:– Para determinados cultivos– Temáticas– Regionales – Interregionales

Introducción 3 3

Redes de Redes de RR.FFRR.FF. (2). (2)Redes por cultivos y temáticas

http://www.ecpgr.cgiar.org/networks.html

Página 21

Page 26: Guia Ntsys

Introducción 3

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 3 4

Redes de Redes de RR.FFRR.FF. (3). (3)Redes por cultivos y temáticas

Introducción 3 5

Redes de Redes de RR.FFRR.FF. (4). (4)

http://www.ecpgr.cgiar.org/networks/inter_regional_coop/pgr_regional_nw_coordinators.html

Redes regionales e interregionales.

Introducción 3 6

Bases de datos de RR. FF.Bases de datos de RR. FF.http://www.ecpgr.cgiar.org/germplasm_databases.html

Página 22

Page 27: Guia Ntsys

Introducción 3

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 3 7

Bases de datos Europea ECP GRBases de datos Europea ECP GR

http://www.ecpgr.cgiar.org/germplasm_databases/central_crop_databases.html

Base de datos europea de cultivos

Introducción 3 8

Bases de datos Bases de datos multimulti--cultivo internacionalescultivo internacionales

http://www.ecpgr.cgiar.org/germplasm_databases/international_multicrop_databases.html

Introducción 3 9

Base de datos WIEWS Base de datos WIEWS

http://apps3.fao.org/wiews/wiews.jsp

Página 23

Page 28: Guia Ntsys

Introducción 3

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 3 10

Base de datos WIEWS (2)Base de datos WIEWS (2)

Introducción 3 11

Base de datos WIEWS (3)Base de datos WIEWS (3)

Introducción 3 12

Base de datos SINGERBase de datos SINGER

http://singer.cgiar.org/

Página 24

Page 29: Guia Ntsys

Introducción 3

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 3 13

Base de datos SINGER (2)Base de datos SINGER (2)

� �

Introducción 3 14

Base de datos SINGER (3)Base de datos SINGER (3)

Introducción 3 15

Base de datos Base de datos European European VitisVitis DatabaseDatabase

http://www.eu-vitis.de/index.php

Página 25

Page 30: Guia Ntsys

Introducción 3

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 3 16

48 descriptores

Base de datos Base de datos European European VitisVitis DatabaseDatabase (2)(2)

Introducción 3 17

Base de datos Base de datos European European VitisVitis DatabaseDatabase (3)(3)

Introducción 3 18

Base de datos Base de datos European European VitisVitis DatabaseDatabase (4)(4)

Página 26

Page 31: Guia Ntsys

Introducción 3

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 3 19

Base de datos Base de datos European European VitisVitis DatabaseDatabase (5)(5)

Para una descripción detallada de cada descriptor:

Introducción 3 20

Base de datos Base de datos European European VitisVitis DatabaseDatabase (6)(6)

Introducción 3 21

Base de datos Base de datos European European VitisVitis DatabaseDatabase (7)(7)

Página 27

Page 32: Guia Ntsys

Introducción 3

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 3 22

Base de datos Base de datos European European VitisVitis DatabaseDatabase ((88))

Introducción 3 23

Base de datos Base de datos European European VitisVitis DatabaseDatabase ((99))

Introducción 3 24

VitisVitis internationalinternational varietyvariety cataloguecatalogue

Página 28

Page 33: Guia Ntsys

Introducción 3

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Introducción 3 25

Página 29

Page 34: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 1

LECCIÓN 1. Caracterización morfológica.

Lección 1 2

Elección Unidad Básica de Caracterización (UBC) Elección caracteres

OBJETIVOS

Biología especie Centro de origen/domesticación

Planteamiento estudio caracterizaciPlanteamiento estudio caracterizacióónn

Lección 1 3

• UNIDADES BASICAS DE CARACTERIZACIÓN (UBC):– Unidades Taxonómicas Operativas (UTOs)– Accesiones – Genotipos– Casos

• CARACTERES:– Variables – Rasgos

Glosario de tGlosario de téérminos utilizados y sinrminos utilizados y sinóónimosnimos

Página 30

Page 35: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 4

Realización del muestreo: Selección de individuos que componen cada U.B.C.

Toma de los datos correspondientes a cada carácter en cada U.B.C.

Evaluación de resultados mediante ANÁLISIS MULTIVARIADO

Semejanza de las UBC (visualización de las relaciones

entre UBC)

Relación entre las variables consideradas

Elección U.B.C. Elección caracteres

Planteamiento estudio caracterizaciPlanteamiento estudio caracterizacióón morfoln morfolóógicogico

Lección 1 5

• El rango taxonómico de las U.B.C. depende del objetivo del estudio.

• Cada U.B.C. está compuesta por un conjunto de individuos.

ElecciEleccióón de las UBCn de las UBC

Lección 1 6

• La homogeneidad interna de las U.B.C. debe ser lo mayor posible– Independientemente de los objetivos establecidos, es

aconsejable realizar una siembra inicial previa para conocer la variabilidad global

– Antes de intentar la caracterización definitiva homogeneizar las UBC de acuerdo con los morfotipos

• Ej: tipo de semilla; tipo de fruto; hábito de crecimiento

ElecciEleccióón de las UBC (2)n de las UBC (2)

Página 31

Page 36: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 7

• La homogeneidad interna de las U.B.C. debe ser lo mayor posibleSoluciones para tratar con la heterogeneidad intrínseca a las UBC:– Utilizar media o moda:

• Media: Caracteres multiestado cuantitativos continuos• Moda:

– Caracteres multiestado cualitativos– Caracteres multiestado cuantitativos discontinuos

– Elegir al azar un organismo de los que componen la UBC (?)

ElecciEleccióón de las UBC (3).n de las UBC (3).

Lección 1 8

• La homogeneidad interna de las U.B.C. debe ser lo mayor posibleSoluciones en caso de heterogeneidad (2):

– Utilizar coeficientes de similitud que tengan en cuenta la variación intra-UBC

– Para caracteres• Doble-Estado• Multiestado cualitativos sin secuencia lógica transformados a doble

estado�Se introduce un tercer valor para el caso de que se manifieste el

carácter en unos individuos y no se manifieste en otros

• Número de U.B.C. que deben utilizarse.

ElecciEleccióón de las UBC (4).n de las UBC (4).

Lección 1 9

DATOS MULTI-ESTADO1. Datos multiestado cualitativos sin secuencia lógica o desordenados2.Datos multiestado cualitativos con secuencia lógica3. Datos multiestado cuantitativos.� Datos multiestado cuantitativos discontinuos� Datos multiestado cuantitativos continuos

DATOS DOBLE ESTADO.1. Datos doble estado presencia-ausencia.2. Datos doble estado excluyentes.

Cualitativos binarios

Cualitativos nominales

Cualitativos ordinales

Cuantitativos discretosCuantitativos continuos

Tipo de caracteres y su codificaciTipo de caracteres y su codificacióónn

Página 32

Page 37: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 10

DATOS DOBLE ESTADO1. Datos doble estado presencia-ausencia

2. Datos doble estado excluyentes

Carácter Estados Codificación

Mucrón en el ápice foliar Presencia de mucrón 1Ausencia de mucrón 0

Carácter Estados CodificaciónAlt. 1 Alt. 2

Tipo de fruto Dehiscente 1 2Indehiscente 0 1

Tipo de caracteres y su codificaciTipo de caracteres y su codificacióón (2)n (2)

Lección 1 11

DATOS MULTI-ESTADO1. Datos multiestado cualitativos sin secuencia lógica o desordenados

a) Posibilidad 1

Carácter Estados Codificación

Superficie de la hoja

Escabrosa 1Estrigosa 2Híspida 3Hirsuta 4Serícea 5Estrellada 6

Tipo de caracteres y su codificaciTipo de caracteres y su codificacióón (3)n (3)

Lección 1 12

b) Posibilidad 2Carácter Estados Codificación

Superficie de la hoja escabrosa Presencia 1Ausencia 0

Carácter Estados CodificaciónSuperficie de la hoja estrigosa Presencia 1

Ausencia 0Carácter Estados Codificación

Superficie de la hoja híspida Presencia 1Ausencia 0

Carácter Estados CodificaciónSuperficie de la hoja hirsuta Presencia 1

Ausencia 0Carácter Estados Codificación

Superficie de la hoja serícea Presencia 1Ausencia 0

Carácter Estados CodificaciónSuperficie de la hoja estrellada Presencia 1

Ausencia 0

Tipo de caracteres y su codificaciTipo de caracteres y su codificacióón (4)n (4)

Página 33

Page 38: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 13

DATOS MULTI-ESTADO (2)2. Datos multiestado cualitativos con secuencia lógica

a) Posibilidad 1.

b) Posibilidad 2.

Carácter Estados Codificación

Presencia de pelosRara 1Común 2Abundante 3

Carácter Presencia pelos rara Presencia pelos común

Presencia pelos abundante

UBC A 1 0 0

UBC B 1 1 0

UBC C 1 1 1

Tipo de caracteres y su codificaciTipo de caracteres y su codificacióón (5)n (5)

Lección 1 14

DATOS MULTI-ESTADO (3)3. Datos multiestado cuantitativos.

• Datos multiestado cuantitativos discontinuos� Ej. Número de pétalos

• Datos multiestado cuantitativos continuos� Ej. Longitud de los pétalos

a) Posibilidad 1.Poner el número correspondiente

Tipo de caracteres y su codificaciTipo de caracteres y su codificacióón (6)n (6)

Lección 1 15

b) Posibilidad 2. Transformación a caracteres binarios.Ej. Discontinuo: Número de pétalos

Carácter Estados Codificación

De 2 a 4 pétalos Presencia 1Ausencia 0

Carácter Estados Codificación

De 5 a 7 pétalos Presencia 1Ausencia 0

Carácter Estados CodificaciónDe 8 a 10 pétalos Presencia 1

Ausencia 0

Tipo de caracteres y su codificaciTipo de caracteres y su codificacióón (7)n (7)

Página 34

Page 39: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 16

Ej. Continuo: Longitud de los pétalos

Carácter Estados Codificación

De 2 a 3,99 cmPresencia 1Ausencia 0

Carácter Estados Codificación

De 4 a 5,99 cm Presencia 1

Ausencia 0

Carácter Estados CodificaciónDe 6 a 8 cm Presencia 1

Ausencia 0

Tipo de caracteres y su codificaciTipo de caracteres y su codificacióón (8)n (8)

Lección 1 17

c) Posibilidad 3. Transformación a caracteres multiestado cualitativos con secuencia lógica.

Ej. Discontinuo: Número de pétalos

5De 4 a 5,99 cm7De 6 a 8 pétalos

3De 2 a 3,99 cmLongitud del pétalo

CodificaciónEstado Carácter

5De 5 a 7 pétalos7De 8 a 10 pétalos

3De 2 a 4 pétalosNúmero de pétalos

CodificaciónEstado Carácter

Ej. Continuo: Longitud de los pétalos

Tipo de caracteres y su codificaciTipo de caracteres y su codificacióón (9)n (9)

Lección 1 18

• Determinación de homologías– Los caracteres que se van a medir en las diferentes U.B.C. deben de ser

homólogos.– El feneticismo acepta la utilización de la “homología operativa”

• Criterios a la hora de seleccionar caracteres– Deben de excluirse los siguientes tipos de caracteres:

• Caracteres sin sentido biológico• Caracteres relacionados lógicamente• Caracteres invariables en las U.B.C. en estudio

– En los caracteres multiestado cuantitativos continuos son más estables lasmedidas relativas que las absolutas

• Importancia de los diferentes caracteres.• Número de caracteres a utilizar.

ElecciEleccióón de los caracteres (aplicado a plantas)n de los caracteres (aplicado a plantas)

Página 35

Page 40: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 19

Cualitativos.• Estípulas (Presencia/Ausencia)• Simple / Compuesta.• Color de haz, envés y nervios.• Forma del limbo.• Forma y/o características de ciertos senos si los hubiera• Tipo de margen del limbo.• Forma del perfil del limbo (Plano/Alabeado).• Presencia / Ausencia de dientes en determinados puntos singulares.• Forma de los dientes si los hubiera.• Presencia / Ausencia de pelos en determinados puntos singulares.Cuantitativos.• Número de foliolos si fuera compuesta

�Peciolo�Densidad de pelos.�Longitud.�Anchura (si es alado).

• Limbo. �Número de lóbulos.� Número de dientes en lugares singulares si los hubiera.� Densidad de pelos.� Longitud.� Anchura.� Superficie.� Factores de forma. � Distancias entre determinados puntos singulares.� Longitud / Anchura de estructuras (dientes, senos, uñas ...).� Longitud de determinados nervios / Distancias entre nerviaduras.

• Ángulos.� De los márgenes del limbo.� Entre nervios.� De apertura de determinados senos.

Cualitativas• Hipocótilo/Epicotilo

�Características fisiológicas: Desarrollo hipocotilo.�Pigmentación.�Presencia / Ausencia de

pelos• Cotiledones.

�Características del desarrollo.�Consistencia.�Otros equivalentes a los

indicados para hojas adultas.• Eofilos.

�Filotaxia.�Otros equivalentes a los

indicados para hojas adultas.Cuantitativos• Hipocotilo / Epicotilo

�Longitud.�Densidad de pelos.

• Cotiledones y EofilosCaracteres equivalentes a los indicados para hoja adulta

Cualitativos• Testa

� Patrón � Color.

• Presencia de determinadas estructuras (Por ejemplo arilo).

• Forma.• Presencia de costillas.

Cuantitativos.• Peso.• Número de costillas si las hubiera.• Longitud.• Anchura.• Espesor.• Superficie proyectado.• Ángulos (por ejemplo ángulo del

hilo)• Diámetro en las de forma

redondeada.• Factores de forma.• Distancias entre determinados

puntos singulares.• Longitud / Anchura / Factores de

forma de determinadas estructuras singulares (vgr. Hilo)

HOJASPLÁNTULASSEMILLAS

Lección 1 20

Cualitativos.• Tipo de fruto.• Formas.

�General.�De la sección.�Curvaturas.

• Exocarpo/Mesocarpo/Endoca�Color.�Textura..�Sabores especiales.�Presencia/Ausencia de semillas.�Presencia de costillas en el endocarpo.

Cuantitativos.• Pedúnculo.

�Densidad de pelos.�Longitud.�Anchura (si es alado).

• Ovario fecundado y maduro.�Peso.�Exocarpo: Densidad de pelos.�Endocarpo: Número de costillas�Longitud.�Anchura.�Espesor.�Superficie proyectada.�Ángulos.�Diámetro en los de forma redondeada.�Factor de forma.�Cuando las hojas carpelares mantengan su aspecto

de hoja, caracteres similares a hojas.

Cuantitativos.• Longitud inflorescencia completa.• Estambres.

�Número de estambres.�Anteras: Caracteres equivalentes a

los indicados en semillas.�Filamentos: Longitud.

• Gineceo.�Número de carpelos.�Radio de curvatura del estilo.�Caracteres equivalentes a los

indicados en los frutos.• Pétalos/ sépalos.

Caracteres equivalentes a los indicados para hoja adulta.

• Cáliz completo.Longitud / Anchura de labios y senos.

• Brácteas. Otros caracteres equivalentes a los

indicados para hoja adulta. • Pedúnculo.

�Densidad de pelos.�Longitud.�Anchura (si es alado).

Cualitativos.• Tipo de inflorescencia.• Estambres.

�Color de filamentos / anteras.�Fusión filamentos.

• Gineceo.�Color.�Fusión carpelos.

• Cáliz.�Color.�Fusión sépalos.

• Corola.�Color de cada pétalo.�Fusión pétalos.

• Pétalos y Sépalos.Caracteres equivalentes a los

indicados para hoja adulta. • Brácteas.

Caracteres equivalentes a los indicados para hoja adulta.

• Pedúnculo

FRUTOSFLORES

Lección 1 21

• Porte.• Tipo de ramificación.• Raíces: De reserva, pivotantes, adventicias

Cualitativos.• Presencia / Ausencia de pelos.• Pigmentación.• FilotaxiaCuantitativos.• Longitud media entrenudos.• Densidad de pelos en nudos / entrenudos.

PLANTA COMPLETATALLOS.

Página 36

Page 41: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 22

• Recolección de todas las U.B.C. en condiciones ambientales homogéneas.

• Identificación inequívoca del órgano concreto a estudiar, para que sea el mismo en todos los individuos (misma posición relativa en la planta).

• Conservación de las muestras en condiciones que no alteren sus características morfológicas � Correcta herborización.

Normas para la realizaciNormas para la realizacióón del muestreon del muestreo

Lección 1 23

• Número de observaciones para que el descriptor represente la muestra del taxon en estudio.

• Número de individuos por U.B.C.• Número de determinaciones por individuo.

• Factor determinante del tamaño de muestra � uniformidad interna�Es necesario haber realizado estudios previos sobre la variabilidad existente en

el taxon para no subestimar el tamaño de la muestra (p.e. no basar el estudio en una única población excesivamente homogénea).

• Factores que influyen en la uniformidad de la muestra y por tanto en el tamaño de la misma:

– Origen del germoplasma: silvestre vs. germoplasma cultivado.– Sistema reproductivo predominante la especie (Alógama vs. Autógama).

TamaTamañño de la muestrao de la muestra

Lección 1 24

• Criterios para elegir el tamaño de la muestra:

– Aplicar la ecuación

• CV: Porcentaje de variación asociado con el descriptor que se considere más variable dentro de la colección (datos de investigaciones previas o bibliográfico).

• E%: Error permisible expresado como porcentaje de la media verdadera: Diferencia que se espera entre la media muestral y lamedia verdadera del descriptor (�), expresada como porcentaje de la media verdadera con un nivel de confianza de 95%

TamaTamañño de la muestra (2)o de la muestra (2)

Página 37

Page 42: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 25

�Ejemplos de aplicación.

TamaTamañño de la muestra (3)o de la muestra (3)

Lección 1 26

• Criterios para elegir el tamaño de la muestra (2):– Determinar “por tanteo” el número de individuos por U.B.C.

El criterio a utilizar es que el Coeficiente de Variación para cada carácter sea menor o igual al x%; valor recomendado con carácter general x=12.

TamaTamañño de la muestra (4)o de la muestra (4)

Lección 1 27

• Caracteres morfológicos.– Descripción y anotación en estadillos.

– Mínimo 2 personas para reducir subjetividad operador.

Toma de datosToma de datos

Página 38

Page 43: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 28

• Caracteres morfométricos.– Análisis de imagen informatizado.

• Sistema de captación de imágenes.

• Software de análisis de imagen.

– Mediciones:

� Automáticas: Previa binarización de la imagen.

� Manuales.

– Almacenamiento de datos en formato hoja de cálculo y análisis estadístico.

Toma de datos (2)Toma de datos (2)

Lección 1 29

Lección 1 30

• Mediante el uso de estadísticos simples para estimar y describir el comportamiento de las diferentes UBC en relación con cada carácter:– Media aritmética.– Rango de variación o amplitud total: Diferencia entre el valor

máximo y mínimo de cualquier variable sobre el conjunto de accesiones estudiadas.

– Desviación estándar: Cuantifica la magnitud de la variación respecto de la media aritmética.� En las mimas unidades que las observaciones originales.

– Coeficiente de variación: Medida relativa de variación.� Es independiente de las unidades de medida. Permite la

comparación de la variabilidad entre accesiones y entre caracteres.

AnAnáálisis preliminar de resultadoslisis preliminar de resultados

Página 39

Page 44: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 31

AnAnáálisis preliminar de resultados (2)lisis preliminar de resultados (2)

Lección 1 32

• Estimación de la fracción de la variabilidad observada en los caracteres morfológicos, que se debe al efecto de los genes vs. la debida al efecto ambiental

� Mediante la medición de la repetibilidad de los valores que toma el carácter morfológico en diferentes ambientes.

Es necesario haber realizado la caracterización en diferentes ambientes � siembra y evaluación del material en diferentes localidades

AnAnáálisis preliminar de resultados (3)lisis preliminar de resultados (3)

Lección 1 33

• Estimación de la fracción de la variabilidad debida al efecto genético (2)

• �2u: varianza genotípica entre las UBC

• �2ue: varianza de la interacción entre UBC y el ambiente

• �2: varianza del error experimental

Interpretación del valor de �:– H próximo a 1: Heredabilidad alta: La medida

entre accesiones tiene más expresión genética que efecto del ambiente e interacciones.

– H << 1: Heredabilidad baja: Existe efecto del ambiente sobre la expresión del carácter.

Ejemplo de Phaseolus vulgaris L.

222

2

����

���

ueu

uH

AnAnáálisis preliminar de resultados (4)lisis preliminar de resultados (4)

Página 40

Page 45: Guia Ntsys

Lección 1

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 1 34

Página 41

Page 46: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 1

LECCIÓN 2. Análisis Multivariado en el tratamiento de resultados de caracterización morfológica

Lección 2 2

• Definición de métodos multivariados: Son métodos estadísticos que analizan simultáneamente más de dos variables de un individuo

• Definición de métodos multivariados, particularizado a la caracterización de RR.FF.: Conjunto de métodos de análisis de datos que tratan un gran número de mediciones sobre cada accesión del germoplasma.

MMéétodos de antodos de anáálisis multivariado.lisis multivariado.

Lección 2 3

– Cuantificar las relaciones entre UBC. – Representar geométricamente las UBC.– Clasificarlas respecto a un conjunto de variables.

Objetivos de un análisis multivariado aplicado a la caracterización de material vegetal:

MMéétodos de antodos de anáálisis multivariado (2).lisis multivariado (2).

Página 42

Page 47: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 4

– Métodos de ordenación.Permiten:

• Explicar la mayor parte de la variabilidad total existente en la muestra, en un número reducido de dimensiones.

• Representar el material en estudio en ese número reducido de dimensiones.– Análisis de agrupamiento, clasificación o cluster. Permiten la búsqueda de grupos

similares lo más homogéneos posible para clasificar los elementos en estudio.

Clasificación de los métodos de análisis multivariado

MMéétodos de antodos de anáálisis multivariado (3).lisis multivariado (3).

Lección 2 5

Análisis factorial de correspondencias (AFC)

Análisis de coordenadas principales (ACOORP)

Análisis discriminante canónico (ADC)

Análisis discriminante (AD)

• Técnicas exclusivas vs. no exclusivas.• Técnicas jerárquicas vs. no jerárquicas.• Técnicas aglomerativas vs. divisivas• Técnicas secuenciales vs. simultáneas

Análisis de Componentes Principales (ACP)

Análisis de agrupamientoMétodos de ordenaciónexclusivasjerárquicasaglomerativassecuenciales

Análisis de Componentes Principales (ACP)

MMéétodos de antodos de anáálisis multivariado (4).lisis multivariado (4).

Lección 2 6

• Técnicas dirigidas por las variables: Técnicas que se enfocan primordialmente en las relaciones que podrían existir entre las variables respuesta que se están midiendo

• Técnicas dirigidas por los individuos:Se interesan principalmente en las relaciones que podrían existir entre las unidades experimentales (UBC) que se están midiendo, o en ambos.

variablesindividuosindividuosvariablesTécnica dirigida por ...ClusterADCADACPTécnica �

Otra clasificación de los métodos de análisis multivariado

MMéétodos de antodos de anáálisis multivariado (5).lisis multivariado (5).

Página 43

Page 48: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 7

• De dependencia: Una variable o conjunto de variables es identificado como dependiente de otro conjunto conocidas como independiente o predictor.

• De interdependencia: Ninguna variable o grupo de variables es definido como independiente o dependiente y, el procedimiento implica en análisis simultaneo de todo el conjunto de variables.

interdependenciadependenciadependenciainterdependenciaTipoClusterADCADACPTécnica �

Otra clasificación (2) de los métodos de análisis multivariado

MMéétodos de antodos de anáálisis multivariado (6).lisis multivariado (6).

Lección 2 8

sinonosiVerificación de agrupamientosnosinosiReducción de la dimensionalidad

posiblenonosiCribado de datosnononosiExploración relaciones entre variables

sisisinoPredicción de ser miembro de un gruponosinosiCreación de nuevas variables

ClusterADCADACPTipo de problema

nononoposibleComparación de grupos de variables

Tipos de problemas que resuelven cada uno de los métodos de análisis multivariado más utilizados en caracterización de material vegetal .

MMéétodos de antodos de anáálisis multivariado (7).lisis multivariado (7).

Lección 2 9

Tipos de variables a las que se aplica cada método de análisis .

ADC

Cualitativas o cuantitativasCluster

CualitativasACOORP

Variable dependiente categórica e independientes cuantitativas

ADCuantitativasACP

Tipo de variablesMétodo

MMéétodos de antodos de anáálisis multivariado (8).lisis multivariado (8).

Página 44

Page 49: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 10

•Análisis de componente principales (ACP). Herramienta para cribar datos de variables múltiples. Permite reducir la dimensionalidad. Se pueden identificar, de las variables originales, cuales son las que más influyen en

la separación de las UBC. A partir de un conjunto de variables correlacionadas se crea un nuevo conjunto de

variables no correlacionadas (CP) Sobre los CP se pueden proyectar las UBC y el operador puede definir

agrupamientos

•Análisis de agrupamientos, clasificación o cluster.– Se utiliza para clasificar las UBC en subgrupos definidos de manera única.

RESUMEN DE LOS MÉTODOS DE ANÁLISIS MUTIVARIADOS UTILIZADOS EN CARACTERIZACIÓN DE MATERIAL VEGETAL.

MMéétodos de antodos de anáálisis multivariado (9).lisis multivariado (9).

Lección 2 11

– Se utiliza para clasificar UBC en dos o más grupos definidos de manera única (variable dependiente categórica o no métrica) a partir de variables independientes métricas o cuantitativas.

– El análisis discriminante canónico (ADC) crea nuevas variables que contienen toda la información útil para la discriminación de la que se dispone en las variables originales.

– Las nuevas variables conducen a reglas más sencillas para clasificar las UBC en los diferentes grupos.

– Se diferencia del análisis de agrupamientos en que en el AD desde un principio se sabe cuántos grupos existen y se tienen datos que provienen de cada uno de estos grupos, y en el cluster se usan técnicas que que producen clasificaciones a partir de datos que inicialmente no están clasificados.

RESUMEN DE LOS MÉTODOS DE ANÁLISIS MUTIVARIADOS UTILIZADOS EN CARACTERIZACIÓN DE MATERIAL VEGETAL (2)

•Análisis discriminante (AD) (módulo II).

MMéétodos de antodos de anáálisis multivariado (10).lisis multivariado (10).

Lección 2 12

� Cuando el análisis multivariado del estado de los caracteres en individuos, se utiliza para averiguar la afinidad o similitud entre unidades taxonómicas y para agrupar estas unidades en taxones, se habla de “Taxonomía numérica”(Sneath y Sokal, 1973),

... y a las Unidades Básicas de Caracterización se les denomina Unidades Taxonómicas Operativas (UTO)

� Pero en muchos análisis multivariados el objetivo no es delimitar taxones ni analizar la afinidad o similitud entre unidades taxonómicas para plantear una revisión de la sistemática de un taxon (género o especie)

... sino analizar (cuantificar y visualizar) la similitud entre accesiones de germoplasma

� Por eso no conviene generalizar la denominación de taxonomía numérica.

Concepto de taxonomConcepto de taxonomíía numa numéérica.rica.

Página 45

Page 50: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 13

Construcción de la Matriz Básica de Datos

Estimación del parecido: Similitud

Construcción de la matriz de similitud que corresponda

Aplicación de la técnica correspondiente

Toma del valor de cada carácter en cada UBC

U.B.C. Caracteres o descriptores

Pasos elementales en un estudio Pasos elementales en un estudio multivariantemultivariante de de datos de caracterizacidatos de caracterizacióón vegetal: ACP y clustern vegetal: ACP y cluster

Lección 2 14

•FILAS: U.B.C. (recomendado) ó Caracteres•COLUMNAS: Caracteres (recomendado) o U.B.C.

ConstrucciConstruccióón de la MBD.n de la MBD.

Lección 2 15

Para los caracteres multi-estado cuantitativos continuos donde coexisten diferentes escalas de medida en relación a la misma U.B.C.

baX

X ijij

�'

Xij es el valor del carácter i para la U.B.C. ja: Puede tomar diferentes valores. b: Puede tomar diferentes valores.

Si a= media del carácter i; b= desviación estándar del carácter i se denominan puntuaciones Z (distribución normal estándar)

• Realizar transformaciones logarítmicasLog10 Xij; Log10 (Xij + 1)

• Procedimiento más utilizado: Estandarización.

ReducciReduccióón de valores a una sola escala.n de valores a una sola escala.

Página 46

Page 51: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 16

• Coeficientes de similitud/disimilitud.– Permiten conocer la similitud o su complementario (disimilitud) de

cada par posible de U.B.C. o caracteres (según corresponda) en una matriz básica de datos.

• Clasificación de los coeficientes de similitud/disimilitud. – Coeficientes de distancia.– Coeficientes de correlación.– Coeficientes de asociación.

EstimaciEstimacióón de la Similitud/Disimilitud.n de la Similitud/Disimilitud.

Lección 2 17

UBC-

UBC-

UBC-

UBC-

• M.B.D. Doble estado; Multiestado; Mixta.• CONCEPTO (explicado para el caso de que se calculen las distancias

fenéticas entre U.B.C.):– Se basa en un espacio fenético de n dimensiones (=caracteres).

– Las U.B.C. se sitúan en ese espacio fenético en función del valor que tenga en cada uno de los Caracteres.

– Las diferencias entre las U.B.C. según los coeficientes de distancia, son proporcionales a la distancia a la que se encuentran en el espacio.

Coeficientes de distancia.Coeficientes de distancia.

Lección 2 18

• TIPOS DE COEFICIENTES DE DISTANCIA.

0

Multi – estadoMixtos

Mean character difference

Específicamente utilizado para mixtos

Taxonomic distance

Gower

Average manhattan distance

Euclidean distance

Chi – square

MAXIMA SIMILITUD

MINIMA SIMILITUD

TIPO DE DATOS SOBRE LOS QUE

SE APLICA

FORMULANOMBRE

21 �

��

���

��

kj

kj

i

ki

kij x

xxx

xd

� �2 �k kjkiij xxE

�k kjkiij xx

nM 1

� �21 �

k kjkiij xxn

E

� �21 �

k kjkiij xxn

E

k ijk

k ijkijkij w

sws

Coeficientes de distancia (2).Coeficientes de distancia (2).

Página 47

Page 52: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 19

• TIPOS DE COEFICIENTES DE DISTANCIA (2).– Caso particular: Coeficiente de Crovello, que tiene en cuenta la

variación dentro de cada U.B.C.

Xki: Media del carácter k para la O.T.U. i Ski: Desviación estándar del carácter k para la O.T.U. i.

Xkj: Media del carácter k para la O.T.U. j Skj: Desviación estándar del carácter k para la O.T.U. j.

� � � �� �2122

1kjkikjki

n

kSSXXCD ��

Coeficientes de distancia (3).Coeficientes de distancia (3).

Lección 2 20

UBC-

UBC-

• M.B.D. Multiestado cuantitativos; Mixtos ( con abundancia de multiestadocuantitativos)

• CONCEPTO (explicado para el caso de que se calculen las distancias fenéticasentre U.B.C.):

– Los caracteres dos a dos constituyen un espacio bidimensional

– Las U.B.C. se sitúan en ese espacio bidimensional, trazando las líneas que partiendo del origen de coordenadas pasan por las U.B.C.

– Las diferencias entre las U.B.C. según los coeficientes de correlación son proporcionales a los ángulos que forman esas líneas.

Coeficientes de correlaciCoeficientes de correlacióón.n.

Lección 2 21

• TIPOS DE COEFICIENTES DE CORRELACIÓN.

El signo indica el tipo de asociación (+) si es directa o (-) si es inversa.

Coeficientes de correlaciCoeficientes de correlacióón (2).n (2).

Página 48

Page 53: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 22

• M.B.D.: Datos doble-estado; *algunos permiten datos multiestadocualitativos sin secuencia lógica.

• CONCEPTO (explicado para el caso de que se calculen las distancias fenéticas entre U.B.C.):

– A veces se denomina índice de similitud.– La comparación de los U.B.C. para un carácter doble-estado tiene cuatro

posibilidades:• Que ambas tengan presente el carácter• Que ambas tengan ausente el carácter• Que esté presente en la 1ª y ausente en la 2ª• Que esté ausente en la 1ª y presente en la 2ª

– Los coeficientes están basados en el número de veces que se repita, entre cada dos U.B.C. cada uno de los sucesos anteriores

Coeficientes de asociaciCoeficientes de asociacióón.n.

Lección 2 23

• TIPOS DE COEFICIENTES DE ASOCIACIÓN.

*

*

*

UBC-

UBC-

UBC-

UB

C-

Coeficientes de asociaciCoeficientes de asociacióón (2).n (2).

Lección 2 24

• La elección depende del tipo de datos que contiene la M.B.D.

�En aquellos estudios en los que predominan los caracteres doble-estado, conviene transformar los datos multiestado restantes en datos doble-estado y utilizar coeficientes de asociación.

�En aquellos estudios en los que predominan los caracteres multiestado cuantitativos es aconsejable la estandarización y la utilización de coeficientes de distancia y correlación.

ElecciEleccióón del tipo de coeficiente.n del tipo de coeficiente.

Página 49

Page 54: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 25

• Matriz diagonal constituida por los coeficientes de similitud/disimilitudentre todos los pares posibles de U.B.C. o caracteres, según la dirección de análisis

UBC

UB

C

Matriz de similitud/disimilitud.Matriz de similitud/disimilitud.

Lección 2 26

• Matriz de similitud.– Valores 0 � |x| � 1.

Matriz de similitud /disimilitud (2).Matriz de similitud /disimilitud (2).

Lección 2 27

• Matriz de disimilitud (distancia).– Valores 0 � x � �.

Matriz de similitud / disimilitud (3).Matriz de similitud / disimilitud (3).

Página 50

Page 55: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 28

• El ACP es una técnica de Análisis Factorial (AF).• El AF sirve para encontrar grupos de variables, a partir de un conjunto

numeroso de variables (=caracteres).� Cuando tomamos información de un gran número de variables de forma

simultánea, podemos preguntarnos si se agrupan de forma característica a partir de los resultados de las mediciones.

� Aplicando un AF a los datos podemos ser capaces de encontrar grupos de variables con significado común, y reducir así el número de dimensiones necesarias para explicar la variabilidad existente.

ReducciReduccióón de datos mediante Ann de datos mediante Anáálisis lisis Componentes Principales (ACP).Componentes Principales (ACP).

Lección 2 29

• El ACP representa según un modelo lineal, un conjunto numeroso de variables originales(=caracteres) mediante un número reducido de variables hipotéticas, llamadas Componentes Principales.

• El número máximo de Componentes es igual o menor al número de variables originales.• Características fundamentales de los Componentes Principales:

– Son ortogonales entre si – No están correlacionados entre ellos– Cada componente contiene información de todos los caracteres en diferentes proporciones.

• Primer componente es el que recoge mayor variabilidad.• De la variabilidad restante, el segundo es el que incluye más de ésta ...

ReducciReduccióón de datos mediante ACP (2).n de datos mediante ACP (2).

Lección 2 30

• Explicación intuitiva de la génesis de los C.P. para dos caracteres.– Representación de las U.B.C. con respecto a dos caracteres correlacionados.– Estandarización de los caracteres y nueva representación de las U.B.C– Máxima separación entre las U.B.C. en una sola dimensión � Proyección sobre una línea.– Las líneas de proyección son los C.P. y corresponden con los ejes mayor y menor de la

elipse definida por la nube de puntos correspondientes a las U.B.C.� Si tres caracteres elipsoide en lugar de elipse.

UBC-

UBC-

UBC-

UBC-UBC-

UBC-UBC-

UBC-

UBC H

UBC C

UBC DUBC E

UBC B

UBC GUBC F

UBC A

UBC H

UBC C

UBC D

UBC E

UBC B

UBC GUBC F

UBC A

ReducciReduccióón de datos mediante ACP (3).n de datos mediante ACP (3).

Página 51

Page 56: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 31

• En un caso general los C.P. se reconocen porque las distancias cuadráticas de las U.B.C. con respecto a ellos es mínima.

• Reconocimiento de los C.P. desde el punto de vista matemático: • Cálculo de la matriz de correlación entre caracteres.• Matriz de varianza-covarianza cuando los caracteres estén originalmente

expresados en la misma unidad de medida.� A partir de las interrelaciones exhibidas por la matriz de correlación y mediante

transformaciones matemáticas se construye un nuevo conjunto de variables denominados C.P.

• En general para explicar un porcentaje alto de la variabilidad total se necesitarán más de 3 dimensiones que no pueden visualizarse, pero se les puede aplicar el tratamiento matemático.

ReducciReduccióón de datos mediante ACP (4).n de datos mediante ACP (4).

Lección 2 32

1. Cálculo de una matriz que contenga la variabilidad conjunta de todas las variables (=caracteres).

2. Extracción del número óptimo de Componentes Principales (C.P.)3. Obtención e interpretación de la matriz de componentes o matriz de

estructura factorial.4. Rotación de la solución factorial y repetición de los puntos 2 y 3 para

la solución rotada.5. Estimación de las puntuaciones de las U.B.C. sobre las nuevas

variables (=Componentes Principales) y proyección de aquellas sobre éstas � Sirve para visualizar las relaciones entre las UBC

Pasos en la aplicaciPasos en la aplicacióón de la tn de la téécnica ACP.cnica ACP.

Lección 2 33

•OPCIÓN A:– Estandarización � Para expresar todas las variables en la misma escala.– Calculo de la matriz de similitud entre las variables (es la matriz de correlación de

caracteres).•OPCIÓN B:

– Obtener una matriz de varianzas – covarianzas: Se da mayor peso a las variables que presentan varianzas más altas.

� Es necesario que las variables hayan sido medidas en unidades homogéneas. � Ej. estudio morfométrico convencional: Hacer una transformación de logaritmo

decimal

PASO 1: Cálculo de una matriz que contenga la variabilidad conjunta de todas las variables (=caracteres)

Pasos en la aplicaciPasos en la aplicacióón de la tn de la téécnica ACP (2).cnica ACP (2).

Página 52

Page 57: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 34

� El método extrae tantos CP como variables iniciales (=caracteres) queexplicarán el 100% de la varianza.

� Sin embargo para conseguir el objetivo reducir el número de dimensiones necesarias para explicar los datos, es necesario seleccionar un número de CP menor al número de variables iniciales.

PASO 2. Extracción del número óptimo de Componentes Principales (CP)

Pasos en la aplicaciPasos en la aplicacióón de la tn de la téécnica ACP (3).cnica ACP (3).

Lección 2 35

La información necesaria para decidir el número óptimo se encuentra en la tabla de varianzas explicadas por el análisis que incluye la siguiente información:

– Eigen-Valores (=autovalores; =valores propios) de cada CP:� Es la sumatoria de las varianzas de todos los caracteres para dicho CP� La varianza de un carácter para un determinado CP es el cuadrado de la

contribución de un carácter para un componente. � Los Eigen-Valores son diferentes para cada componente. El componente

con mayor Eigen-Valor será el primero y así sucesivamente, ...– Porcentaje de la variación total que representa cada CP.– Porcentaje de la variación total acumulada en cada CP.

PASO 2. Extracción del número óptimo de CP (2)

Pasos en la aplicaciPasos en la aplicacióón de la tn de la téécnica ACP (4).cnica ACP (4).

Lección 2 36

El Gráfico de sedimentación presenta gráficamente los eigen-valores de los CP, y facilita la determinación el número óptimo de factores (CP).

PASO 2. Extracción del número óptimo de CP (3)Comp, Eigenvalor % variación

Variación acumulada

1 14,054 35,134 35,1342 10,747 26,868 62,0023 5,284 13,211 75,2134 2,473 6,182 81,3945 1,703 4,257 85,6516 1,553 3,882 89,5337 0,999 2,498 92,0318 0,691 1,728 93,7599 0,551 1,378 95,137

10 0,535 1,338 96,47511 0,428 1,07 97,54512 0,239 0,597 98,14213 0,168 0,42 98,56214 0,141 0,353 98,91415 0,117 0,293 99,20716 0,083 0,207 99,41417 0,074 0,184 99,59718 0,046 0,116 99,71319 0,038 0,094 99,80820 0,035 0,088 99,89521 0,025 0,062 99,95822 0,014 0,035 99,99323 0,003 0,007 10024 0 0 10025 0 0 10026 0 0 10027 0 0 10028 0 0 10029 0 0 10030 0 0 10031 0 0 10032 0 0 10033 0 0 10034 0 0 10035 0 0 10036 0 0 10037 0 0 10038 0 0 10039 0 0 10040 0 0 100

EIGENVALORES

Pasos en la aplicaciPasos en la aplicacióón de la tn de la téécnica ACP (5).cnica ACP (5).

Página 53

Page 58: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 37

Casos que pueden presentarse al analizar como evolucionan los eigen-vectores de los CP (o lo que es lo mismo el porcentaje de variación que acumula cada CP)

PASO 2. Extracción del número óptimo de CP (4)

– CASO 1: El investigador puede seleccionar con un amplio margen de seguridad el cp1.

– CASO 2: Pueden seleccionarse los 4 primeros cp (cp1 a cp4).

– CASO 3: Los resultados del ACP no permiten reducir la dimensionalidad.

Pasos en la aplicaciPasos en la aplicacióón de la tn de la téécnica ACP (6).cnica ACP (6).

Lección 2 38

Está compuesta por los eiguen-vectores ocorrelaciones entre los factores (CP) y las variables (=caracteres)� Son los valores de las saturaciones de las variables

en cada uno de los CP, de donde se obtiene la siguiente información:

• Qué caracteres están asociados

• Qué caracteres caracterizan en el mismo sentido y en sentido contrario

PASO 3. Obtención e interpretación de la matriz de componentes o matriz de estructura factorial

Carácter 1º componente 2º componente 3º componenteLA 0.8877 0.2359 0.0228LL 0.8328 0.1296 -0.1923LW/L 0.4686 -0.1682 0.7456LFF 0.5137 -0.0697 0.688LUA 0.5602 -0.2932 0.5868LLA 0.2902 0.1257 0.8208LL/AWP -0.0722 0.6278 -0.0669LPL 0.7925 0.36 0.3121LNL 0.7398 -0.3193 0.2734CLL 0.6861 0.3413 -0.2823CUL/LL 0.8115 0.157 -0.3486CUS/LS -0.0753 -0.9231 0.0501CLS/UL -0.5514 -0.5553 -0.2193CLS/US -0.0596 0.7397 0.1413CLL/LW -0.1355 -0.6968 -0.1635POL 0.3163 0.7871 0.0436POW/OL -0.3434 -0.6089 -0.197PCS/SS 0.0071 0.2465 0.7625PLP/TL 0.766 -0.5814 -0.1917POL/SLP 0.1976 0.2426 0.723SA -0.259 0.8733 -0.2563SPL -0.5323 0.7413 -0.1861SPW/PL 0.6834 0.5833 0.0119SCW/CL -0.7834 0.4298 0.1676SCL/PL 0.908 0.2646 -0.2102SCW/PW 0.7398 0.2723 -0.1508WA/SA -0.7504 -0.058 0.4529WPL -0.6706 0.6782 -0.0894WPW/PL -0.1529 0.51 0.6519WCL/PL 0.8744 0.3097 -0.2299KA/SA -0.8572 -0.0867 0.1519KPL -0.7501 0.5916 -0.1194KPW/PL -0.2644 0.4039 0.5851KCL/PL 0.9005 0.2764 -0.2238KAA -0.085 -0.8777 -0.1865FMPA -0.4534 0.7611 -0.2016FL 0.0696 0.8006 -0.2795FW/L -0.759 0.0336 0.1402FFF -0.7834 0.0212 0.1156FNOV -0.1262 0.8615 -0.2

EIGENVECTORES

Pasos en la aplicaciPasos en la aplicacióón de la tn de la téécnica ACP (7).cnica ACP (7).

Lección 2 39

El gráfico de componentes representa gráficamente las saturaciones de las variables en cada uno de los CP y facilita la interpretación

PASO 4. Obtención e interpretación de la matriz de componentes o matriz de estructura factorial (2)

Carácter 1º componente 2º componente 3º componenteLA 0.8877 0.2359 0.0228LL 0.8328 0.1296 -0.1923LW/L 0.4686 -0.1682 0.7456LFF 0.5137 -0.0697 0.688LUA 0.5602 -0.2932 0.5868LLA 0.2902 0.1257 0.8208LL/AWP -0.0722 0.6278 -0.0669LPL 0.7925 0.36 0.3121LNL 0.7398 -0.3193 0.2734CLL 0.6861 0.3413 -0.2823CUL/LL 0.8115 0.157 -0.3486CUS/LS -0.0753 -0.9231 0.0501CLS/UL -0.5514 -0.5553 -0.2193CLS/US -0.0596 0.7397 0.1413CLL/LW -0.1355 -0.6968 -0.1635POL 0.3163 0.7871 0.0436POW/OL -0.3434 -0.6089 -0.197PCS/SS 0.0071 0.2465 0.7625PLP/TL 0.766 -0.5814 -0.1917POL/SLP 0.1976 0.2426 0.723SA -0.259 0.8733 -0.2563SPL -0.5323 0.7413 -0.1861SPW/PL 0.6834 0.5833 0.0119SCW/CL -0.7834 0.4298 0.1676SCL/PL 0.908 0.2646 -0.2102SCW/PW 0.7398 0.2723 -0.1508WA/SA -0.7504 -0.058 0.4529WPL -0.6706 0.6782 -0.0894WPW/PL -0.1529 0.51 0.6519WCL/PL 0.8744 0.3097 -0.2299KA/SA -0.8572 -0.0867 0.1519KPL -0.7501 0.5916 -0.1194KPW/PL -0.2644 0.4039 0.5851KCL/PL 0.9005 0.2764 -0.2238KAA -0.085 -0.8777 -0.1865FMPA -0.4534 0.7611 -0.2016FL 0.0696 0.8006 -0.2795FW/L -0.759 0.0336 0.1402FFF -0.7834 0.0212 0.1156FNOV -0.1262 0.8615 -0.2

EIGENVECTORES

Pasos en la aplicaciPasos en la aplicacióón de la tn de la téécnica ACP (8).cnica ACP (8).

Página 54

Page 59: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 40

Produce una rotación de los CP obtenidos con el objetivo de mejorar la interpretabilidad de la solución� En la solución factorial el primer factor explica el máximo de la varianza común

disponible en los datos, el segundo el máximo de la varianza común restante y asísucesivamente

( esto es para deshacer la indeterminación intrínseca a la solución del sistema homogéneo de ecuaciones que da lugar a los eigen-vectores.)

� Un efecto indeseable es que los primeros factores tienden a capitalizar la información de covariación contenida en la matriz de correlaciones, acumulando más información que la que les corresponde

• Cuando cada variable se encuentra inequívocamente asignada a un solo factor no hay problema

• Si las variables saturan en más de un factor la rotación ayuda a la interpretación

PASO 4. Rotación de la solución factorial y repetición de los puntos 2 y 3 para la solución rotada

Pasos en la aplicaciPasos en la aplicacióón de la tn de la téécnica ACP (9).cnica ACP (9).

Lección 2 41

En el ejemplo se observa que tras la rotación:

– Las variables pertenecientes al factor 2 se han aproximado más a él.

– Las variables pertenecientes al factor 1 ahora están atravesadas por el eje

– La variable nivel educativo se ha distanciado del factor 1 llevando a pensar que comparte información con el factor 2

PASO 4. Rotación de la solución factorial y repetición de los puntos 2 y 3 para la solución rotada (2)

Pasos en la aplicaciPasos en la aplicacióón de la tn de la téécnica ACP (10).cnica ACP (10).

Lección 2 42

Métodos de rotación:Clasificación de los métodos de rotación:

– Rotación Ortogonal: Los factores rotados continúan siendo ortogonales.– Rotación Oblicua: Los factores rotados dejan de ser ortogonales.

Método Varimax. Es el más utilizado� Es un método de rotación ortogonal�Minimiza el número de variables que tienen saturaciones altas en cada factor� Simplifica la interpretación de los factores optimizando la solución por columna

PASO 4. Rotación de la solución factorial y repetición de los puntos 2 y 3 para la solución rotada (3)

Pasos en la aplicaciPasos en la aplicacióón de la tn de la téécnica ACP (11).cnica ACP (11).

Página 55

Page 60: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 43

• Metodologías para la formación de grupos de UBC utilizando análisis multivariado:

– Análisis de agrupamiento.– Métodos de ordenación (Análisis de Componentes

Principales).

VisualizaciVisualizacióón de las relaciones entre UBC: n de las relaciones entre UBC: formaciformacióón de grupos.n de grupos.

Lección 2 44

• Análisis de agrupamiento.�El análisis de agrupamiento comprende técnicas que, siguiendo

reglas más o menos arbitrarias, forman grupos de U.B.C. que se asocian por su grado de similitud

• Núcleo: Todo conjunto formado por dos U.B.C.• Grupo: Todo conjunto formado por más de dos U.B.C.

VisualizaciVisualizacióón de las relaciones entre UBC: n de las relaciones entre UBC: formaciformacióón de grupos (2).n de grupos (2).

Lección 2 45

Disimilitud0.00 0.50 1.00 1.50 2.00

1 2 8 9 5 6 7 3

10 4

18 20 23 21 22 24 19 11 13 12 15 16 14 17

VisualizaciVisualizacióón de las relaciones entre UBC: n de las relaciones entre UBC: formaciformacióón de grupos (3)n de grupos (3)

Página 56

Page 61: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 46

• Análisis de Componentes Principales.– El proceso de obtención de los Componentes Principales ya ha sido descrito en el

apartado de reducción de datos con esta técnica.– La formación de grupos de U.B.C. mediante el ACP está basada en la

representación de las mismas en un espacio multi-dimensional (2/3 dimensiones) formado por los primeros Componentes Principales (2/3).

– Este método no traza límites en el espacio que separen grupos de U.B.C.� Cuanto más cerca se encuentren entre si dos U.B.C. más estrechamente

relacionados están.

VisualizaciVisualizacióón de las relaciones entre UBC: n de las relaciones entre UBC: formaciformacióón de grupos (4).n de grupos (4).

Lección 2 47

2423222120

1918

17

1615 14

13

1211

10

9

8

76 5

4 3

2

1

VisualizaciVisualizacióón de las relaciones entre UBC: n de las relaciones entre UBC: formaciformacióón de grupos (5).n de grupos (5).

Lección 2 48

SAHN: Sequential, Agglomerative, Hierarchical, and Nested de grupo par�Solamente puede ser admitida una U.B.C. o un grupo de

U.B.C. por nivel

• Clasificación general de técnicas.– Técnicas jerárquicas vs. no jerárquicas.– Técnicas secuenciales vs. simultáneas.– Técnicas aglomerativas vs. divisivas.– Técnicas exclusivas vs. no exclusivas.

Visualización de relaciones entre UBC: Análisis de agrupamiento

AnAnáálisis de agrupamiento (2).lisis de agrupamiento (2).

jerárquicassecuencialesaglomerativasexclusivas

Página 57

Page 62: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 49Visualización de relaciones entre UBC: Análisis de agrupamiento

CLASIFICACIÓN PRIMARIA DE LAS TÉCNICAS DE ANÁLISIS DE AGRUPAMIENTOS.

• Técnicas jerárquicas: Originan conjuntos que presentan rangos, en los cuales las U.B.C. o grupos de U.B.C. subsidiarios forman parte de un grupo mayor o inclusivo.

• Técnicas no jerárquicas: Originan conjuntos que no exhiben rangos. � Su uso se está incremetando.� Requieren que el investigador elija centros móviles o individuos típicos (simientes)

a partir de los cuales iniciar el proceso de aglomeración.

AnAnáálisis de agrupamiento.lisis de agrupamiento.

Lección 2 50

ANÁLISIS DE LA CLASIFICACIÓN GENERAL DE TÉCNICAS.

• Técnicas secuenciales: Se forma un grupo de cada vez, hasta que se agota el conjunto total.

• Técnicas simultáneas: Los grupos se forman simultáneamente en una sola operación.

Visualización de relaciones entre UBC: Análisis de agrupamiento

AnAnáálisis de agrupamiento (2).lisis de agrupamiento (2).

Lección 2 51

ANÁLISIS DE LA CLASIFICACIÓN GENERAL DE TÉCNICAS.• Técnicas aglomerativas: Son las que partiendo de n U.B.C. separadas, las

agrupa en sucesivos conjuntos (siempre en un número < n) para llegar finalmente a un solo conjunto que contiene a las n unidades.

• Técnicas divisivas: Son aquellas que partiendo de un conjunto que contiene a las n U.B.C. las divide en subconjuntos.

Visualización de relaciones entre UBC: Análisis de agrupamiento

AnAnáálisis de agrupamiento (3).lisis de agrupamiento (3).

Página 58

Page 63: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 52

ANÁLISIS DE LA CLASIFICACIÓN GENERAL DE TÉCNICAS.

• Técnicas exclusivas: Originan grupos donde las U.B.C. son exclusivas del grupo del cual forman parte y no pueden pertenecer a otro grupo que se halle en un mismo rango o nivel.

• Técnicas no exclusivas: Originan grupos donde las U.B.C. pueden pertenecer a más de un grupo en un mismo nivel o rango.

Visualización de relaciones entre UBC: Análisis de agrupamiento

AnAnáálisis de agrupamiento (4).lisis de agrupamiento (4).

Lección 2 53

1. Examen de la matriz de similitud para localizar el valor de similitud más alto � Formación del primer núcleo

2. Se busca el próximo valor de mayor similitud, lo que puede suponer:– Formación de nuevos núcleos– Incorporación de una nueva U.B.C. a un núcleo– Fusión de núcleos existentes

3. Se repite la segunda etapa

Visualización de relaciones entre UBC: Análisis de agrupamiento

DescripciDescripcióón del proceso de agrupamiento.n del proceso de agrupamiento.

Lección 2 54

• Ligamiento simple. • Ligamiento completo.• Ligamiento promedio.• De Ward

Visualización de relaciones entre UBC: Análisis de agrupamiento

Tipos de ligamiento (etapa 2).Tipos de ligamiento (etapa 2).(etapa 2)

Página 59

Page 64: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 55

Las U.B.C. se incorporan a grupos o núcleos ya formados, teniendo en cuenta que el valor de similitud entre las U.B.C. candidato a incorporarse y el grupo o núcleo es igual a la similitud entre el candidato y la U.B.C. integrante del grupo o núcleo más parecido a ella. Si el candidato a incorporarse es un grupo o núcleo, el valor de similitud será igual a la máxima similitud hallada entre dos U.B.C. provenientes una de cada grupo o núcleo.

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple.Ligamiento simple.

Lección 2 56

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.B. arb. 0B. car. 0,68 0B. chil. 1,65 1,8 0B. bon. 1,19 1,31 1,22 0B. ret. 1,58 1,72 1,01 1,21 0B. fol. 1,59 1,06 1,18 1,12 0,99 0B. sch. 1,7 1,84 1,23 1,13 1,13 0,73 0B. sar. 1,67 1,74 1,57 1,52 1,53 1,27 1,55 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (2).Ligamiento simple (2).

Lección 2 57

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.B. arb. 0B. car. 0,68 0B. chil. 1,65 1,8 0B. bon. 1,19 1,31 1,22 0B. ret. 1,58 1,72 1,01 1,21 0B. fol. 1,59 1,66 1,18 1,12 0,99 0B. sch. 1,7 1,84 1,23 1,13 1,13 0,73 0B. sar. 1,67 1,74 1,57 1,52 1,53 1,27 1,55 0

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.B. arb. 0B. car. 0,68 0B. chil. 1,65 1,8 0B. bon. 1,19 1,31 1,22 0B. ret. 1,58 1,72 1,01 1,21 0B. fol. 1,59 1,66 1,18 1,12 0,99 0B. sch. 1,7 1,84 1,23 1,13 1,13 0,73 0B. sar. 1,67 1,74 1,57 1,52 1,53 1,27 1,55 0

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. 1,58 1,01 1,21 0B. fol. 1,59 1,18 1,12 0,99 0B. sch. 1,7 1,23 1,13 1,13 0,73 0B. sar. 1,67 1,57 1,52 1,53 1,27 1,55 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (3).Ligamiento simple (3).

Página 60

Page 65: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 58

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. 1,58 1,01 1,21 0B. fol. 1,59 1,18 1,12 0,99 0B. sch. 1,7 1,23 1,13 1,13 0,73 0B. sar. 1,67 1,57 1,52 1,53 1,27 1,55 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (4).Ligamiento simple (4).

Lección 2 59

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. 1,58 1,01 1,21 0B. fol. 1,59 1,18 1,12 0,99 0B. sch. 1,7 1,23 1,13 1,13 0,73 0B. sar. 1,67 1,57 1,52 1,53 1,27 1,55 0

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. 1,58 1,01 1,21 0B. fol. 1,59 1,18 1,12 0,99 0B. sch. 1,7 1,23 1,13 1,13 0,73 0B. sar. 1,67 1,57 1,52 1,53 1,27 1,55 0

B. arb. B. car. B. chil. B. bon. B. ret.

B. fol. B. sch. B. sch.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. 1,58 1,01 1,21 0B. fol. B. sch. 1,59 1,18 1,12 0,99 0B. sar. 1,67 1,57 1,52 1,53 1,27 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (5).Ligamiento simple (5).

Lección 2 60

B. arb. B. car. B. chil. B. bon. B. ret.

B. fol. B. sch. B. sch.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. 1,58 1,01 1,21 0B. fol. B. sch. 1,59 1,18 1,12 0,99 0B. sar. 1,67 1,57 1,52 1,53 1,27 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (6).Ligamiento simple (6).

Página 61

Page 66: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 61

B. arb. B. car. B. chil. B. bon. B. ret.

B. fol. B. sch. B. sch.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. 1,58 1,01 1,21 0B. fol. B. sch. 1,59 1,18 1,12 0,99 0B. sar. 1,67 1,57 1,52 1,53 1,27 0

B. arb. B. car. B. chil. B. bon. B. ret.

B. fol. B. sch. B. sch.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. 1,58 1,01 1,21 0B. fol. B. sch. 1,59 1,18 1,12 0,99 0B. sar. 1,67 1,57 1,52 1,53 1,27 0

B. arb. B. car. B. chil. B. bon.

B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. B. fol. B. sch. 1,58 1,01 1,12 0B. sar. 1,67 1,57 1,52 1,27 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (7).Ligamiento simple (7).

Lección 2 62

B. arb. B. car. B. chil.

B. bon.

B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. B. fol. B. sch. 1,58 1,01 1,12 0B. sar. 1,67 1,57 1,52 1,27 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (8).Ligamiento simple (8).

Lección 2 63

B. arb. B. car. B. chil.

B. bon.

B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. B. fol. B. sch. 1,58 1,01 1,12 0B. sar. 1,67 1,57 1,52 1,27 0

B. arb. B. car. B. chil.

B. bon.

B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. B. fol. B. sch. 1,58 1,01 1,12 0B. sar. 1,67 1,57 1,52 1,27 0

B. arb. B. car.

B. bon.

B. chil. B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. bon. 1,19 0B. chil. B. ret. B. fol. B. sch. 1,58 1,12 0B. sar. 1,67 1,52 1,27 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (9).Ligamiento simple (9).

Página 62

Page 67: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 64

B. arb. B. car. B. bon.

B. chil. B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. bon. 1,19 0B. chil. B. ret. B. fol. B. sch. 1,58 1,12 0B. sar. 1,67 1,52 1,27 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (10).Ligamiento simple (10).

Lección 2 65

B. arb. B. car. B. bon.

B. chil. B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. bon. 1,19 0B. chil. B. ret. B. fol. B. sch. 1,58 1,12 0B. sar. 1,67 1,52 1,27 0

B. arb. B. car. B. bon.

B. chil. B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. bon. 1,19 0B. chil. B. ret. B. fol. B. sch. 1,58 1,12 0B. sar. 1,67 1,52 1,27 0

B. arb. B. car.

B. bon B. chil. B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. bon B. chil. B. ret. B. fol. B. sch. 1,19 0B. sar. 1,67 1,27 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (11).Ligamiento simple (11).

Lección 2 66

B. arb. B. car.

B. bon B. chil. B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. bon B. chil. B. ret. B. fol. B. sch. 1,19 0B. sar. 1,67 1,27 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (12).Ligamiento simple (12).

Página 63

Page 68: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 67

B. arb. B. car.

B. bon B. chil. B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. bon B. chil. B. ret. B. fol. B. sch. 1,19 0B. sar. 1,67 1,27 0

B. arb. B. car.

B. bon B. chil. B. ret. B. fol. B. sch B. sch.

B. arb. B. car. 0B. bon B. chil. B. ret. B. fol. B. sch. 1,19 0B. sar. 1,67 1,27 0

B. arb. B. car. B. bon B. chil. B. ret. B. fol. B. sch B. sch.

B. arb. B. car. B. bon B. chil. B. ret. B. fol. B. sch. 0B. sar. 1,27 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (13).Ligamiento simple (13).

Lección 2 68

B. arb. B. car. B. bon B. chil. B. ret. B. fol. B. sch B. sch.

B. arb. B. car. B. bon B. chil. B. ret. B. fol. B. sch. 0B. sar. 1,27 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento simple (14).Ligamiento simple (14).

Lección 2 69

Las U.B.C. se incorporan a grupos o núcleos ya formados, teniendo en cuenta que el valor de similitud entre las U.B.C. candidato a incorporarse y el grupo o núcleo es igual a la similitud entre el candidato y la U.B.C. integrante del grupo o núcleo menos parecido a ella. Si el candidato a incorporarse es un grupo o núcleo, el valor de similitud será igual a la mínima similitud hallada entre dos U.B.C. provenientes una de cada grupo o núcleo.

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento completo.Ligamiento completo.

Página 64

Page 69: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 70

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.B. arb. 0B. car. 0,68 0B. chil. 1,65 1,8 0B. bon. 1,19 1,31 1,22 0B. ret. 1,58 1,72 1,01 1,21 0B. fol. 1,59 1,06 1,18 1,12 0,99 0B. sch. 1,7 1,84 1,23 1,13 1,13 0,73 0B. sar. 1,67 1,74 1,57 1,52 1,53 1,27 1,55 0

LS

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento completo (2).Ligamiento completo (2).

Lección 2 71

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.B. arb. 0B. car. 0,68 0B. chil. 1,65 1,8 0B. bon. 1,19 1,31 1,22 0B. ret. 1,58 1,72 1,01 1,21 0B. fol. 1,59 1,66 1,18 1,12 0,99 0B. sch. 1,7 1,84 1,23 1,13 1,13 0,73 0B. sar. 1,67 1,74 1,57 1,52 1,53 1,27 1,55 0

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.B. arb. 0B. car. 0,68 0B. chil. 1,65 1,8 0B. bon. 1,19 1,31 1,22 0B. ret. 1,58 1,72 1,01 1,21 0B. fol. 1,59 1,66 1,18 1,12 0,99 0B. sch. 1,7 1,84 1,23 1,13 1,13 0,73 0B. sar. 1,67 1,74 1,57 1,52 1,53 1,27 1,55 0

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.

B. arb. B. car. 0B. chil. 1,8 0B. bon. 1,31 1,22 0B. ret. 1,72 1,01 1,21 0B. fol. 1,66 1,18 1,12 0,99 0B. sch. 1,84 1,23 1,13 1,13 0,73 0B. sar. 1,74 1,57 1,52 1,53 1,27 1,55 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento completo (3).Ligamiento completo (3).

Lección 2 72

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.

B. arb. B. car. 0B. chil. 1,65 0B. bon. 1,19 1,22 0B. ret. 1,58 1,01 1,21 0B. fol. 1,59 1,18 1,12 0,99 0B. sch. 1,7 1,23 1,13 1,13 0,73 0B. sar. 1,67 1,57 1,52 1,53 1,27 1,55 0

LS

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento completo (4).Ligamiento completo (4).

Página 65

Page 70: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 73

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.

B. arb. B. car. 0B. chil. 1,8 0B. bon. 1,31 1,22 0B. ret. 1,72 1,01 1,21 0B. fol. 1,66 1,18 1,12 0,99 0B. sch. 1,84 1,23 1,13 1,13 0,73 0B. sar. 1,74 1,57 1,52 1,53 1,27 1,55 0

B. arb. B. car. B. chil. B. bon. B. ret. B. fol. B. sch. B. sar.

B. arb. B. car. 0B. chil. 1,8 0B. bon. 1,31 1,22 0B. ret. 1,72 1,01 1,21 0B. fol. 1,66 1,18 1,12 0,99 0B. sch. 1,84 1,23 1,13 1,13 0,73 0B. sar. 1,74 1,57 1,52 1,53 1,27 1,55 0

B. arb. B. car. B. chil. B. bon. B. ret.

B. fol. B. sch. B. sch.

B. arb. B. car. 0B. chil. 1,8 0B. bon. 1,31 1,22 0B. ret. 1,72 1,01 1,21 0B. fol. B. sch. 1,84 1,23 1,13 1,13 0B. sar. 1,74 1,57 1,52 1,53 1,55 0

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento completo (5).Ligamiento completo (5).

Lección 2 74

B. arb. B. car. B. chil. B. bon. B. ret.

B. fol. B. sch. B. sch.

B. arb. B. car. 0B. chil. 1,8 0B. bon. 1,31 1,22 0B. ret. 1,72 1,01 1,21 0B. fol. B. sch. 1,84 1,23 1,13 1,13 0B. sar. 1,74 1,57 1,52 1,53 1,55 0

LS

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento completo (6).Ligamiento completo (6).

Lección 2 75

LS

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento completo (7).Ligamiento completo (7).

Página 66

Page 71: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 76

Las U.B.C. se incorporan a grupos o núcleos ya formados, teniendo en cuenta que el valor de similitud entre las U.B.C. candidato a incorporarse y el grupo o núcleo es igual a una similitud promedio resultante de los valores de similitud entre el candidato y cada uno de los integrantes del grupo o núcleo.Si el candidato a incorporarse es un grupo o núcleo, el valor de similitud será el promedio de los valores de similitud entre los pares posibles de U.B.C. provenientes una de cada grupo o núcleo. � Existen varios tipos de medias. La más utilizada es UPGMA (Unweighted pair-group

meted using aritmetic averages) “Media aritmética no ponderada”)

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento promedio.Ligamiento promedio.

Lección 2 77

LS LC

Visualización de relaciones entre UBC: Análisis de agrupamiento

Ligamiento promedio (2).Ligamiento promedio (2).

Lección 2 78

Distancia entre dos agrupamientos:

� Cuadrado de la distancia entre las medias de esos agrupamientos ...... dividida entre la suma de los recíprocos de la cantidad de puntos que se encuentra dentro de cada uno de éstos

� También se conoce como el método de la varianza mínima porque ...

... al considerar los valores al cuadrado, se vuelve un método muy sensible

Visualización de relaciones entre UBC: Análisis de agrupamiento

MMéétodo de la varianza mtodo de la varianza míínima de Wardnima de Ward

Página 67

Page 72: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 79

• PASO 1: Estandarización / Transformación � Todos los caracteres deben estar expresados en la misma escala.

• PASO 2: Calculo de la matriz de similitud entre las UBC.• PASO 3: Construcción del dendrograma previa elección del método

de ligamiento.

Visualización de relaciones entre UBC: Análisis de agrupamiento

Pasos en la aplicaciPasos en la aplicacióón de lan de lattéécnica de ancnica de anáálisis de agrupamientos.lisis de agrupamientos.

Lección 2 80

Métodos:• Medida de la distorsión mediante el coeficiente de

correlación cofenética.• Bootstrapping (Método de remuestreo).

Visualización de relaciones entre UBC: Análisis de agrupamiento

ValidaciValidacióón del ann del anáálisis de agrupamiento.lisis de agrupamiento.

Lección 2 81

Coeficiente de correlación cofenética.

•Procedimiento.– Determinación de una nueva matriz de similitud a partir de los valores del

fenograma � “matriz cofenética.”– La comparación de la matriz original y la cofenética mediante el coeficiente de

correlación del momento-producto origina el “coeficiente de correlación cofenética.”

•Información proporcionada por la técnica.– Es una medida de la distorsión interna de la técnica.– No da información acerca de la bondad de la agrupación taxonómica obtenida.

Visualización de relaciones entre UBC: Análisis de agrupamiento

ValidaciValidacióón del ann del anáálisis de agrupamiento (2).lisis de agrupamiento (2).

Página 68

Page 73: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 82

Bootstrapping.Procedimiento.

– Para cada UBC se toma el valor correspondiente a cada carácter, uno por uno, con reemplazo, elaborando una muestra de igual tamaño que el número de caracteres.� Existe la posibilidad de que se seleccione un carácter una o más veces

– En cada muestra se calcula una matriz de similtitud.– Se calculan las similitudes promedio y sus desviaciones estándar para cada

par de U.B.C., y se elabora una matriz de similitud promedio– Se construye un nuevo dendrograma, empleando la matriz de similitud

promedio– En situaciones reales deben generarse más de 100 muestras con reemplazo.

Visualización de relaciones entre UBC: Análisis de agrupamiento

ValidaciValidacióón del ann del anáálisis de agrupamiento (3).lisis de agrupamiento (3).

Lección 2 83

Disimilitud0.00 0.50 1.00 1.50 2.00

1 2 8 9 5 6 7 3

10 4

18 20 23 21 22 24 19 11 13 12 15 16 14 17

Similitud0.00 0.25 0.50 0.75 1.00

10

12356789104121314151617181119212223242520

Visualización de relaciones entre UBC: Análisis de agrupamiento

InterpretaciInterpretacióón de un n de un dendrogramadendrograma..

Lección 2 84

• Si el diagrama es claro basta la simple observación Definición del número de grupos:

• El conocimiento profundo de la especie vegetal: Botánica, agronomía y distribución, permite al agrónomo interpretar los resultados

Visualización de relaciones entre UBC: Análisis de agrupamiento

InterpretaciInterpretacióón de un n de un dendrogramadendrograma (2).(2).

Página 69

Page 74: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 85

• Estimación de las distancias entre U.B.C. con el coeficiente �2 que cuenta con una prueba de hipótesis para saber el grado de similitud existente entre pares de UBC.� A partir de las tablas de �2 con un grado de libertad, usando � como el nivel de

similitud• Usar la pseudoestadística T2 de Hotelling que se usa para comparar las medias de dos

agrupamientos� Si las medias de dos agrupamientos no son significativamente diferentes, esos

dos agrupamientos podrían combinarse.� Si la diferencia entre las medias es significativa, entonces los agrupamientos no

deben combinarse

Definición del número de grupos:

Visualización de relaciones entre UBC: Análisis de agrupamiento

InterpretaciInterpretacióón de un n de un dendrogramadendrograma (3).(3).

Lección 2 86

Comparación mediante un ANOVA las medias de cada carácter en los diferentes agrupamientos:� Esto permite averiguar que caracteres están influyendo en la formación de los

grupos.� El análisis conjunto de todos los caracteres puede ayudar a tomar decisiones a la

hora de definir grupos

Visualización de relaciones entre UBC: Análisis de agrupamiento

InterpretaciInterpretacióón de un n de un dendrogramadendrograma (4).(4).

Lección 2 87

• Permite averiguar qué caracteres están altamente correlacionados.

• Puede generar ideas e hipótesis sobre el origen, valor selectivo y patrones de variación de los caracteres.

• Permite determinar posibles complejos adaptativos.

Utilidad:

Visualización de relaciones entre UBC: Análisis de agrupamiento

Agrupamiento por variables (=caracteres) en lugar Agrupamiento por variables (=caracteres) en lugar de por UBC.de por UBC.

Página 70

Page 75: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 88

1. Cálculo de una matriz que contenga la variabilidad conjunta de todas las variables (=caracteres).

2. Extracción del número óptimo de Componentes Principales (C.P.)3. Obtención e interpretación de la matriz de componentes o matriz de

estructura factorial.4. Rotación de la solución factorial y repetición de los puntos 2 y 3 para

la solución rotada.5. Estimación de las puntuaciones de las U.B.C. sobre las nuevas

variables (=Componentes Principales) y proyección de aquellas sobre éstas.

Como ya se indicó anteriormente, los pasos a realizar en un ACP son:

Visualización de relaciones entre UBC: Métodos de ordenación (ACP)

UtilizaciUtilizacióón del ACP para visualizar las relaciones n del ACP para visualizar las relaciones entre UBC.entre UBC.

Lección 2 89

El paso 5 consiste en:• Obtener las puntuaciones factoriales de las UBC sobre los Componentes

Principales� Existen varios métodos:

• Método de proyección• Método de regresión • Puntuaciones de

Bartlett• Método de

Anderson-Rubin• Dibujar el gráfico.

24232221201918

17

1615 14

1312

11

10

98

76 5

4 3

2

1

1c

2c

3c

Visualización de relaciones entre UBC: Métodos de ordenación (ACP)

UtilizaciUtilizacióón del ACP para visualizar las relaciones n del ACP para visualizar las relaciones entre UBC (2).entre UBC (2).

Lección 2 90

CONCEPTO: Se entiende por congruencia del resultado de un estudio de caracterización de germoplasma con métodos multivariados, al grado de correspondencia entre diferentes clasificaciones de un mismo conjunto de U.B.C.

Análisis de resultados

Congruencia de los resultados obtenidos.Congruencia de los resultados obtenidos.

Página 71

Page 76: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 91

• Variar la metodología.Realizar la clasificación a partir de un determinado conjunto de caracteres, utilizando dos técnicas diferentes.� Se pretende determinar cuales son las técnicas clasificatorias que permiten obtener

resultados más semejantes entre si.

Análisis de resultados

Planteamiento experimento congruencia.Planteamiento experimento congruencia.

Lección 2 92

• Variar la fuente de caracteres.Realizar la clasificación a partir de dos conjuntos de caracteres diferentes, utilizando la misma técnica.� Se pretende determinar cuál es el grado de interdependencia causal entre diferentes tipos

de caracteres.

Análisis de resultados

Planteamiento experimento congruencia (2).Planteamiento experimento congruencia (2).

Lección 2 93

– Estudiar la congruencia entre clasificaciones basadas en diferentes conjuntos de caracteres utilizando la misma técnica.

– Aplicar a cada uno de los conjuntos de caracteres otra técnica diferente.

� Se pretende determinar si diferentes tipos de caracteres proporcionanresultadoscongruentesutilizando una determinada técnica e incongruentes con otra.

• Combinar ambos sistemas anteriores.

Análisis de resultados

Planteamiento experimento congruencia (3).Planteamiento experimento congruencia (3).

Página 72

Page 77: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 94

• Midiendo la coincidencia entre las matrices de similitud.– Mediante coeficientes de correlación.– Mediante coeficientes de discordancia.

• Midiendo la coincidencia entre las estructuras taxonómicas derivadas de las matrices de similitud.

– Coeficiente de distorsión.– Índice de consenso.

Análisis de resultados

EvaluaciEvaluacióón de la congruencia. n de la congruencia.

Lección 2 95

• Comparación visual, sin ningún tipo de medición, de los resultados gráficos obtenidos.– Ejemplo: Comparar un dendrograma (=resultado gráfico de un análisis de

agrupamiento) con la gráfica bidimensional o tridimensional de proyección de las U.B.C. sobre las 2/3 primeras Componentes Principales.�Para ello se precisará que estas 2/3 componentes expliquen la mayor parte

de la variabilidad existente

Análisis de resultados

EvaluaciEvaluacióón de la congruencia (2).n de la congruencia (2).

Lección 2 96

• Causas biológicas.– Diferente actividad de los genes en diferentes células de un mismo organismo– Plasticidad fenotípica.– Mutaciones somáticas.– Diferentes presiones de selección– Evolución en mosaico: La velocidad de evolución de los diferentes tipos de

caracteres es diferente• Causas metodológicas.

– Determinación de homologías– Cantidad y calidad de los caracteres.– Codificación de los caracteres.

Particularizando para un caso de estudios taxonómicos, las principales causas son:

� En estudios taxonómicos deben seleccionarse caracteres con valor filogenéticoAnálisis de resultados

Causas de las incongruencias clasificatorias.Causas de las incongruencias clasificatorias.

Página 73

Page 78: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 97

• Los caracteres que alcanzan la misma expresión para todas la U.B.C. son NO DISCRIMINANTES.

• Los caracteres que alcanzan diferentes expresiones para las diferentes U.B.C. se consideran DISCRIMINANTES.

• Los caracteres que alcanzan la misma expresión para todas las U.B.C. salvo una son ALTAMENTE DISCRIMINANTES.

Análisis de resultados

CaractCaract. morfol. morfolóógicos: Capacidad discriminante.gicos: Capacidad discriminante.

Lección 2 98

� Sirve para comparar la homogeneidad de resultados entre campañas (años).• Metodología: Comparación matrices de datos para:

– Mismas U.B.C.– Mismos caracteres.

• Interpretación de los resultados (Lapointe & Legendre, 1992) (1).

– Si el coeficiente “r” es superior a 0,5 será estadísticamente significativo al nivel 1%.

(1) Lapointe, F.J., Legendre, P. 1992. Statistical significance of the matrix correlation coefficient for comparing independent phylogenetic trees. Systematic Biology, 41:378-384

ANÁLISIS CONJUNTO DE LA ESTABILIDAD PARA TODOS LOS CARACTERES Y TODAS LAS OTU:

Análisis de resultados

CaractCaract. morfol. morfolóógicos: Estabilidad.gicos: Estabilidad.

Lección 2 99

Caracteres doble estado o multiestado cualitativos sin secuencia lógica o desordenados• Tiene el mismo peso la inestabilidad de un año a otro cuando el cambio de nivel es

entre dos niveles contiguos o entre dos niveles no contiguos.• Metodología para el cálculo de la inestabilidad de cada carácter (I)

• Se calcula el % de inestabilidad a un nivel y a varios niveles (I).• I total (%) = [% de diferencias a un nivel + % de diferencias a más de un

nivel]• Clasificación de los caracteres por su estabilidad:

• Estables: I < 10%• Medio estables: 10% < I < 40%• Inestables: I > 40%

EVALUACIÓN DE LA ESTABILIDAD DE LOS DIFERENTES CARACTERES INDIVIDUALMENTE.

Análisis de resultados

CaractCaract. morfol. morfolóógicos: Estabilidad (2).gicos: Estabilidad (2).

Página 74

Page 79: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 100

Caracteres multiestado cualitativos con secuencia lógica• No tiene el mismo peso la inestabilidad de un año a otro cuando el cambio de nivel es

entre dos niveles contiguos o entre dos niveles no contiguos.• Metodología para el cálculo de la inestabilidad de cada carácter (I)

• Se calcula el % de inestabilidad a 1 nivel y se divide por 8.• Se calcula el % de inestabilidad a 2 niveles y se divide por 4.• Se calcula el % de inestabilidad a 3 niveles y se divide por 2.• Se calcula el % de inestabilidad a más de 3 niveles

EVALUACIÓN DE LA ESTABILIDAD DE LOS DIFERENTES CARACTERES INDIVIDUALMENTE (2).

• Clasificación de los caracteres por su estabilidad• Estables: I < 5%• Medio estables: 5% < I < 10%• Inestables: I > 10%

nivelesdemásadifnivelesadifnivelesadifniveladiftotalI 3.%23.%

42.%

81.%(%) ����

Análisis de resultados

CaractCaract. morfol. morfolóógicos: Estabilidad (3).gicos: Estabilidad (3).

Lección 2 101

• Metodología.• Tres observadores describen los caracteres.• Se calcula el porcentaje de discrepancias a un nivel y a varios niveles (D) para

cada uno de los años.• D total (%).

• Clasificación de los caracteres por su objetividad:• Objetivos: D < 10%.• Objetividad media: D < 10% un año, D > 10% otro.• Subjetivos: D > 10%.

Caracteres doble estado o multiestado cualitativos sin secuencia lógica o desordenados.

Análisis de resultados

CaractCaract. morfol. morfolóógicos: Objetividad.gicos: Objetividad.

Lección 2 102

• Metodología• Tres observadores describen los caracteres, y para cada carácter se establecen

cuatro niveles de objetividad:• PRIMER NIVEL: Coincidencia al 100%. Los tres observadores califican con el

mismo nivel de expresión un determinado carácter.• SEGUNDO NIVEL: Discrepancia al 10% entre operadores (un nivel de expresión

sobre 10 posibles)• TERCER NIVEL: Discrepancia entre el 10% y el 30% (entre 1 y 3 niveles).• CUARTO NIVEL: Discrepancia superior al 30% (más de 3 niveles).

Caracteres multiestado cualitativos con secuencia lógica.

Análisis de resultados

CaractCaract. morfol. morfolóógicos: Objetividad (2).gicos: Objetividad (2).

Página 75

Page 80: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 103

• Clasificación de los caracteres por su objetividad:• Objetivos: Porcentaje objetividad de primer y segundo nivel es superior al

90%• De objetividad media: Uno de los años el porcentaje de objetividad de primer

y segundo nivel es superior al 90% y el otro menor.• Subjetivos: El porcentaje de objetividad de primer y segundo nivel es inferior

al 90%.

Caracteres multiestado cualitativos con secuencia lógica (2).

Análisis de resultados

CaractCaract. morfol. morfolóógicos: Objetividad (3).gicos: Objetividad (3).

Lección 2 104

• Analizando los valores de los eigen-vectores sobre los tres primeros componentes principales en el estudio de ANÁLISIS DE COMPONENTES PRINCIPALES.

Análisis de resultados

CaractCaract.. morfommorfoméétricostricos: Capacidad discriminante.: Capacidad discriminante.

Lección 2 105

� Sirve para comparar la homogeneidad de los caracteres entre campañas (años).

• Metodología: Comparación matrices de datos para:– Mismas U.B.C.– Mismos caracteres.

• Interpretación de los resultados (Lapointe & Legendre, 1992) (1).

– Si el coeficiente “r” es superior a 0,5 será estadísticamente significativo al nivel 1%.

(1) Lapointe, F.J., Legendre, P. 1992. Statistical significance of the matrix correlation coefficient for comparing independent phylogenetic trees. Systematic Biology, 41:378-384

ANÁLISIS CONJUNTO DE LA ESTABILIDAD PARA TODOS LOS CARACTERES:

Análisis de resultados

CaractCaract.. morfommorfoméétricostricos: Estabilidad.: Estabilidad.

Página 76

Page 81: Guia Ntsys

Lección 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 2 106

• Metodología para el cálculo de la inestabilidad de cada carácter: Cálculo de la Variación Media.

EVALUACIÓN DE LA ESTABILIDAD DE LOS DIFERENTES CARACTERES INDIVIDUALMENTE.

100xTotalesSumaslasdeMediaabsolutovalorensdiferenciadeSumaMediaVariación �

• Clasificación de los caracteres por su estabilidad:• Estables: Variación media < 5%• Medio estables: 5% < Variación media < 15%• Inestables: Variación media > 15%

Análisis de resultados

CaractCaract.. morfommorfoméétricostricos: Estabilidad (2).: Estabilidad (2).

Lección 2 107

Página 77

Page 82: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 1

LECCIÓN 3. Caracterización mediante marcadores moleculares - ADN.

Lección 3 2

• Analizan directamente la molécula de ADN.• Detectan ciertas variaciones en la secuencia de ADN.

Base púrica

Base pirimidínica

Desoxirribosa

Grupo fosfato

Puentes de hidrógeno

Nociones generales sobre Marcadores Nociones generales sobre Marcadores Moleculares Moleculares --ADNADN

Lección 3 3

ORIGEN DEL POLIMORFISMO.• Cambios en la secuencia primaria de ADN.• Cambios en la secuencia de reconocimiento de un enzima de

restricción, o de anclaje de un cebador.• Inserciones o deleciones entre las secuencias de reconocimiento de

los enzimas de restricción, o de anclaje del cebador.

Nociones generales sobre Marcadores Nociones generales sobre Marcadores Moleculares Moleculares ––ADN (2)ADN (2)

Página 78

Page 83: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 4

PCR (Polymerase Chain Reaction): Replicación “exponencial”, en condiciones in vitro, de un fragmento de ADN flanqueado por dos secuencias concretas de bases (iguales o diferentes), situadas en

cadenas opuestas.

La replicación del ADN

Dirección de Síntesis

El despegue de los MMEl despegue de los MM--ADN: PCRADN: PCR

Lección 3 5

1 ciclo

2 ciclo

1. Desnaturalización

2. Unión del cebador

21 copias3. Elongación

n ciclos 2n copias22 copias

PCR: Fundamento de la tPCR: Fundamento de la téécnica.cnica.

Lección 3 6

1. Amplificación de fragmentos.2. Separación por electroforesis de los fragmentos

amplificados.3. Tinción y visualización.

PCR (2): MetodologPCR (2): Metodologííaa

Página 79

Page 84: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 7

1.Amplificación de fragmentos.

IngredientesIngredientes EquipamientoEquipamiento

•ADN molde•ADN polimerasa•Cebadores •dNTPS

PCR (3): MetodologPCR (3): Metodologíía (2)a (2)

Lección 3 8

2. Separación por electroforesis de los fragmentos amplificados.

Mezclado con tampón de

carga

Cargado del gel Separación por electroforesis

PCR (4): MetodologPCR (4): Metodologíía (3)a (3)

Lección 3 9

3. Tinción y visualización.Visualización con luz UV

PCR (5): MetodologPCR (5): Metodologíía (4)a (4)

Página 80

Page 85: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 10

–[ADN molde]

–[ADN polimerasa]

–[Cl2Mg]

–Condiciones de la amplificación

PCR (6): Factores que influyenPCR (6): Factores que influyen

Lección 3 11

Clasificación MarcadoresMoleculares -ADN

• Métodos no basados en la P.C.R.– R.F.L.P.

• Métodos basados en la P.C.R.– Utilizando cebadores arbitrarios o semiarbitarios

• M.A.A.P.• Intermicrosatélites o I.S.S.R.• A.F.L.P.

– Utilizando cebadores diseñados específicamente• Microsatélites• C.A.P.S.• S.C.A.R.

• Métodos basados en la secuenciación– Secuenciación del ADN.

• Microarrays o Matrices• Single Nucleotide Polymorphisms (SNP)

Lección 3 12

6,9

a

c

d

b

8,0 2,5

10,5

1,5

2,51,1

8,0 2,5

e

f

1,5 9

9,0 Kb

12,0 Kbaa bb ddcc

8,0 Kb6,9 Kb

10,5 Kb

1,5 Kb

e

b

cd

a

e

ee ff

R.F.L.PR.F.L.P. (. (BotsteinBotstein et al., 1980)et al., 1980)Fundamento de la tFundamento de la téécnicacnica

Página 81

Page 86: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 13

R.F.L.PR.F.L.P. (2): Resultados. (2): Resultados

Lección 3 14

Cortar, desnaturalizar e hibridar

3m

3p

3p

3m

Sitios de restricción

Cromosomas paternos

Cromosomas maternos

Descendiente

Los RFLP tienen una herencia codominante

R.F.L.PR.F.L.P. (3): Resultados (2). (3): Resultados (2)

Lección 3 15

1. Corte mediante enzimas de restricción.2. Separación por electroforesis.3. Transferencia a filtro.4. Hibridación con sonda “marcada”.5. Visualización de los fragmentos donde se ha producido

hibridación.

R.F.L.PR.F.L.P. (4): Metodolog. (4): Metodologííaa

Página 82

Page 87: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 16

1. Corte mediante enzimas de restricción

5’3’

3’5’C T T A A G

G A A T T C

Corte

Enzima de restricción EcoRI

3’ 5’5’ 3’G

C T T A AA A T T C

Extremos cohesivos

G

R.F.L.PR.F.L.P. (5): Metodolog. (5): Metodologíía (2)a (2)

Lección 3 17

2. Separación por electroforesis

4. Hibridación con sonda

marcada con isótopo radiactivo (32P) o

digoxigenina5. Visualización de los fragmentos hibridados:

autorradiografía (32P) o quimioluminescencia(digoxigenina)

3. Transferencia a filtro (Southern)

esponjasolución tampón

gel de agarosa

bloque papel absorbentefiltro de nitrocelulosa

gel

filtro con ADN

R.F.L.PR.F.L.P. (6): Metodolog. (6): Metodologíía (3)a (3)

Lección 3 18

• Utilizan 1 cebador arbitrario de entre 5 y 20 pares de bases• Se amplifican secuencias al azar• Si el cebador hibrida en dos secuencias diana en cadenas opuestas y a una distancia

adecuada para que en cada ciclo de elongación se llegue de uno a otro, se amplificará el fragmento entre las 2 dianas

D

D

MAAP (CaetanoMAAP (Caetano--AnollAnollééss, 1994): Fundamento , 1994): Fundamento de la tde la téécnica.cnica.

Página 83

Page 88: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 19

M 1 2 3 4 5 6 7 8

800 pb

�Cebador de 10 bases de longitud

MAAP: RAPD (Williams et al., 1990): ResultadosMAAP: RAPD (Williams et al., 1990): Resultados

Lección 3 20

�Cebador de 5-10 bases de longitud

MAAP: DAF (CaetanoMAAP: DAF (Caetano--AnollAnollééss et al., 1991)et al., 1991)ResultadosResultados

Lección 3 21

SRAP (Sequence-Related Amplified Polymorphism)Primers: 13 a 15 bases• Forward: 5’ Núcleo de 14 bases + 3 nt. selectivos 3’� Núcleo: 5’ 10 bases aleatóreas + CCGG 3’� Nucleótidos selectivos: Variándolos se obtiene una “familia de

primers”• Reverse: Estructura similar con variaciones:� Núcleo: 5’ 10 bases aleatóreas diferentes a las del Forward +

AATT 3’• Reglas para la construcción de los primer� Que no formen horquillas u otras estructuras secundarias� Que contengan 40–50% de GC

MAAP: SRAP (Li MAAP: SRAP (Li andand QuirQuiróós, 2001)s, 2001)

Página 84

Page 89: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 22

Resultados:Dianthus chinensis, Dianthus barbatus and Dianthus superbus(Caryophyllaceae) planta ornamentales

MAAP: SRAP (Li MAAP: SRAP (Li andand QuirQuiróós, 2001)s, 2001)

Lección 3 23

� Esta metodología está optimizada para estudios en los que cada U.B.C. está formada por varios individuos que en principio sean idénticos.Ej: U.B.C. = variedad comercial

• PASO 1: Ensayar un elevado número de cebadores y seleccionar los que proporcionen buena amplificación.

• PASO 2: Realizar una nueva extracción de ADN y realizar una nueva amplificación con los mismos cebadores.

La metodología propuesta analiza la reproducibilidad global en un estudio de caracterización con MAAP.

RAPD: Propuesta de RAPD: Propuesta de metodologiametodologia para estudiar para estudiar reproducibilidad (Vidal et al. 1999)reproducibilidad (Vidal et al. 1999)

Lección 3 24

• PASO 3: Para cada amplificación, realizar un conteo de bandas.Para que una banda sea considerada presente, debe estar al menosen 4 de los 5 individuos (� por eso el interés de contar con varios individuos idénticos por U.B.C.)

• PASO 4: De las dos repeticiones, elegir una como “referencia” y otra como “comparada”La repetición que presente mayor número de bandas seráconsiderada como la “referencia”.La otra será la “comparada”.

RAPD: Propuesta de RAPD: Propuesta de metodologiametodologia para estudiar para estudiar reproducibilidad (2)reproducibilidad (2)

Página 85

Page 90: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 25

• PASO 5: Determinar los siguientes parámetros.�Se recomienda hacer los cálculos para cada U.B.C., y luego hallar

el valor medio.– Falsos Negativos (FN) %: Bandas NO visibles en la repetición

“comparada” y SI en la “referencia” con respecto al número total de bandas.

– Falsos Positivos (FP) %: Bandas NO visibles en la repetición “referencia” y SI en la “comparada” con respecto al número total de bandas.

– Reproducibilidad: R = 100 – FN – FP.• También se puede hacer el estudio para diferentes tipos de

bandas:– Por tamaño: Grandes/Intermedias/Pequeñas.– Por intensidad: Bien definidas/Débiles.

RAPD: Propuesta de RAPD: Propuesta de metodologiametodologia para estudiar para estudiar reproducibilidad (3)reproducibilidad (3)

Lección 3 26

• Ej variedades de vid

RAPD: Propuesta de RAPD: Propuesta de metodologiametodologia para estudiar para estudiar reproducibilidad (4)reproducibilidad (4)

Lección 3 27

CACACACACACACACA TGTGTGTGTGTGTGTGTGTGTGTG

GTGTGTGTGTGTGTGT ACACACACACACACACACACACAC

CACACACACACACACA TGTGTGTGTGTGTGTGTGTGTGTG

GTGTGTGTGTGTGTGT ACACACACACACACACACACACAC

producto PCRcebador con anclaje en 5’

NNN(CA)n

(AC)nNNN

(CA)nNN

NN(AC)n

producto PCRcebador con anclaje en 3’

ISSR (ISSR (ZietkiewiczZietkiewicz et al., 1994)et al., 1994)Fundamento de la tFundamento de la téécnicacnica

Página 86

Page 91: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 28

M 1 2 3 4 5 6 7 8 9 10

800 pb

ISSR (2): Resultados ISSR (2): Resultados

Lección 3 29

Corte con 2 enzimas de restricción

AATAATTC

GT

GAATTCAATTCTTAAGTTAA

Unión de adaptadoresTTAA

TA

AATTCTGAATCTTAAATTCT

GAATTTAAGA

GAATTTAAGA

GAATCTTAAATTCT

AATTCT

Amplificación selectiva1er ciclo

TATAATTCAATGTTAA

Cebadores AATTCT GAAT

AFLP (Vos et al., 1995): Fundamento de la tAFLP (Vos et al., 1995): Fundamento de la téécnicacnica

Lección 3 30

AFLP (2): ResultadosAFLP (2): Resultados

Página 87

Page 92: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 31

Electroforesis

186 pb182 pb

174 pb

Individuo C

Individuo A

A

Individuo B

CB

TGTGTGTGTGGTGTGTGTG

ACACACACACCACACACAC

GTGTGGTGTGTGTG

CACACCACACACAC

MicrosatMicrosatéélites (SSR/STMS) (lites (SSR/STMS) (TautzTautz, 1989), 1989)Fundamento de la tFundamento de la téécnicacnica

Lección 3 32

M ITA RUT ALV OHA SUP MAT

213 pb

192 pb184 pb

Electroforesis en gel de agarosa o poliacrilamida.

MicrosatMicrosatéélites (2)lites (2)MetodologMetodologíías para la separacias para la separacióón de fragmentosn de fragmentos

Lección 3 33

Detección del tamaño de los fragmentos de ADN mediante un secuenciador automático de ADN.

MicrosatMicrosatéélites (3)lites (3)MetodologMetodologíías para la separacias para la separacióón de fragmentos (2)n de fragmentos (2)

Página 88

Page 93: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 34

MicrosatMicrosatéélites (4)lites (4)Resultados con secuenciador automResultados con secuenciador automááticotico

Lección 3 35

MicrosatMicrosatéélites (5)lites (5)Resultados con secuenciador automResultados con secuenciador automáático (2)tico (2)

Lección 3 36

MicrosatMicrosatéélites (6)lites (6)Resultados con secuenciador automResultados con secuenciador automáático (3)tico (3)

Página 89

Page 94: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 37

• Base de datos del Instituto Agrario di San Michele all’Adige

http://meteo.iasma.it/genetica/gmc.html

MicrosatMicrosatéélites (7)lites (7)Bases de datos internacionalesBases de datos internacionales

Lección 3 38

• Swiss VitisMicrosatelliteDatabase(SVMD)

http://www1.unine.ch/svmd/

MicrosatMicrosatéélites (9)lites (9)Bases de datos internacionales (3)Bases de datos internacionales (3)

Lección 3 39

• Sistema de Identificación de Variedades de Vid Españolas mediante Microsatélites (SIVVEM)(Universidad Politécnica de Madrid)

http://www.sivvem.monbyte.com/sivvem.asp

MicrosatMicrosatéélites (10)lites (10)Bases de datos internacionales (4)Bases de datos internacionales (4)

Página 90

Page 95: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 40

POSIBLE APLICACIÓN: Averiguar los parentales de un determinado clon.

No Cultivar identificatioLoc. 1 Loc. 1 Loc. 2 Loc. 2 Loc. 3 Loc. 3 Loc. 4 Loc. 4 Loc. 5 Loc. 5 Loc. 6 Loc. 64 Albarín Blanco 150 150 228 234 241 255 165 165 187 193 243 2491 Agudelo 130 150 224 228 237 255 151 165 187 193 245 249

41 Espadeiro 136 150 232 234 237 241 151 165 187 187 243 245

� Para estimar la probalidad de que la hipótesis sea cierta, se aplica el procedimiento de la “máxima verosimilitud”.

MicrosatMicrosatéélites (11)lites (11)

Lección 3 41

• Se parte de un fragmento de ADN genómico o cloroplástico amplificado mediante PCR.

• Se somete a digestión mediante enzimas de restricción• Se revela el polimorfismo por electroforesis

Detección de híbridos.Análisis con ADN genómico

Análisis poblacionalADN cloroplástico

CAPS [PCRCAPS [PCR--RFLP] (Konieczny & Ausubel, 1993)RFLP] (Konieczny & Ausubel, 1993)

Lección 3 42

• Muy utilizado:– Identificación de variedades.– Análisis poblacionales.

• ADN cloroplástico muy conservado en el reino vegetal � poca variación intraespecífica � la combinación PCR-RFLP evita esta limitación.

• Razones de su éxito:– Primers para amplificación del ADN cloroplástico “universales”.– La técnica RFLP no requiere radiactividad.

PCRPCR--RFLP de ADN RFLP de ADN cloroplcloropláásticostico

Página 91

Page 96: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 43

Combinación cebador – enzima: K1K2-TaqI

Patrones mayoritarios y variantes para diferentes combinaciones de

cebador y enzimaHaplotipos: Combinaciones de

patrones obtenidos en el estudio

PCRPCR--RFLP de ADN RFLP de ADN cloroplcloropláásticostico (2)(2)

Lección 3 44

Clonación

Secuenciación

�También RFLP; AFLP

GTAGTTCCTGCATCAAGGAC GTAGTTCCTGRAPD �

CATCAAGGAC

GTAGTTCCTGtcgaccaaCATCAAGGACagctggtt GTAGTTCCTGtccggatcSCAR

CATCAAGGACaggcctag

� Es un marcador muy específico a partir de otro que proporciona un elevado número de bandas

SCAR (Paran & SCAR (Paran & MichelmoreMichelmore, 1993), 1993)

Lección 3 45

• Consiste en detectar la secuencia primaria del ADN.• Metodologías principales:

– Maxam-Gilbert (1977)– Sanger (1977). Es más fácilmente automatizable, y en la actualidad hay

secuenciadores totalmente automáticos.• Bases del proceso:

– Se parte de fragmentos de ADN obtenidos bien de una librería de genes o genoteca, o de una reacción de PCR.

– Cada uno de estos fragmentos se usa como una plantilla para generar un conjunto de sub-fragmentos que difieren entre si, en longitud, en una sola base.

– Los sub-fragmentos se separan mediante electroforesis.– Se identifica la base que queda al final de cada sub-fragmento porque

previamente se ha teñido con fluorocromos.– Para secuenciar determinadas partes del genoma es necesario ensamblar varios

fragmentos.

SecuenciaciSecuenciacióón del ADNn del ADN

Página 92

Page 97: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 46

3’CTGATCGCGTGGTACACTGTCATCTGTCT5’GACTAG5’GACTAGC5’GACTAGCGC5’GACTAGCGCAGC5’GACTAGCGCA5’GACTAGCGCAG5’GACTAGCGCAGCA5’GACTAGCG5’GACTAGCGCACCAT

5’GACTAG5’GACTAGC

5’GACTAGCGC

5’GACTAGCGCAGC

5’GACTAGCGCA5’GACTAGCGCAC

5’GACTAGCGCAGCA

5’GACTAGCG

5’GACTAGCGCAGCAT

http://www.genome.gov/19519278#al-3 (How to sequence a human genome)

SecuenciaciSecuenciacióón del ADN (2).n del ADN (2).

Lección 3 47

¿¿Y que hacemos con los que nos da el secuenciador?Y que hacemos con los que nos da el secuenciador?

Lección 3 48

Alineamiento múltiple

Comparación con bases de datos

Datos de secuenciación Ensamblado secuenciasADN Traducción a proteína

Comparación con bases de datos

Alineamiento con Proteínas similares

Características proteínas.Deducción de conclusiones

Los fundamentos de la bioinformática

Reconstrucción filogenética …

¿¿Y que hacemos con los que nos da el Y que hacemos con los que nos da el secuenciador? (2)secuenciador? (2)

Página 93

Page 98: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 49

• EST (Expressed Sequence Tags)• ITS (Internal Transcriber Spacer)• Genes que codifican para el RNA ribosómico

– La taxonomía de las bacterias está basada en el gen 16S DNA

¿¿QuQuéé secuenciar?secuenciar?

Lección 3 50

• Secuencias obtenidas a partir de ADN complementarios de diversosorganismos, que representan por tanto fragmentos de genes que seestán expresando activamente.

• Los EST se obtienen a partir de genotecas de ADN complementario (ADNc) obtenidos a partir de un ARNm.

Transcriptasa inversa

Degradación de ARNmSíntesis de la segunda cadena de ADN

GUACU AGUAGU ARNm

CATGAGUACU AGUAGU

TCATCAARNmADNc

CATGA TCATCAGTACT AGTAGT ADN duplexo

E.S.TE.S.T. (Craig . (Craig VenterVenter,1991),1991)

Lección 3 51

• El ADNc se secuencia de manera total o parcial dando origen al EST.

– Puede secuenciarse el extremo 5’: Se secuencia la parte codificante del gen– Puede secuenciarse el extremo 3’: Con frecuencia esto conlleva secuenciar

regiones no codificantes, pero de mayor variabilidad• Son secuencias cortas (10-600 bp) y de poca calidad, ya que la

secuencia corresponde a una única lectura de una de las cadenas (los errores incluyen no solo cambios de bases, sino inserciones y deleciones).

E.S.TE.S.T. (2). (2)

Página 94

Page 99: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 52

Aplicaciones en caracterización de germoplasma vegetal– Estudios de diversidad genética.– Estudios de evolución genética�Su mayor utilidad es que permite comparar una secuencia problema

para determinar:- Si es una región codificante- Si existe “splicing”* alternativo - Si existen posibles homólogos en otros organismos.

�Las secuencias EST son fáciles de obtener, por lo que representan en la actualidad más de la mitad de las entradas del GenBank/EMBL,

*Es un proceso post-transcripcional de corte y empalme de ARN

E.S.TE.S.T. (3). (3)

Lección 3 53

• Es la región espaciadora interna del ADN ribosómico nuclear (18S-26S)• Existen 2 espaciadores en esta región: ITS-1 e ITS-2

18S rADN 5.8SrADN 26S rADNITS1 ITS2

� El análisis conjunto de ambas regiones proporciona árboles filogenéticos con mejor resolución y más consistentes que cuando se utiliza una sola de las regiones ITS

I.T.SI.T.S..

Lección 3 54

Aplicaciones en caracterización de germoplasma vegetal– Estudios filogenéticos.– Han demostrado su utilidad para aclarar la filogenia en taxa de difícil

clasificación.– Se ha demostrado en algunos casos que tiene utilidad a niveles

taxonómicos infraespecíficos.

Aplicación en caracterización de recursos genéticos bacterianos.– Sirven para la identificación precisa de las cepas y para la descripción

de nuevas especies.�Los genes que codifican para el ARN ribosómico se encuentran en

todos los organismos y están lo suficientemente conservados para tener validez en el estudio de relaciones evolutivas.

I.T.SI.T.S. (2). (2)

Página 95

Page 100: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 55

FUNDAMENTO DE LA TÉCNICA• Son pequeños soportes, generalmente portaobjetos de vidrio o

membranas de nylon donde se fijan de manera ordenada fragmentos de “ADN diana”.

• En las propias matrices se produce la hibridación de pequeñas sondas o trozos de ADN (generalmente ADNc), que están marcadas con fluorescencia.– La hibridación se produce donde haya complementariedad de

bases.

MicroarraysMicroarrays,, matricesmatrices,, arreglosarreglos oo ““chipschips””

Lección 3 56

Aplicaciones en caracterización de germoplasma vegetal.– Identificación de secuencias génicas o de mutación génica (por

ejemplo un gen disfuncional frente a otro normal)– Determinación del nivel de expresión de los genes.– Abundancia de secuencias específicas en el ADN genómico– Detección de SNP– Primera caracterización rápida del germoplasma– Construcción de mapas genéticos– Marcadores en mejora

MicroarraysMicroarrays,, matricesmatrices,, arreglosarreglos oo ““chipschips”” (2)(2)

Lección 3 57

MicroarraysMicroarrays,, matricesmatrices,, arreglosarreglos oo ““chipschips”” (3)(3)

Ejemplo de visualización de un Microarray.– Verde: Representa los puntos donde se hibridó

el genotipo cuyo ADN “se tiñó de verde”– Rojo: Representa los puntos donde se hibridó el

genotipo cuyo ADN “se tiñó de rojo”– Amarillo: Representa los puntos donde se

hibridaron ambos genotipos.– Negro: Representa los puntos donde no hubo

ningún tipo de hibridación.

Página 96

Page 101: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 58

Se trata de sustituciones nucleotídicas, que ocurren con una frecuencia relativamente alta en el genoma.

Ej: Maíz

Utilidad: Detectan el nivel de polimorfismo más elemental que existe. De gran interés para:

• Marcadores de caracteres de interés agronómico.• Identificación de variedades.

SNPsSNPs

Lección 3 59

CaracterCaracteríísticas MMsticas MM--ADNADN

•Diseño de cebadores exige secuenciación

•Codominante•Polimorfismo muy alto•Reproducibilidad alta

STMS

•Dominante•Simplicidad•Mejor reproducibilidad

ISSR

•Dominante•Complejidad

•Polimorfismo muy altoAFLP

•Reproducibilidad baja•Dominante

•SimplicidadMAAP

•Complejidad técnica

Puntos débiles•Codominante•Reproducibilidad alta

RFLP

Puntos fuertes

Lección 3 60

CaracterCaracteríísticas MMsticas MM--ADN (2)ADN (2)

•Difícil de poner a punto para un taxon dado

•Codominante•Altamente discriminante

SNP

•Precisa información sobre secuencias génicas (ADNc)•Complejidad técnica

•Alto rendimiento•Exploración del genoma entero

Microarrays

•Marcador dominante•Complejidad técnica

•No requiere información sobre secuencias génicas•Alto rendimiento•Detecta cambios en una sola base

DArT

•Complejidad técnica (contratar el servicio)•Costos elevados

Puntos débiles

•Reproducibilidad muy alta•Máxima información (interesante para estudios filogenéticos)

Secuenciaciónde diversos fragmentos

Puntos fuertes

Página 97

Page 102: Guia Ntsys

Lección 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Lección 3 61

A A A A A A A AB B B B B B B B

NNNN S S S S

S SN N

alta baja

Diagrama para la selecciDiagrama para la seleccióón de la tn de la téécnica molecular mcnica molecular máás adecuada (2).s adecuada (2).

RAPD RAPDRAPD RAPD

SC-PCRSC-PCR

PCR-RFLPPCR-RFLP

PCR-RFLPAFLP AFLPAFLP

AFLPAFLP

AFLPAFLP

STMSSTMS STMS

STMS

STMS STMS STMSSTMS STMS STMS

* recursosdisponibles

nivel de variabilidad

primers

tlimit

*

RFLP

RFLP

Lección 3 62

Página 98

Page 103: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 1

LECCIÓN 4. Evaluación e interpretación de resultados en caracterización molecular.

Lección 4 2

• Determinación de la diversidad genética y su distribución entre y dentro de las poblaciones de una determinada especie.

• Cuantificación de las relaciones entre UBC y representación geométrica de dichas UBC.�La cuantificación de las relaciones se puede hacer desde dos puntos

de vista:- Basado en las distancias geométricas (las llamaremos distancias

fenotípicas, también llamadas fenéticas).No considera los procesos evolutivos, por lo que la distancia permanece constante con tiempoLos dendrogramas obtenidos son fenogramas que no pueden interpretarse como árboles filogenéticos

- Basado en las distancias genéticas.Considera los procesos evolutivos

Posibles enfoques del trabajoPosibles enfoques del trabajo

Lección 4 3

• Interpretación genética

Frecuencias de cada uno de los alelos posibles en cada

locus

Posible interpretaciPosible interpretacióón de los resultadosn de los resultados

Página 99

Page 104: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 4

• Interpretación fenotípica

Presencia/Ausencia de bandas por lo que se considera que

cada banda es un locus con 2 alelos

1:presente0: ausente

Posible interpretaciPosible interpretacióón de los resultados (2)n de los resultados (2)

Lección 4 5

• Interpretación molecularEn casos de secuenciación

Posible interpretaciPosible interpretacióón de los resultados (3)n de los resultados (3)

Lección 4 6

SECUNDARIAPRINCIPAL

Dominante

Codominante

Tipo de marcador

Genética (con restricciones):– En especies autógamas para locus que solo

presenten 2 alelos presencia/ausencia de una banda

� Es necesario examinar 2 generaciones de la misma población para medir la segregación de los loci

Fenotípica

FenotípicaGenética

Interpretación

Posible interpretaciPosible interpretacióón de los resultados (4)n de los resultados (4)

Página 100

Page 105: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 7

• Frecuencias alélicas (pi)• Número medio de alelos por locus (A)• Número medio de alelos por locus polimórfico (Ap)�Es aquel en que la frecuencia del alelo más común es igual o inferior a

0.99 (0.95).• Índice de polimorfismo�Relación entre el número de loci polimórficos frente a totales (%)

• Número de alelos únicos.�Se encuentran solo en esa población

• Número efectivo de alelos en un locus (Effective Number of Allele: ENA) (Kimura and Crow, 1964).

Hace referencia a los alelos con capacidad de pasar a la siguiente generación

� 2

1

ipENA pi: frecuencia del alelo i

Diversidad genDiversidad genéética: Interpretacitica: Interpretacióón genn genééticatica

Lección 4 8

• Heterocigosidad esperada (heterocigosisdad media o diversidad genética media) (He) (Nei 1973)

• Hj: Heterocigosidad esperada en un locus j• pij: frecuencia del alelo i del locus j• m: número de alelos en el locus j• n: número de loci considerados

n

p

n

HjHavHe

n

j

m

iij

n

j � ��

��

��

��� 1 1

2

11

�Expresa la heterocigosidad esperada en el locus medio si el apareamiento fuese al azar

�Valor máximo (=diversidad máxima) Hj=0,5Valor minimo (=diversidad mínima) Hj=0

�Este índice puede estimar la diversidad genética:• Promedio de la diversidad genética intrapoblacional (HS)• Diversidad genética total (en la población total =� de todas las poblaciones) (HT)• Diversidad genética interpoblacional: DST = HT - HS

• Coeficiente de diferenciación genética entre poblaciones GST= (DST/HT)*100

DivDiv. gen. genéética: Interpretacitica: Interpretacióón genn genéética (2)tica (2)

Lección 4 9

• Heterocigosidad observada (Ho)

analizadosindividuosdetotalnúmerotosheterocigoindividuosH o �

• Probabilidad de alelos nulos para un determinado locus

� �� �e

oe

HHHr

�1

� Si es negativa o muy baja puede considerarse que la presencia de una sola banda (isoenzimática o MM-ADN) corresponde con un homocigoto, y no con un heterocigoto con un alelo nulo.

DivDiv. gen. genéética: Interpretacitica: Interpretacióón genn genéética (3)tica (3)

Página 101

Page 106: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 10

– FIS: Coeficiente de endogamia. Mide la reducción en la heterocigosidadindividual debido a las desviaciones de los cruzamientos al azar

– FST: Índice de fijación. Reducción de la heterocigosidad en una subpoblación debido a los cruzamientos NO al azar, con respecto a la población total

S

lSIS H

HHF �

• Hl Promedio de la heterocigosidadobservada en todas las poblaciones

• HS Heterocigosidad esperada en cada subpoblación

T

STST H

HHF �

� �� � � �ITSTIS FFF � 111–

• “Estadísticos F” (Wright)

HT Heterocigosidad esperada en la población total (=� de todas las poblaciones)

DivDiv. gen. genéética: Interpretacitica: Interpretacióón genn genéética (4)tica (4)

Lección 4 11

– Interpretación de valores FST.El rango de FST es:

• “Estadísticos F” (Wright) (2)

no existe diferenciación genética entre subpoblaciones

fijación para alelos alternos en diferentes subpoblaciones

0 1

Valor de F Diferenciación•De 0 a 0.05 pequeña•De 0.05 a 0.15 moderada•De 0.15 a 0.25 grande•>0.25 muy grande

DivDiv. gen. genéética: Interpretacitica: Interpretacióón genn genéética (5)tica (5)

Lección 4 12

- Sirve para estudiar la variación molecular dentro de una especie– Se basa en un modelo jerárquico y anidado– Diferencias con el ANOVA:

• Puede contener diferentes suposiciones evolutivas sin modificar la estructura básica del análisis:

• La hipóteis utiliza métodos de permutación que no requieren la suposición de una distribución normal

� Niveles jerárquicos de la diversidad genética estudiada por medio del AMOVA:• Continentes que contengan niveles jerárquicos menores• Regiones geográficas dentro de un continente• Zonas dentro de una región, en un continente• Poblaciones dentro de una zona de un región, en un continente.• Individuos dentro de una población en una zona de una región en un

continente

• Análisis de varianza molecular (AMOVA)

DivDiv. gen. genéética: Interpretacitica: Interpretacióón genn genéética (6)tica (6)

Página 102

Page 107: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 13

• Análisis de varianza molecular (AMOVA) (2)– Se aplica a haplotipos, que pueden obtenerse de:

• Datos de RFLP• Datos de RAPD • Secuencias de ADN

– Ejemplo del modelo para un caso de medición de la diversidad génica entre poblaciones en áreas de una región en un continente:

Yki(j)=Y+ak+bk(i)+wki(j)

• ak: Efecto de la k-ésima población con varianza �2a

• bk(i): Efecto del i-ésimo individuo dentro de la k-ésima población, con varianza �2b

• wki(j) Efecto del j-ésimo locus del i-ésimo individuo de la k-ésimapoblación, con varianza �2w

DivDiv. gen. genéética: Interpretacitica: Interpretacióón genn genéética (7)tica (7)

Lección 4 14

• Contenido de información de un polimorfismo (“Polymorphism Information Content”:PIC) (Botstein et al. 1980)

� � � 222 ··21 jii pppPIC

� Medida de la informatividad de un marcador genético, que depende del número de alelos para ese locus y de sus frecuencias relativas.

� Informatividad: Para un marcador genético, la probabilidad de que un descendiente de una pareja sea informativo, es decir, que se pueda deducir el origen parental de cada uno de los alelos de ese locus.

� PIC junto con ENA sirven para evaluar la utilidad de un determinado locus de un marcador molecular para distinguir entre las UBC analizadas

DivDiv. gen. genéética: Interpretacitica: Interpretacióón genn genéética (8)tica (8)

Lección 4 15

• Poder discriminante de un locus marcador (D) (Jones, 1972; Lamoby andAlpha, 1998)� Es una estimación de la probabilidad de que dos accesiones

muestreadas al azar puedan ser distinguidas por sus perfiles STMS en un determinado locus.

CD �1• C: Probabilidad de coincidencia o probabilidad de que dos accesiones

coincidan por azar en un locus.

� 2iPC Pi: Frecuencia de los diferentes

genotipos observados en el locus en cuestión

�Poder discriminante combinado para todos los loci

TT CD �1 CCT ��

DivDiv. gen. genéética: Interpretacitica: Interpretacióón genn genéética (9)tica (9)

Página 103

Page 108: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 16

• Índice de uniformidad de una población (Weising et al. 1995)

�m

iUj

1ijp

m1 • pij: frecuencia del carácter i (banda i) en la

población j• m: número de caracteres (bandas) analizado• uniformidad máxima U = 1 ó U = 0; mínima U =

0.5

• Índice de Shannon de diversidad de una población j (Hj) (Shannon & Weaver 1949)

• m: número de caracteres (bandas) considerado

• Su valor mínimo es cero y se hace mayor al aumentar la diversidad

ij

m

ipHj lnp

1ij

Diversidad genDiversidad genéética: Interpretacitica: Interpretacióón fenotn fenotíípicapica

Lección 4 17

• Polimorfismo de la población media (Hpop)

��

��m

iijij

n

jHpop

11plnpHj

n1

n: número de poblaciones

pi: frecuencia del carácter i (banda i) en la especie

�m

iiiHsp

1plnp

• Polimorfismo de la especie (Hsp)

DivDiv. gen. genéética: Interpretacitica: Interpretacióón fenotn fenotíípica (2)pica (2)

Lección 4 18

• Condiciones ideales de los caracteres a utilizar:– Ser independientes dentro de cada individuo examinado.– Ser homólogos entre diferentes individuos.– Ser suficientemente numerosos.

VisualizaciVisualizacióón de las relaciones entre UBC: n de las relaciones entre UBC: formaciformacióón de grupos.n de grupos.

Página 104

Page 109: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 19

¿Misma banda, mismo fragmento?

¿Una banda, un fragmento?

Williams et al. (1993); Rieseberg (1996)

Problemas de interpretación que pueden plantearse: alta homología

VisualizaciVisualizacióón de las relaciones entre UBC: n de las relaciones entre UBC: formaciformacióón de grupos (2)n de grupos (2)

Lección 4 20

Formación de gruposFormación de grupos

Construcción de la Matriz Básica de Datos

Estimación del parecido entre UBC: Similitud o distanciaSi interpretación genética “distancia genética”

Construcción de la matriz de similitud

VisualizaciVisualizacióón de las relaciones entre UBC: n de las relaciones entre UBC: formaciformacióón de grupos (3)n de grupos (3)

Lección 4 21

• Casos:– Interpretación genética: Determinación de frecuencias de todos

los alelos de cada locus– Interpretación fenotípica: Determinación de presencia/ausencia de

bandas.

VisualizaciVisualizacióón de las relaciones entre UBC: n de las relaciones entre UBC: formaciformacióón de grupos (4)n de grupos (4)

Página 105

Page 110: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 22

– Tabla con los genotipos de cada UBC– Matriz de 0/1/2 para las diferentes

alternativas alélicas de cada locus

Software calcula

frecuencias alélicas

– Como alternativa, se pueden introducir directamente frecuencias alélicas.

• Matriz de datosRelaciones entre UBC: Distancia genRelaciones entre UBC: Distancia genééticatica

Lección 4 23

• Cálculo matriz de distancia o similitud genética entre poblaciones.– Distancia de Rogers. (Rogers 1972)

� � � �

�m

x

q

kkjkiij xx

md

1 1

2

21

m: número de lociq: número de alelos para el locus xxki: frecuencia del alelo k en la población ixkj: frecuencia del alelo k en la población j

gg

Relaciones entre UBC: Distancia genRelaciones entre UBC: Distancia genéética (2)tica (2)

Lección 4 24

• Cálculo matriz de distancia o similitud genética entre poblaciones(2).– Distancia de Nei o distancia genética estándar (Nei 1972)�Considera cambios en las frecuencias alélicas derivados tanto de

mutaciones como de efectos de deriva genética (adecuada paraestudios filogenéticos).

�����

�����

q

kkjki

q

kkjki

xx

xxDij

1

22

1ln

gg

– Distancia de Nei (Nei UB o 1978)

12

2

12

2

ln

1

2

1

2

1

22

1

�����

�����

��

j

q

kkjj

i

q

kkii

q

kkjki

q

kkjki

n

mxn

n

mxn

xx

xx

Dij

Relaciones entre UBC: Distancia genRelaciones entre UBC: Distancia genéética (3)tica (3)

Página 106

Page 111: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 25

• Cálculo matriz de distancia o similitud genética entre individuos.– Índice de Mannen (GS) (Mannen et al. 1993)

p: número de loci en los que ambos individuoscomparten genotipo

q: número de loci en los que un individuo eshomocigota y el otro heterocigota

m: número total de loci analizados

mqpGS

22 �

gg

Relaciones entre UBC: Distancia genRelaciones entre UBC: Distancia genéética (4)tica (4)

Lección 4 26

• Matriz de datos– Matriz presencia - ausencia.

Relaciones entre UBC: Distancia Relaciones entre UBC: Distancia fenfenééticatica

Lección 4 27

• Cálculo matriz de distancia o similitud fenética entre individuos*.– Coeficiente de Dice (SD) (Dice 1945) o de Nei-Li (1979).

caba

acaba

aD

S���

����

�2

2

)()(

a: número de bandas presentes en ambos individuosb: número bandas presentes en el primer individuo, pero no en el segundoc: número de bandas presentes en el segundoindividuo pero no en el primero

�Expresa probabilidad de que una banda en un individuo esté también en otro. �Es el índice que se ve menos afectado por las bandas erráticas cuando la

similitud entre muestras se debe más a dobles presencias que a doblesausencias

ff

*o conjunto de individuos de los que se haya obtenido un único patrón de bandas

Relaciones entre UBC: Distancia Relaciones entre UBC: Distancia fenfenééticatica (2)(2)

Página 107

Page 112: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 28

• Cálculo matriz de distancia o similitud fenética entre individuos(2).– Simple Matching Coefficient (SSM) (Sokal & Michener 1958).

d: número de marcadores en los cuales la bandaestá simultáneamente ausente en ambos individuosdcba

daSSM ����

�Este coeficiente presenta la particularidad de considerar como factor de similitud las dobles ausencias.�Su utilización conduce a errores si detrás de las dobles ausencias no hay una

identidad (comparaciones interespecíficas mediante RAPDs). �No obstante, cuando se hacen comparaciones intraespecíficas, las dobles

ausencias se pueden considerar como identidades.

ff

Relaciones entre UBC: Distancia Relaciones entre UBC: Distancia fenfenééticatica (3)(3)

Lección 4 29

• Cálculo matriz de distancia o similitud fenética entre individuos(3).– Coeficiente de Jaccard (SJ) (Jaccard 1908; Sneath & Sokal 1973)

cbaasJ ��

ff

Relaciones entre UBC: Distancia Relaciones entre UBC: Distancia fenfenééticatica (4)(4)

Lección 4 30

Tratamiento de los resultados de secuenciaciTratamiento de los resultados de secuenciacióónn

• PASO 1: Ensamblar las secuencias de ADN obtenidas de la secuenciación

• PASO 2: Comparar la secuencia problema con las depositadas en las bases de datos (alineamiento).

• PASO 3. Alineamientos múltiples.• PASO 4. Construcción de árboles filogenéticos.

Página 108

Page 113: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 31

• Consiste en ensamblar fragmentos para obtener un “contig”• Software para realizar el ensamblaje: DNASTAR o VectorNTI poseen módulos

específicos para realizar el ensamblaje

Ej: SeqMan es una aplicación del DNAStar que permite:– Comparar secuencias de DNA entre sí.– Hacer anillamientos de varias secuencias para obtener un consenso final

que sería la suma de todas las secuencias parciales. – Comparación con bases de datos mediante “alineamiento” de nuestra

secuencia con todas las depositadas en las bases de datos.

PASO 1: Ensamblar las secuencias de ADN PASO 1: Ensamblar las secuencias de ADN obtenidas de la secuenciaciobtenidas de la secuenciacióónn

Lección 4 32

FINALIDAD: Se trata de comparar nuestra secuencia ("query sequence") con cada una de las secuencias presentes en la base de datos ("subject sequence"), determinando la puntuación de cada alineamiento generado.

PASO 2: Comparar la secuencia problema con las PASO 2: Comparar la secuencia problema con las depositadas en las bases de datos (alineamiento). depositadas en las bases de datos (alineamiento).

OBJETIVO DEL ALINEAMIENTO DE DOS SECUENCIAS: Determinar si poseen suficiente similitud como para poder justificar la existencia de homología entre ellas. � La similitud es un concepto cuantificable, que puede medirse y expresarse

como un porcentaje de identidad entre dos secuencias. � La homología se refiere a una conclusión obtenida de esos datos, e indica si

dos secuencias están relacionadas o comparten una historia evolutiva común. Los genes son o no son homólogos, pero no existen grados de homología.

DEFINICIÓN DE ALINEAMIENTO DE DOS SECUENCIAS: Alinear dos secuencias es un método para determinar si un conjunto de caracteres se encuentran en el mismo orden en dos secuencias

Lección 4 33

EL CONCEPTO DE “GAP”Son los huecos (“gaps” en inglés) que es necesario introducir en el alineamiento para compensar las deleciones/ inserciones que ocurren a lo largo de la evolución. �Si permitimos la inserción de numerosos huecos en el alineamiento, en

teoría podríamos alinear dos secuencias completamente divergentes, … el resultado sería una sucesión improbable de huecos y letras. • Para evitar que esto ocurra, los programas de alineamiento introducen:

– Una penalización en la puntuación del alineamiento por cada hueco que se abre (G o "gap opening penalty")

– Otra adicional en función de la longitud del hueco (L o "gap extension penalty").

Alineamiento de nuestra secuencia con las Alineamiento de nuestra secuencia con las depositadas en las bases de datos depositadas en las bases de datos

Página 109

Page 114: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 34

• GenBank (http://www.ncbi.nlm.nih.gov/genbank/) que depende del NCBI (NationalCenter for Biotechnology Information) (USA) y que utiliza el software BLAST (Basic Local Alignment Search Tool) para el alineamiento

• EMBL Nucleotide Sequence database (European Molecular Biology Laboratory) (http://www.ebi.ac.uk/embl/) que depende del EBI (European Bioinformatics Institute) (Reino Unido) y que utiliza el software FASTA para el alineamiento.

• DDBJ (DNA Data Bank of Japan)• Específicas como EZTAXON (http://eztaxon-e.ezbiocloud.net/) muy usada para

procariotas que alberga la secuencia del gen 16S rDNA de más de 35.000 accesiones.

� Cuando comparamos una secuencia desconocida con las bases de datos, normalmente se comienza utilizando BLAST al ser más rápido. Posteriormente, puede repetirse el análisis usando FASTA para comprobar si alguna homología significativa ha sido omitida por el primer programa.

BASES DE DATOS UTILIZABLES CON SOFTWARE “ONLINE” PARA HACER LA BÚSQUEDA

Alineamiento de nuestra secuencia con las Alineamiento de nuestra secuencia con las depositadas en las bases de datos (2)depositadas en las bases de datos (2)

Lección 4 35

De nuestra secuencia con las más similares encontradas en las bases de datos, o con las que constituyen el grupo de UBC que estamos caracterizando, más otro material de referencia en su caso.

� Se usan programas como MEGA o CLUSTAL

PASO 3. Alineamientos mPASO 3. Alineamientos múúltiplesltiples

Lección 4 36

PROPOSITO DE LOS ALINEAMIENTOS MÚLTIPLES: colocar los residuos (aminoácidos o bases) que derivan de un ancestro común en columnas. Esto se logra introduciendo “gaps” que representan inserciones o deleciones ocurridas durante el proceso evolutivo.� Por tanto, el alineamiento resultante tras el proceso de alineamiento múltiple

de secuencias es un modelo hipotético para explicar las mutaciones (sustituciones, inserciones o deleciones) ocurridas durante la evolución. Es decir, un alineamiento se puede considerar una hipótesis de homología posicional entre residuos.

DEFINICIÓN DE ALINEAMIENTOS MÚLTIPLES: Es el resultado del alineamiento de 3 o más secuencias unas respecto a otras para lograr alcanzar la máxima similitud entre ellas.

Seq. 1Seq. 2Seq. 3Seq. 4Seq. 5

Alineamientos mAlineamientos múúltiples de nuestra secuencia ltiples de nuestra secuencia con la de otras UBCcon la de otras UBC

Página 110

Page 115: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 37

• Si el alineamiento de varias secuencias se considera muy bueno, es muy posible que las secuencias sean similares por razones filogenéticas, siendo en ese caso útiles para:

� Construir árboles filogenéticos.� Indagar sobre la historia biomolecular� Especular sobre los factores que han impulsado la evolución (presión

selectiva).

• Como norma general:� >50% identidad para interesarse por ellas� >75% identidad para estudios filogenéticos

APLICACIONES DE LOS ALINEAMIENTOS MÚLTIPLES:

Alineamientos mAlineamientos múúltiples de nuestra secuencia ltiples de nuestra secuencia con la de otras UBC (2)con la de otras UBC (2)

Lección 4 38

1. Buscar secuencias similares a la secuencia de interés.– Realizar la búsqueda en las bases de datos e identificar las

potencialmente homólogas a ésta. – Utilizar las secuencias de la UBC en estudio y de otros organismos que

a priori se sepa que están relacionados filogenéticamente.2. Recopilar las secuencias de interés en único documento de texto.

El formato del documento dependerá del programa a utilizar3. Realizar el alineamiento múltiple con el programa que queramos 4. Analizar y editar el alineamiento.

PASOS A DAR PARA REALIZAR ALINEAMIENTOS MÚLTIPLES:

Alineamientos mAlineamientos múúltiples de nuestra secuencia ltiples de nuestra secuencia con la de otras UBC (3)con la de otras UBC (3)

Lección 4 39

• Hay varios programas para realizar alineamientos múltiples.• Casi todos utilizan algoritmos heurísticos para realizan alineamientos

múltiples progresivos. • Por el contrario, el programa PROBCONS se basa en un nuevo parámetro,

denominado consistencia probabilística, que permite al programa predecir la probabilidad con la que el alineamiento realizado se ajusta a la realidad.

• El programa más utilizado es el CLUSTAL.

SOFTWARE PARA PRODUCIR ALINEAMIENTOS MÚLTIPLES:

Alineamientos mAlineamientos múúltiples de nuestra secuencia con ltiples de nuestra secuencia con la de otras UBC (4)la de otras UBC (4)

Página 111

Page 116: Guia Ntsys

Lección 4

Curso Intensivo de Postgrado UACH. Mexico 2012 Fernando González Andrés

Lección 4 40

• Basado en el método “Alineamiento Múltiple Global progresivo” por métodos heurísticos.

• Lógica del programa: Realiza en primer lugar una serie de alineamientos por pares, comparando cada secuencia con todas las demás para construir una matriz de distancias.

• Formas de utilizar CLUSTAL– Instalándolo en nuestro ordenador: Es la versión CLUSTAL X.– Usándolo como parte de paquetes bioinformáticos integrados. – Utilizándolo a través de páginas Web. Es la versión CLUSTAL W.

• Información que debe introducirse: – Todas las secuencias que deseamos usar en el análisis utilizando

cualquier editor de textos grabando en formato ASCII.– La forma de expresar las secuencias puede ser el formato de FASTA,

EMBL, Swiss-Prot, …

CLUSTAL

Alineamientos mAlineamientos múúltiples de nuestra secuencia ltiples de nuestra secuencia con la de otras UBC (5)con la de otras UBC (5)

Lección 4 41

Para la construcción de un árbol filogenético es frecuente utilizar el método de agrupamiento denominado Neighbor Joining (NJ) (Saitou and Nei, 1987).

�NTSYS puede elaborar este tipo de árboles (la opción está dentro del subprograma “Cluster”)

�Se suele utilizar MEGA�También se puede utiliza PHYLIP

PASO 4. ConstrucciPASO 4. Construccióón de n de áárboles filogenrboles filogenééticos. ticos.

Lección 4 42

Página 112

Page 117: Guia Ntsys

113

EEJJEERRCCIICCIIOOSS PPRRÁÁCCTTIICCOOSS.. DDOOCCUUMMEENNTTAACCIIÓÓNN..

Página 113

Page 118: Guia Ntsys

114

Página 114

Page 119: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

IINNDDIICCEE DDEE CCOONNTTEENNIIDDOO..I. CARACTERIZACIÓN MORFOLÓGICA..................................................................... 117

EJERCICIO 1. Elección de caracteres morfométricos................................................... 117

EJERCICIO 2. Toma de datos de caracteres y descriptores morfométricos en imágenes digitales de órganos vegetales, usando el programa IMAGE TOOL 3.00. .................... 121

EJERCICIO 3. Ejercicio sobre codificación de caracteres............................................. 123

EJERCICIO 4. Análisis de la estabilidad caracteres (descriptores) morfológicos y morfométricos................................................................................................................. 135

EJERCICIO 5. Aplicación del análisis multivariante a estudios de caracterización morfológica..................................................................................................................... 137

II. CARACTERIZACIÓN MEDIANTE MARCADORES MOLECULARES................. 139

EJERCICIO 6. Análisis genético de poblaciones con un marcador codominante. ........ 139

EJERCICIO 7. Interpretación de un marcador molecular como presencia/ausencia de bandas: Establecimiento de relaciones fenéticas entre UBC.......................................... 149

EJERCICIO 8. Interpretación de resultados de RAPD como presencia/ausencia de bandas: Análisis poblacional de la variabilidad inter e intrapoblacional. ..................... 151

EJERCICIO 9. Análisis de microsatélites. ..................................................................... 153

EJERCICIO 10. Análisis bioinformático de la secuencia de un gen en un grupo de UBC......................................................................................................................................... 155

Página 115

Page 120: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 116

Page 121: Guia Ntsys

Ejercicio 1

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

I. CARACTERIZACIÓN MORFOLÓGICA.

EJERCICIO 1. Elección de caracteres morfométricos.

Objetivos.Dado el esquema de ciertos órganos vegetales, elegir un elenco caracteres (descriptores) que a priori puedan resultar informativos, para un trabajo de caracterización morfológico y morfométrico.

Documentación electrónica.Ejercicio_1_Anona.jpgEjercicio_1_Lupinus.jpg

Notas de clase.

Página 117

Page 122: Guia Ntsys

Ejer

cici

o 1

Cur

so In

tens

ivo

de P

ostg

rado

. UA

CH

. Mex

ico

2012

Fe

rnan

do G

onzá

lez A

ndré

s

Elen

co d

e ca

ract

eres

mor

foló

gico

s y m

orfo

mét

ricos

de

dife

rent

es p

arte

s de

la p

lant

a.

SEM

ILLA

S PL

ÁN

TULA

S H

OJA

S FL

OR

ES

FRU

TOS

Cua

litat

ivos

Test

a�

Patró

n (O

bser

vabl

e m

acro

scóp

icam

ente

o

mic

rosc

ópic

amen

te).

�C

olor

. �

Pres

enci

a de

det

erm

inad

as

estru

ctur

as (P

or e

jem

plo

arilo

). �

Form

a.�

Pres

enci

a de

cos

tilla

s. C

uant

itativ

os.

�Pe

so.

�N

úmer

o de

cos

tilla

s si l

as

hubi

era.

�Lo

ngitu

d.�

Anc

hura

. �

Espe

sor.

�Su

perf

icie

pro

yect

ado.

Áng

ulos

(por

eje

mpl

o án

gulo

del

hilo

) �

Diá

met

ro e

n la

s de

form

a re

dond

eada

. �

Fact

ores

de

form

a.

�D

ista

ncia

s ent

re

dete

rmin

ados

pun

tos

sing

ular

es.

�Lo

ngitu

d / A

nchu

ra /

Fact

ores

de

form

a de

de

term

inad

as e

stru

ctur

as

sing

ular

es (v

gr. H

ilo)

Cua

litat

ivas

Hip

ocót

ilo/E

pico

tilo

�C

arac

terís

ticas

fisio

lógi

cas:

Des

arro

llo

hipo

cotil

o.

�Pi

gmen

taci

ón.

�Pr

esen

cia

/ Aus

enci

a de

pe

los

�C

otile

done

s. �

Car

acte

rístic

as

del

desa

rrol

lo.

�C

onsi

sten

cia.

Otro

s eq

uiva

lent

es

a lo

s in

dica

dos

para

ho

jas a

dulta

s. �

Eofil

os.

�Fi

lota

xia.

Otro

s eq

uiva

lent

es

a lo

s in

dica

dos

para

ho

jas a

dulta

s. C

uant

itativ

os�

Hip

ocot

ilo /

Epic

otilo

Long

itud.

�D

ensi

dad

de p

elos

. �

Cot

iledo

nes y

Eof

ilos

C

arac

tere

s equ

ival

ente

s a

los i

ndic

ados

par

a ho

ja

adul

ta

Cua

litat

ivos

.�

Estíp

ulas

(Pre

senc

ia/A

usen

cia)

Sim

ple

/ Com

pues

ta.

�C

olor

de

haz,

env

és y

ner

vios

. �

Form

a de

l lim

bo.

�Fo

rma

y/o

cara

cter

ístic

as

de

cier

tos

seno

s si l

os h

ubie

ra

�Ti

po d

e m

arge

n de

l lim

bo.

�Fo

rma

del

perf

il de

l lim

bo

(Pla

no/A

labe

ado)

. �

Pres

enci

a /

Aus

enci

a de

di

ente

s en

de

term

inad

os p

unto

s sin

gula

res.

�Fo

rma

de lo

s die

ntes

si lo

s hub

iera

. �

Pres

enci

a /

Aus

enci

a de

pe

los

en

dete

rmin

ados

pun

tos s

ingu

lare

s. C

uant

itativ

os.

�N

úmer

o de

fo

liolo

s si

fu

era

com

pues

ta�

Peci

olo.

�D

ensi

dad

de p

elos

. �

Long

itud.

�A

nchu

ra (s

i es a

lado

).

�Li

mbo

.�

Núm

ero

de ló

bulo

s. �

Núm

ero

de d

ient

es e

n de

term

inad

os

luga

res s

ingu

lare

s si l

os h

ubie

ra.

�D

ensi

dad

de p

elos

. �

Long

itud.

�A

nchu

ra.

�Su

perf

icie

.�

Fact

ores

de

form

a.

�D

ista

ncia

s en

tre d

eter

min

ados

pun

tos

sing

ular

es.

�Lo

ngitu

d / A

nchu

ra d

e de

term

inad

as

estru

ctur

as (d

ient

es, s

enos

, uña

s ...)

. �

Long

itud

de d

eter

min

ados

ner

vios

/

Dis

tanc

ias

entre

de

term

inad

os

nerv

ios.

�Á

ngul

os.

-D

e lo

s már

gene

s del

lim

bo.

-En

tre n

ervi

os.

-D

e ap

ertu

ra d

e de

term

inad

os se

nos.

Cua

litat

ivos

.�

Tipo

de

inflo

resc

enci

a.

�Es

tam

bres

. �

Col

or d

e fil

amen

tos /

ant

eras

. �

Fusi

ón fi

lam

ento

s. �

Gin

eceo

. �

Col

or.

�Fu

sión

car

pelo

s. �

Cál

iz.

�C

olor

. �

Fusi

ón sé

palo

s. �

Cor

ola.

Col

or d

e ca

da p

étal

o.

�Fu

sión

pét

alos

. �

Péta

los y

Sép

alos

. C

arac

tere

s equ

ival

ente

s a lo

s ind

icad

os p

ara

hoja

adu

lta.

�B

ráct

eas.

Car

acte

res e

quiv

alen

tes a

los i

ndic

ados

par

a ho

ja a

dulta

. �

Pedú

ncul

o

Col

or

Cua

ntita

tivos

.�

Long

itud

inflo

resc

enci

a co

mpl

eta.

Esta

mbr

es.

�N

úmer

o de

est

ambr

es.

�A

nter

as:

Car

acte

res

equi

vale

ntes

a

los

indi

cado

s en

se

mill

as.

�Fi

lam

ento

s: L

ongi

tud.

Gin

eceo

. �

Núm

ero

de c

arpe

los.

�R

adio

de

curv

atur

a de

l est

ilo.

�C

arac

tere

s equ

ival

ente

s a lo

s ind

icad

os e

n lo

s fru

tos.

�Pé

talo

s/ sé

palo

s. C

arac

tere

s equ

ival

ente

s a lo

s ind

icad

os p

ara

hoja

adu

lta.

�C

áliz

com

plet

o.

�Lo

ngitu

d / A

nchu

ra d

e la

bios

y se

nos.

�B

ráct

eas.

Otro

s car

acte

res e

quiv

alen

tes a

los i

ndic

ados

par

a ho

ja a

dulta

. �

Pedú

ncul

o.

�D

ensi

dad

de p

elos

. �

Long

itud.

�A

nchu

ra (s

i es a

lado

).

Cua

litat

ivos

.�

Tipo

de

frut

o.

�Fo

rmas

.�

Gen

eral

.�

De

la se

cció

n.

�C

urva

tura

s.�

Exoc

arpo

/Mes

ocar

po/E

ndoc

a C

olor

. �

Text

ura.

.�

Sabo

res e

spec

iale

s. �

Pres

enci

a/A

usen

cia

de se

mill

as.

�Pr

esen

cia

de

cost

illas

en

el

en

doca

rpo.

C

uant

itativ

os.

�Pe

dúnc

ulo.

Den

sida

d de

pel

os.

�Lo

ngitu

d.�

Anc

hura

(si e

s ala

do).

Ova

rio fe

cund

ado

y m

adur

o.

�Pe

so.

�Ex

ocar

po: D

ensi

dad

de p

elos

. �

Endo

carp

o: N

úmer

o de

cos

tilla

s �

Long

itud.

�A

nchu

ra.

�Es

peso

r.�

Supe

rfic

ie p

roye

ctad

a.

�Á

ngul

os.

�D

iám

etro

en

lo

s de

fo

rma

redo

ndea

da.

�Fa

ctor

de

form

a.

�C

uand

o la

s ho

jas

carp

elar

es

man

teng

an

su

aspe

cto

de

hoja

, ot

ros

cara

cter

es e

quiv

alen

tes

a lo

s in

dica

dos p

ara

hoja

s.

Pági

na 1

18

Page 123: Guia Ntsys

Ejercicio 1

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Actividad: Señalar sobre el dibujo los caracteres (descriptores) morfométricos y morfológicos que a priori pueden resultar informativos.

Ejemplo 1: Andrés-Agustín, J.; González-Andrés, F.; Nieto-Ángel, R.; Barrientos-Priego A. F. 2006. Morphometry of the organs of cherimoya (Annona cherimola Mill.) and analysis of fruit parameters for the characterization of cultivars, and mexican germplasm selections. Scientia Horticulturae, 107:337-347. Archivo electrónico: Ejercicio_1_Anona.jpg

Página 119

Page 124: Guia Ntsys

Ejercicio 1

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Ejemplo 2: González-Andrés, F.; Casquero, P.; San-Pedro, C.; Hernández-Sanchez, E. Diversity in white lupin (Lupinus albus L.) landraces from northwest Iberian plateau. Genetic Resources and Crop Evolution 54:27–44 Archivo electrónico: Ejercicio_1_Lupinus j.pg

Página 120

Page 125: Guia Ntsys

Ejercicio 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

EJERCICIO 2. Toma de datos de caracteres y descriptores morfométricos en imágenes digitales de órganos vegetales, usando el programa IMAGE TOOL 3.00.

Objetivos.A partir de imágenes electrónicas de un órgano vegetal, obtener valores medios de caracteres (descriptores) morfométricos y morfológicos, construyendo una matriz básica de datos.

Documentación electrónica.Ejercicio_2_horizontal.jpgEjercicio_2_hilo.jpgEjercicio_2_estrofiolo.jpg

Actividades Utilizando el programa IMAGETOOL 3.0, tomar las medidas correspondientes a los

caracteres seleccionados en el Ejercicio 1 para la semillas de Lupinus. Analizar la variabilidad intra – UBC para cada carácter. Construir una matriz básica de datos con los valores medios.

Notas de clase.

Página 121

Page 126: Guia Ntsys

Ejercicio 2

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 122

Page 127: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

EJERCICIO 3. Ejercicio sobre codificación de caracteres.

Objetivos.A partir de esquemas de especies de plantas imaginarias, elegir los caracteres (descriptores) más adecuados para clasificarlas usando técnicas de taxonomía numérica y analizar diferentes posibilidades de codificación de los mismos.

Documentación electrónica.Ejercicio_3.doc

Actividades Familiarizarse con el manejo del programa de software NTSYSpc ver. 2.2. Partiendo de los esquemas de especies de plantas imaginarias, elegir los caracteres

(descriptores) más informativos para poder clasificarlas en función de su parecido morfológico.

Codificar los valores de los caracteres (descriptores) en cada UBC según varias opciones: como doble estado (dos opciones) o multiestado.

Analizar cada una de las tres opciones mediante “análisis de agrupamientos” con el programa NTSYSpc.

Discutir los resultados según el método de codificación empleado.

Notas de clase.

Página 123

Page 128: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 124

Page 129: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 125

Page 130: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 126

Page 131: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 127

Page 132: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

POSIBILIDAD 1: Codificación de todos los caracteres como doble – estado.

CARÁCTER ESTADO CODIFICACIÓN Erecto

PorteDecumbente

Dicótoma Ramificación

Sin ramificación

Umbela Tipo de inflorescencia

Flor solitaria terminal

ErectaPosición flor

Péndula

Simpétala Corola

Dialipétala

Más largos que pétalos Sépalos

Más cortos que pétalos

Más largos que pétalos Estambres

Más cortos que pétalos

Compuestas Hojas

Simples

PresenciaFoliolos tipo linear

Ausencia (cualquier otra opción)

PresenciaEspinas

Ausencia

PresenciaCrasulescencia

Ausencia

Página 128

Page 133: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

1 2 3 4 5 6 7 8 9 10

Porte

Ramificación

Tipo inflorescencia

Posición flor

Corola

Sépalos

Estambres

Hojas

Foliolos lineares

Espinas

Crasulescencia

Página 129

Page 134: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

POSIBILIDAD 2: Codificación de todos los caracteres como doble – estado. Otra opción CARÁCTER ESTADO CODIFICACIÓN

ErectoPorte

Decumbente

Dicótoma Ramificación

Sin ramificación

PresenciaFlor solitaria

Ausencia

PresenciaUmbela biflora

Ausencia

PresenciaUmbela triflora

Ausencia

PresenciaUmbela multiflora

Ausencia

ErectaPosición flor

Péndula

Simpétala Corola

Dialipétala

Más largos que pétalos Sépalos

Más cortos que pétalos

Más largos que pétalos Estambres

Más cortos que pétalos

Compuestas Hojas

Simples

PresenciaFoliolos tipo linear

Ausencia (cualquier otra opción)

PresenciaEspinas

Ausencia

Página 130

Page 135: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

PresenciaCrasulescencia

Ausencia

1 2 3 4 5 6 7 8 9 10

Porte

Ramificación

Flor solitaria

Umbela biflora

Umbela triflora

Umbela multiflora

Posición flor

Corola

Sépalos

Estambres

Hojas

Foliolos lineares

Espinas

Crasulescencia

Página 131

Page 136: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

POSIBILIDAD 3: Codificación de los caracteres como doble – estado y multiestado según corresponda.

CARÁCTER ESTADO CODIFICACIÓN Erecto

PorteDecumbente

Dicótoma Ramificación

Sin ramificación

Flor solitaria terminal erecta

Flor solitaria terminal péndula

Umbela de 2 flores

Umbela de 3 flores

Tipo de inflorescencia

Umbela multiflora

Simpétala Corola

Dialipétala

Más largos que los pétalos Sépalos

Más cortos que los pétalos

Más largos que los pétalos Estambres

Más cortos que los pétalos

Simples ovales

Simples lineares

Compuestas Hojas

Reducidas a espinas

PresenciaCrasulescencia

Ausencia

Página 132

Page 137: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

1 2 3 4 5 6 7 8 9 10

Porte

Ramificación

Tipo de inflorescencia

Corola

Sépalos

Estambres

Hojas

Crasulescencia

Página 133

Page 138: Guia Ntsys

Ejercicio 3

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 134

Page 139: Guia Ntsys

Ejercicio 4

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

EJERCICIO 4. Análisis de la estabilidad caracteres (descriptores) morfológicos y morfométricos.

Objetivos.Dadas unas matrices básicas de datos correspondientes a una caracterización morfológica y morfométrica de variedades europeas de vid, analizar la estabilidad de los descriptores utilizados entre dos años diferentes, y su capacidad discriminante, utilizando procedimientos sencillos pero informativos.

Documentación electrónica.Ejercicio_4_morfología.xlsEjercicio_4_morfometría.xls

Actividad:La información de partida son las matrices básicas de datos de caracterización morfológica de 95 variedades europeas de vid, para dos años diferentes. Hay dos tipos de matrices, una de datos morfológicos y la otra de datos morfométricos. A partir de esos datos, se trata de realizar las siguientes determinaciones: Analizar de manera global para todos los caracteres (descriptores) morfológicos y todas

las variedades (UBC), la estabilidad de los descriptores entre los dos años, con la ayuda del programa informático NTSYS-pc.

Analizar la estabilidad de cada uno de los caracteres morfológicos para el conjunto de variedades, con la ayuda de una hoja de cálculo MS Excel, utilizando diferentes fórmulas según se trate de caracteres multiestado cualitativos con secuencia lógica o sin secuencia lógica.

Analizar de manera global para todos los caracteres (descriptores) morfométricos y todas las variedades (UBC), la estabilidad de los descriptores entre los dos años, con la ayuda del programa informático NTSYS-pc.

Analizar la estabilidad de cada uno de los descriptores morfométricos para el conjunto de variedades, con la ayuda de una hoja de cálculo MS Excel.

Notas: Caracteres multiestado cualitativos con secuencia lógica 003; 004; 011; 012; 015; 017;

053; 075; 084; 087; 090; 091; 202; 203; 204; 206; 207; 220; 221; 301; 503 Caracteres multiestado cualititativos sin secuencia lógica o desordenados: 001; 002;

007; 008; 016; 051; 067; 068; 070; 072; 074; 076; 079; 080; 81y1; 81y2; 082; 83y1; 83y2; 102; 208; 209; 223; 225; 230; 236; 241; 244

Notas de clase.

Página 135

Page 140: Guia Ntsys

Ejercicio 4

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 136

Page 141: Guia Ntsys

Ejercicio 5

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

EJERCICIO 5. Aplicación del análisis multivariante a estudios de caracterización morfológica.

Objetivos.

A partir de diferentes matrices básicas de datos con valores medios para cada carácter (descriptor) en cada UBC, aplicar métodos multivariantes con los programas

- NSTYSpc 2.2 - SPSS 13.0

para obtener información sobre: - Valor discriminante y correlación de los diferentes caracteres.- Agrupación de las UBC

Documentación electrónica.Ejercicio_5_Cytisus.xlsEjercicio_5_Anona.xls

Actividad:Utilizando primero el programa NTSYSpc 2.2, y luego el programa SPSS 13.0: Realizar un Análisis de Componentes Principales: i) Sin rotación de los factores, ii)Con

rotación de los factores mediante el método Varimax que sigue manteniendo la ortogonalidad de los mismos.

o Discutir a partir de los resultados el valor discriminante y la correlación entre los caracteres.

o Proyectar sobre el espacio factorial definido por los primeros Componentes Principales todas la UBC (método de ordenación), discutiendo la agrupación obtenida en base a su semejanza fenética.

Realizar un Análisis de Agrupamientos (conglomerados jerárquicos) de las UBC tomando como variables de agrupación i) todos los caracteres medidos, ii) los Componentes Principales que recogen mayor variabilidad.

o Discutir las agrupaciones de UBC obtenidas. o Compararlas con las obtenidas mediante los métodos de ordenación. o Utilizar técnicas de validación de los resultados del análisis de conglomerados,

discutiendo los resultados.

Ejemplo 1: González-Andrés, F. & Ortiz., J.M. 1996. Morphometrical characterization of Cytisus and allies (Genisteae: Leguminosae), as an aid for taxonomic discrimination. Israel Journal of Plant Science, 44: 95-114. Archivo electrónico: Ejercicio_5_Cytisus.xls

Ejemplo 2: Andrés-Agustín, J.; González-Andrés, F.; Nieto-Ángel, R.; Barrientos-Priego A. F. 2006. Morphometry of the organs of cherimoya (Annona cherimola Mill.) and analysis of fruit parameters for the characterization of cultivars, and mexican germplasm selections. Scientia Horticulturae, 107:337-347.. Archivo electrónico: Ejercicio_5_Anona.xls

Página 137

Page 142: Guia Ntsys

Ejercicio 5

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Notas de clase.

Página 138

Page 143: Guia Ntsys

Ejercicio 6

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

II. CARACTERIZACIÓN MEDIANTE MARCADORES MOLECULARES.

EJERCICIO 6. Análisis genético de poblaciones con un marcador codominante.

Objetivos.

A partir de los esquemas de bandas obtenidos tras la electroforesis de los productos de un marcador molecular, determinar con ayuda de los programas informáticos POPGENE y NTSYS los siguientes aspectos:

� Frecuencias genotípicas y alélicas para los diferentes loci en juego. � Índices de diversidad genética intrapoblacional e interpoblacional. � Relaciones genéticas entre las diferentes poblaciones.

Documentación electrónica.

Ejercicio_6.doc

Actividades:

Se entregan, para 3 poblaciones diferentes de una los esquemas de bandas electroforéticos obtenidos para varios loci de un marcador molecular con herencia codominante: Determinar los genotipos correspondientes a cada individuo, para cada uno de los loci. Calcular de modo manual, las frecuencias genotípicas y alélicas, en cada una de las

poblaciones, para todos los loci considerados. Calcular con el apoyo de los programas informáticos:

oLas frecuencias genotípicas y alélicas, en cada una de las poblaciones para todos los loci considerados, y los índices de diversidad genética con POOGENE 1.32.

oLas relaciones genéticas entre poblaciones con POPGENE 1.32 y NSTYSpc 2.2) . Discutir los resultados.

PASO 1. Determinación de los genotipos correspondientes a cada individuo, para cada uno de los loci, a partir de los esquemas de bandas (páginas siguientes).

Página 139

Page 144: Guia Ntsys

Ejercicio 6

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 140

Page 145: Guia Ntsys

Ejercicio 6

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 141

Page 146: Guia Ntsys

Ejercicio 6

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 142

Page 147: Guia Ntsys

Ejercicio 6

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Para resolver correctamente este apartado hay que tener en cuenta lo siguiente: � Los individuos estudiados son diploides. � El marcador molecular es bien un microsatélite o un isoenzima monomérico, pues si fuera un

isoenzima dimérico, el número de bandas del heterocigoto sería 3.

PASO 2. Calcular de modo manual y con ayuda de la tabla que se presenta en el correspondiente apartado de resultados, las frecuencias genotípicas y alélicas, en cada una de las poblaciones, para todos los loci considerados.

PASO 3. Preparar el archivo de entrada para los programas informáticos. Aplicar los programas. Analizar los resultados.

3. Resultados.

PASO 1. Determinación de los genotipos correspondientes a cada individuo, para cada uno de los loci, a partir de los esquemas de bandas.

Página 143

Page 148: Guia Ntsys

Ejer

cici

o 6

Cur

so In

tens

ivo

de P

ostg

rado

. UA

CH

. Mex

ico

2012

Fe

rnan

do G

onzá

lez A

ndré

s

1 2

3 4

5 6

7 8

9 10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

Locu

s 1

Locu

s 2

P-1

Locu

s 3

Locu

s 1

Locu

s 2

P-2

Locu

s 3

Locu

s 1

Locu

s 2

P-3

Locu

s 3

Not

a: P

ara

la c

odifi

caci

ón d

e PO

PGEN

E R

=A; L

=B; S

=C.

Pági

na 1

44

Page 149: Guia Ntsys

Ejercicio 6

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

PASO 2. Calcular de modo manual, las frecuencias genotípicas y alélicas, en cada una de las poblaciones, para todos los loci considerados.

Frecuencias genotípicas. Frecuencias alélicas RR

(AA)LL

(BB)SS

(CC)LR

(AB)SR

(AC)SL

(BC)R (A) L (B) S (C)

Locus 1

Locus 2

P-1

Locus 3

Locus 1

Locus 2

P-2

Locus 3

Locus 1

Locus 2

P-3

Locus 3

PASO 3. Calcular con el apoyo de los programas informáticos, las frecuencias genotípicas y alélicas, en cada una de las poblaciones para todos los loci considerados, así como los índices de diversidad genética (POOGENE 32) y las relaciones genéticas entre poblaciones (POOGENE 32 y NSTYSpc 2.1) .

PASO 4. Análisis de los resultados.

Número medio de alelos por locus:

Número medio de alelos por locus polimórfico:

Página 145

Page 150: Guia Ntsys

Ejercicio 6

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Índice de polimorfismo:

Número de alelos únicos:

Comparación de los datos de las frecuencias genotípicas y alélicas obtenidas manualmente con las obtenidas mediante el programa informático.

Diversidad Genética Total (HT).

Diversidad Genética Intrapoblacional (HS) para el conjunto de las poblaciones.

Diversidad Genética Interpoblacional (DST).

Página 146

Page 151: Guia Ntsys

Ejercicio 6

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Porcentaje de la diversidad genética total que se encuentra entre las poblaciones.

Matriz de disimilitud entre las diferentes poblaciones basada en la distancia genética de Nei (1973). Comprobar la identidad de los resultados obtenidos con los dos programas.

Dendrograma correspondiente a la similitud entre las diferentes accesiones. Interpretación.

En un programa de recolección de germoplasma de esta especie hipotética, ¿cuál sería la estrategia a seguir?

Página 147

Page 152: Guia Ntsys

Ejercicio 6

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 148

Page 153: Guia Ntsys

Ejercicio 7

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

EJERCICIO 7. Interpretación de un marcador molecular como presencia/ausencia de bandas: Establecimiento de relaciones fenéticas entre UBC.

Objetivos.A partir de matrices básicas de datos de presencia/ausencia de bandas en varias UBC correspondientes a diferentes poblaciones de plantas pertenecientes a varias especies próximas filogenéticamente, aplicar técnicas de análisis multivariante, para obtener información sobre la similitud fenética entre las UBC.

Documentación electrónica.Ejercicio_7_Cytisus_isoenzimas.xls Ejercicio_ 7_Cytisus_RAPD.xls

Actividades:Utilizando primero el programa NTSYSpc 2.2, y luego el programa SPSS 13.0: Analizar las matrices básicas de datos de presencia/ausencia de bandas mediante i)

métodos de agrupamientos (conglomerados jerárquicos) y ii) métodos de ordenación (análisis de coordenadas principales) (el segundo solo con NTSYSpc), obteniendo una representación gráfica de las distancias fenéticas entre UBC.

Validar el análisis de conglomerados (solo con NTSYSpc) mediante: o Cálculo de la matriz cofenética. o Métodos de remuestreo en las matrices de datos (bootstrapping). o Comparación de la similitud obtenida con isoenzimas y con RAPD

Discutir los resultados.

Ejemplo 1: González-Andrés, F. & Ortiz, J.M. 1995. Isoenzymatic characterization of potentially useful forage shrubs belonging to the genus Cytisus and allies (Genisteae: Leguminosae). Biochemical Systematics and Ecology, 23 (7/8): 813-824. Archivo electrónico: Ejercicio_7_Cytisus_isoenzimas.xls

Ejemplo 2: González-Andrés, F. & Ortiz. J.M. 1995. RAPD analysis of shrubs belonging to the genus Cytisus and allies (Genisteae: Fabaceae), as an aid for taxonomic discrimination. Israel Journal of Plant Sciences, 43: 303-314.Archivo electrónico: Ejercicio_7_Cytisus_RAPD.xls

Notas de clase.

Página 149

Page 154: Guia Ntsys

Ejercicio 7

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 150

Page 155: Guia Ntsys

Ejercicio 8

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

EJERCICIO 8. Interpretación de resultados de RAPD como presencia/ausencia de bandas: Análisis poblacional de la variabilidad inter e intrapoblacional.

Objetivos.A partir de matrices básicas de datos de presencia/ausencia de bandas tipo RAPD que contienen la información correspondiente a diferentes poblaciones de una misma especies, calcular índices para estimar como se distribuye la variabilidad entre poblaciones y dentro de las mismas, así como la distancia o similitud fenética entre dichas poblaciones, con el programa POPGEN32.

Documentación electrónica.Ejercicio_8.xls

Actividades: Utilizando el programa POPGEN32, analizar las matrices básicas de datos de presencia

ausencia de bandas obtenidas en un estudio de caracterización de poblaciones bacterianas del género Rhizobium y afines, obteniendo índices de diversidad genética dentro de cada población.

Proceder del mismo modo para el conjunto de todas las poblaciones, calculando también en este último caso la distancia o similitud entre poblaciones.

Discutir los resultados

Ejemplo 1: González-Andrés, F. & Ortíz, J.M. 1998. Biodiversity of rhizobia nodulating Genista monspessulana and Genista linifolia in Spain. New Zealand Journal of Agricultural Research, 41: 585 – 594. Archivo electrónico: Ejercicio_8.xls

Notas de clase.

Página 151

Page 156: Guia Ntsys

Ejercicio 8

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Página 152

Page 157: Guia Ntsys

Ejercicio 9

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

EJERCICIO 9. Análisis de microsatélites.

Objetivos.A partir de matrices básicas de datos con el tamaño alélico de varios loci STMS, calcular diferentes índices genéticos relativos al conjunto de UBC en estudio, obtener estimadores del poder discriminante de los loci STMS elegidos para el germoplasma estudiado, y estimar la distancia o similitud genética entre las diferentes UBC, así como las relaciones de parentesco entre ellas.

Documentación electrónica.Ejercicio_9_VID_Bierzo.xlsEjercicio_9_VID_BGV.xls

Actividades:Se partirá de matrices básicas de datos con el tamaño alélico de varios loci STMS pertenecientes a la vid Utilizando el programa IENTITY 1.0, calcular los siguientes índices genéticos:

o Número de alelos o Frecuencias alélicas o Heterocigosidad esperada y observada o Frecuencia de alelos nulos Analizar también las muestras que presentan genotipos idénticos.

Utilizando el programa POPGEN, corroborar algunos de los parámetros calculados anteriormente y que son proporcionados por ambos programas, y determinar otros nuevos:

o Genotipos observados vs. genotipos posibles y frecuencia de cada uno de los genotipos observados.

o Número efectivo de alelos. Mediante el uso de una hoja de cálculo MS Excel, aplicado a las misma matriz básica

de datos, calcular los siguientes parámetros: o Contenido de información polimórfica de cada locus y del conjunto de loci.o Poder discriminante de cada locus y del conjunto de loci.

Ejemplo 1. González-Andrés, F.; Martín, J.P.; Yuste, J.; Rubio, J.A.; Arranz, C.; Ortiz, J.M. 2007. Identification and molcular biodiversity of autochthonous grapevine cultivars in the "Comarca del Bierzo, León, Spain. Vitis,46(2): 71-76.. Archivo electrónico: Ejercicio_10_VID_Bierzo.xls

Ejemplo 2: Martin, J.P., Borrego, J., Cabello, F., Ortiz, J.M. 2003. Characterization of Spanish grapevine cultivar diversity using sequence-tagged microsatellite site markers. Genome 46, 10-18. Archivo electrónico: Ejercicio_10_VID_BGV.xls

Página 153

Page 158: Guia Ntsys

Ejercicio 9

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

Notas de clase.

Página 154

Page 159: Guia Ntsys

Ejercicio 10

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

EJERCICIO 10. Análisis bioinformático de la secuencia de un gen en un grupo de UBC.

Objetivos.A partir de los cromatogramas obtenidos tras la secuenciación del gen 16S DNA de cuatro cepas bacterianas aisladas del interior de raíces de pimiento (Capsicum annuum L.), identificar dichas bacterias por comparación con las secuencias de ese mismo gen depositadas en las bases de datos, dibujando un árbol filogenético de estas cuatro bacterias frente a otras bacterias próximas filogenéticamente.

Documentación electrónica.Ejercicio_10_cromatogramas.rar Ejercicio_10_bacterias_tipo.doc

Actividades:Se ha secuenciado el gen 16S DNA de 4 cepas bacterianas aisladas del interior de raíces de pimiento. Se entregan a los alumnos los cromatogramas obtenidos con los cebadores 518F y 800R que amplifican el gen 16S DNA, tal como salen del secuenciador, sin limpiar (ver archivo electrónico Ejercicio_10_cromatogramas.rar). Además se les entrega el código de varias cepas tipo depositadas en bancos de secuencias internacionales, como el ez-taxon y el BLAST. Estas cepas son próximas filogenéticamente a las aisladas en el interior de las raíces de pimiento (ver archivo electrónico Ejercicio_10_ bacterias_tipo.doc).A partir de esta documentación, se solicita lo siguiente. Limpiar las secuencias utilizando el programa CHROMAS PRO, volteando y

obteniendo la complementaria de la secuencia procedente de la amplificación con el cebador “R”, para en una etapa posterior poder obtener la secuencia consenso o “contig”. Las secuencias modificadas deben ser archivadas con un nombre que permita distinguirlas de las originales.

Obtener para cada cepa la secuencia consenso o “contig”, con el subprograma SEQMAN del programa DNASTAR, guardnando la secuencia consenso con dos formatos diferentes, el del propio programa SEQMAN (con extensión *.seq) y el de FastA (con extensión *.fas).

Identificar cada una de las cepas problema por comparación de la secuencia del gen 16S DNA (el “contig” calculado en el caso anterior), con la base de datos EZ-TAXON.

Realizar un alineamiento múltiple de las secuencias del gen 16S DNA de las cuatro cepas bacterianas secuenciadas y de las seis cepas tipo que se entregan, utilizando el programa MEGA, que recurre tanto a la base de datos BLASTn como al programa CLUSTAL-W.

Obtener la filogenia de las 10 bacterias, mediante la realización de los siguientes tipos de árboles filogenéticos con el programa MEGA.

o ARBOL 1 (nombrarlo: NJtree) Statistical Method: Neighbor-joining Test of Phylogeny: Bootstrap method No. of Bootstrap Replications: 1000 Model/Method: Kimura 2-parameter model

Página 155

Page 160: Guia Ntsys

Ejercicio 10

Curso Intensivo de Postgrado. UACH. Mexico 2012 Fernando González Andrés

o ARBOL 2 (nombrarlo: UPGMAtree) Statistical Method: UPGMA Test of Phylogeny: None Model/Method: Jukes-Cantor model

o ARBOL 3 (nombrarlo: MaxPARStree) Statistical Method: Maximum Parsimony method Test of Phylogeny: Bootstrap method No. of Bootstrap Replications: 500

o ARBOL 4 (nombrarlo: MaxLIKELIHOOD) Statistical Method: Maximum Likelihood Test of Phylogeny: Bootstrap method No. of Bootstrap Replications: 500 Model/Method: Tamura-Nei model

Comparar y discutir los resultados.

Ejemplo 1. Mulas D, García-Fraile P, Carro L, Ramírez-Bahena M-H, Casquero P, Velázquez E, González-Andrés F. 2011. Distribution and efficiency of Rhizobium leguminosarum strains nodulating Phaseolus vulgaris in Northern Spanish soils: Selection of native strains that replace conventional N fertilization, Soil Biology and Biochemistry, 43 (11): 2283-2293.

Notas de clase.

Página 156

Page 161: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

GUÍA RÁPIDA DEL PROGRAMA UTHSCSA. IMAGE TOOL for windows ver 3.00

Programa de análisis de imagen.

Página 157

Page 162: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

Página 158

Page 163: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

1. AJUSTES EN EL PROGRAMA. Pg. 161

2. ADQUISICIÓN DE UNA IMAGEN O ABRIR UNA YA ALMACENADA EN FORMATO jpeg (jpg). Pg. 161

3. CALIBRACIÓN DE LAS MEDIDAS ESPACIALES. 4. PREPARACIÓN DEL PROGRAMA PARA LAS MEDIDAS AUTOMÁTICAS. Pg. 162

4.1. Pasar la figura de color a “escala de grises” Pg. 162

4.2. Binarización de la imagen. Pg. 163

4.3. Encontrar y seleccionar objetos de manera manual. Pg. 164

5. REALIZAR LAS MEDIDAS AUTOMÁTICAS DE LOS OBJETOS.Pg. 168

6. GUARDAR LOS DATOS COMO ARCHIVO DE TEXTO. ESTO ES RECUPERABLE EN MS Excel COMO HOJA DE CÁLCULO. Pg. 169

7. REALIZAR LAS MEDIDAS MANUALES. Pg. 170

Página 159

Page 164: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

Página 160

Page 165: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

1. AJUSTES EN EL PROGRAMA.

Settings / Preferences / Find Objects

Otros ajustes si se desea en Settings / Preferences / Object análisis2. ADQUISICIÓN DE UNA IMAGEN O ABRIR UNA YA ALMACENADA EN

FORMATO jpeg (jpg).

Página 161

Page 166: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

3. CALIBRACIÓN DE LAS MEDIDAS ESPACIALES.

Guardar la calibración para posteriores trabajos .Alternativa: Cargar una calibración ya grabada, que el programa puede hacer calibración por defecto, si así se señala con el “ratón” cuando espontáneamente aparece el cuadro de diálogo correspondiente.

4. PREPARACIÓN DEL PROGRAMA PARA LAS MEDIDAS AUTOMÁTICAS.4.1. Pasar la figura de color a “escala de grises”

Página 162

Page 167: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

4.2. Binarización de la imagen.

Decidir el nivel umbral de manera manual.

Página 163

Page 168: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

4.3. Encontrar y seleccionar objetos de manera manual.

Página 164

Page 169: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

Página 165

Page 170: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

Página 166

Page 171: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

Alternativa: Tras pasar la imagen a blanco y negro se puede ir directamente a Find Objectsy aparece la interface de binarización.

Página 167

Page 172: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

5. REALIZAR LAS MEDIDAS AUTOMÁTICAS DE LOS OBJETOS.

Página 168

Page 173: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

6. GUARDAR LOS DATOS COMO ARCHIVO DE TEXTO. ESTO ES RECUPERABLE EN MS Excel COMO HOJA DE CÁLCULO.

Página 169

Page 174: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico. 2012. Fernando González Andrés.

7. REALIZAR LAS MEDIDAS MANUALES.

Longitudes

Ángulos

Página 170

Page 175: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

GUÍA RÁPIDA DEL PROGRAMA NTSYSpc ver.2.20N.

Programa de análisis multivariante específicamente diseñado paraestudios de caracterización de germoplasma vegetal.

Página 171

Page 176: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Página 172

Page 177: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1. APLICACIÓN A DATOS FENOTÍPICOS MORFOLÓGICOS O MOLECULARES: MULTI-ESTADO CUALITATIVOS O CUANTITATIVOS, O DOBLE-ESTADO.

Pg. 1751.1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS. Pg. 1751.2. ESTANDARIZACIÓN Y TRANSFORMACIONES EN LA MATRIZ BÁSICA DE DATOS. Pg. 176

1.2.1. Opción 1. Utilizar el módulo “Standardization” de NTSYS. Pg. 1761.2.2. Opción 2. Utilizar el módulo “Transformation” de NTSYS. Pg. 177

1.3. ANÁLISIS DE COMPONENTES PRINCIPALES (DATOS CUANTITATIVOS). Pg. 1781.3.1. Obtener una matriz de correlación entre caracteres o de varianzas – covarianzas.

Pg. 1781.3.1.1. Opción 1: Calcular una matriz de correlación entre caracteres Pg. 1781.3.1.2. Opción 2: Calcular una matriz de varianzas – covarianzas. Pg. 179

1.3.2. Obtener los Componentes Principales sin rotar y el gráfico de las saturaciones factoriales Pg. 180

1.3.3. Obtener los Componentes Principales rotados y el correspondiente gráfico de saturaciones factoriales. Pg. 182

1.3.4. Proyectar cada una de las UBC sobre los tres o dos primeros componentes principales. Pg. 186

1.4. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS MULTI-ESTADO. Pg.1891.4.1. Agrupamiento en base a todos los caracteres analizados, cuando éstos son de tipo

multi-estado cualitativo o cuantitativos. Pg.1891.4.1.1. Estandarización y otras transformaciones en la matriz básica de datos.

Pg.1891.4.1.2. Determinar la matriz de similitud entre las UBC. Pg.1891.4.1.3. Calcular y dibujar el dendrograma. Pg. 190

1.4.2. Agrupamiento en base a los primeros componentes principales (los que recogen una mayor variabilidad). Pg. 192

1.4.2.1. Determinar la matriz de similitud entre las UBC. Pg. 1921.4.2.2. Calcular y dibujr el dendrograma y dibujarlo. Pg. 193

1.5. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS DOBLE-ESATDO). Pg. 1931.5.1. Determinar la matriz de similitud entre las UBC. Pg. 1931.5.2. Calcular y dibujar el dendrograma. Pg. 194

INDICE DEL CONTENIDO

Página 173

Page 178: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

2. APLICACIÓN A MARCADORES MOLECULARES CODOMIENTANTES INTERPRETADOS GENÉTICAMENTE.. Pg. 195

2.1. OBTENCION DE LAS FRECUENCIAS ALÉLICAS. Pg. 1952.1.1. Preparación de la matriz básica de datos con 0/1/2 Pg. 1952.1.2. Obtención de las frecuencias alélicas Pg. 200

2.2. DETERMINAR LA MATRIZ DE SIMILITUD GENÉTICA ENTRE LAS 2.3. CALCULAR Y DIBUJAR EL DENDROGRAMA Pg. 202

3. TEMAS COMPLEMENTARIOS. Pg. 2033.1. VISUALIZACIÓN E IMPRESIÓN DE CUALQUIER ARCHIVO GENERADO POR ALGUNO

DE LOS SUBPOGRAMAS. Pg. 2033.2. VOLVER A DIBUJAR DENDROGRAMA O PROYECCIONES DE UBC SOBRE

COMPONENTES PRINCIPALES. Pg. 2043.3. VALIDACIÓN DEL ANÁLISIS DE CONGLOMERADOS Pg. 206

3.3.1. Cuantificación de la distorsión debida al método de agrupación empleado mediante la elaboración de la matriz cofenética. Pg. 206

3.3.1.1. Calcular la matriz de cofenética (matriz diagonal) a partir del fenograma. Pg. 206

3.3.1.2. Comparar la matriz de similitud original y la matriz cofenética.Pg. 206

3.3.2. Comparación de la similitud entre diferentes métodos de caracterización. Pg. 2083.3.2.1. Opción 1: Comparar las matrices de similitud. Pg. 2083.3.2.2. Opción 2: Medir la coincidencia entre las estructuras taxonómicas

derivadas de las matrices de similitud. Pg. 2093.3.3. Métodos de remuestreo en las matrices de datos: Bootstrapping. Pg. 210

3.3.3.1. Obtención de las matrices remuestreadas Pg. 2103.3.3.2. Obtención de una matriz de similitud por cada una de las matrices

remuestreadas. Pg. 2113.3.3.3. Obtención de la matriz de similitud promedio. Pg. 2123.3.3.4. Calcular y dibujar el dendrograma a partir de la matriz de similitud

promedio. Pg. 213

Página 174

Page 179: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1. APLICACIÓN A DATOS FENOTÍPICOS MORFOLÓGICOS O MOLECULARES: MULTI-ESTADO CUALITATIVOS O CUANTITATIVOS, O DOBLE-ESTADO.1.1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS.

Puede prepararse en el “Editor de NTSYS” (Ntedit) o en un archivo de MS Excel (recomendado).

El programa por defecto considera que se situarán las Unidades Básicas de Caracterización (UBC) en columnas y los caracteres en filas. Pero puede hacerse al revés, como en el presente ejemplo.

Si faltaran datos aquí iría el código correspondiente a los datos que faltan (habitualmente “999”).

Tipo de matriz: Ver en Help Contents / Data File /File format

Nº de filas, en este ejemplo UBC.

Nº de columnas, en este ejemplo caracteres.

Página 175

Page 180: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1.2. ESTANDARIZACIÓN Y TRANSFORMACIONES EN LA MATRIZ BÁSICA DE DATOS.

Si fuese necesario estandarizar la matriz de datos, la estandarización se haría por caracteres, ya que lo que se pretende es que los valores de todos los caracteres varíen entre los mismos límites.En función de cómo se haya construido la matriz básica de datos, la estandarización se hará por filas o por columnas.

1.2.1. Opción 1. Utilizar el módulo “Standardization” de NTSYS.

Es un módulo que permite realizar transformaciones lineales del tipo:

Para acceder a dicho módulo se entrará en los siguientes enlaces Transformation/Standardization

optiondivideoptionsubstractyy

�'

Las diferentes opciones de “substract option” y “divide option” pueden consultarse en Help / Parameters

Página 176

Page 181: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1. 2.2. Opción 2. Utilizar el módulo “Transformation” de NTSYS.Es un módulo que permite realizar todo tipo de transformaciones, como por ejemplo transformaciones logarítimicas.Para acceder a dicho módulo se entrará en los siguientes enlaces Transformation/Transformation

Página 177

Page 182: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Las diferentes opciones de “Transformation codes” pueden consultarse en Help / Parameters

1.3. ANÁLISIS DE COMPONENTES PRINCIPALES (DATOS CUANTITATIVOS).

1.3.1. Obtener una matriz de correlación entre caracteres o de varianzas – covarianzas.

1.3.1.1. Opción 1: Calcular una matriz de correlación entre caracteres

- Estandarizar la matriz básica de datos por caracteres (ver punto 2).

- Calcular la matriz de correlación entre los caracteres.

La matriz de correlación es un tipo de matriz de similitud, y su cálculo se hará a partir de la matriz básica de datos estandarizada, operando por filas o por columnas en función de la estructura que se dio a la matriz de datos, teniendo en cuenta que la similitud se calcula entre caracteres.

Para calcular una matriz de correlación se utiliza el módulo “Dis/similarity” utilizandolos siguientes enlaces Dis/similarity / interval data

Para calcular la matriz de correlación, el coeficiente a utilizar será el de correlación Momento – Producto de Pearson.

Página 178

Page 183: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1.3.1.2. Opción 2: Calcular una matriz de varianzas – covarianzas.

En este caso se dan mayores pesos a las variables que presentan varianzas mayores. Sin embargo de nuevo esto implica que las variables o caracteres sean medidas en unidades comparables por lo que es necesario algún tipo de transformación como la estandarización o la transformación logarítmica.

En un estudio morfométrico convencional mediante ACP basado en la matriz de varianzas–covarianzas de los caracteres, los pasos a realizar son los siguientes:

Realizar la transformación logarítimica de la matriz básica de datos (ver punto 2).

Calcular la matriz de varianzas – covarianzas de los caracteres.

Página 179

Page 184: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1.3.2. Obtener los Componentes Principales sin rotar y el gráfico de saturaciones factoriales.

* Si se está trabajando con la matriz de varianzas – covarianzas, aquí se introducirá dicha matriz

*

La pantalla resultante es la que se presenta a continuación.

*

Página 180

Page 185: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

A partir del documento de salida anterior deben imprimirse directamente los eigen– valores (valores propios) correspondientes a cada uno de los componentes principales, y los porcentajes de variación que recogen.

Presionando en los botones que aparecen en la parte inferior izquierda, señalados en rojo en la pantalla anterior, se obtienen los diagramas de dispersión bidimensionales o tridimensionales del espacio factorial, donde se puede observar de manera gráfica la contribución de cada carácter o variable a cada uno de los factores, que en este caso son los componentes principales.

Las coordenadas de un carácter o variable en cada factor (en este caso componente principal) se corresponden con las saturaciones de la variable en dichos factores, que se encuentran en la matriz factorial, y que se obtiene solicitando del programa los eiguen-vectores (ver apartado 1.3.3)

Página 181

Page 186: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Para obtener lo eiguen-vectores es preciso solicitar del programa dicha salida.

1.3.3. Obtener los Componentes Principales rotado y el correspondiente gráfico de saturaciones factoriales.

Cada vez se está imponiendo más la práctica de rotar la solución original con objeto de mejorar la interpretabilidad de los resultados (ver explicación teórica en la parte de teoría).

La nueva versión de NTSYS permite realizar esta rotación. A continuación se describen los pasos para realizarla.

La matriz de entrada debe ser la de eiguen-vectores.

El método de rotación más utilizado entre los que siguen manteniendo la ortogonalidad de los factores es el Varimaz-Normalizado.

Página 182

Page 187: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

La pantalla resultante es la que se presenta a continuación.

Página 183

Page 188: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Presionando en los botones que aparecen en la parte inferior izquierda, señalados en rojo en la pantalla anterior, se obtienen los diagramas de dispersión bidimensionales o tridimensionales del espacio factorial rotado, donde se puede observar de manera gráfica la contribución de cada carácter a cada uno de los factores.

Página 184

Page 189: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Si el objetivo del ACP es una “reducción de datos”, es decir reducir el número de caracteres inicialmente utilizados a un menor número de ellos, el uso del ACP habría llegado a su fin. Los componentes principales, en su forma original o rotados, pueden ser ahora las nuevas variables, para otros tipos de estudios como un análisis de agrupamientos. No hay que olvidar que los componentes principales son una combinación lineal de los caracteres originales que recogen mayor varianza.

Sin embargo, el objetivo del ACP puede ser también visualizar en proyección tridimensional las Unidades Básicas de Caracterización sobre el conjunto de ejes definidos por los componentes principales. Esto se estudia en el punto siguiente.

Para obtener los valores de las proyecciones de cada carácter sobre los factores rotados, es preciso solicitar del programa la salida de los mismos.

Página 185

Page 190: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1.3.4. Proyectar cada una de las UBC sobre los tres o dos primeros componentes principales.

* Si la proyección quiere hacerse sobre los ejes rotados, aquí deberá introducirse la matriz de componentes rotados, es decir los vectores propios de cada carácter con respecto de los ejes rotados. Dicha matriz se obtuvo con el modulo FRotate bajo la denominación de “Output reference structure”

*

Página 186

Page 191: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

La pantalla resultante es la que se presenta a continuación.

Presionando en los botones que aparecen en la parte inferior izquierda, señalados en rojo en la pantalla anterior, se obtienen los diagramas de dispersión bidimensionales o tridimensionales de proyección de las Unidades Básicas de Caracterización sobre los componentes sin rotar o rotados, según que el “Input factor matrix file” haya sido la matriz de componentes sin rotar o rotados.

Página 187

Page 192: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Página 188

Page 193: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1.4.1.2. Determinar la matriz de similitud entre las UBC.

El cálculo de la matriz de similitud se hará a partir de la matriz básica de datos estandarizada, operando por filas o por columnas en función de la estructura que se dio a la matriz de datos, teniendo en cuenta que la similitud se calculará entre UBC.

En este caso se trabaja con datos multiestado cualitativos o cuantitativos. Para calcular una matriz de similitud se utiliza el módulo “Dis/similarity” utilizando los siguientes enlaces Dis/similarity / interval data.

El “Input file” será por tanto la matriz básica de datos estandarizada.

Para información sobre los posibles coeficientes a utilizar consultar Help /

1.4. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS MULTI-ESTADO.

1.4.1. Agrupamiento en base a todos los caracteres analizados, cuando éstos son de tipo multi-estado cualitativo o cuantitativos (pueden requerir estandarización).

1.4.1.1. Estandarización y otras transformaciones en la matriz básica de datos.

Ver punto 2.

Parameters

Página 189

Page 194: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1.4.1.3. Calcular y dibujar el dendrograma.

La pantalla resultante se muestra a continuación.

Página 190

Page 195: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Presionando en el botón que aparece en la parte inferior izquierda, señalado en rojo en la pantalla anterior, se obtiene el dendrograma de las Unidades Básicas de Caracterización.

Página 191

Page 196: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1.4.2. Agrupamiento en base a los primeros componentes principales (los que recogen una mayor variabilidad).

1.4.2.1. Determinar la matriz de similitud entre las UBC.

El cálculo de la matriz de similitud se hará en este caso a partir de la matriz de proyección de las UBC sobre el número de componentes principales que el investigador quiera considerar, que en este caso harán las veces de caracteres.

En consecuencia el “Input file” será el archivo de salida del programa PROJ. Todo puede hacerse referido a los componentes originales o rotados (ver apartado 1.3.4 Pág 15).

Se operará por filas o por columnas en función de la estructura que tenga la matriz de entrada, teniendo en cuenta que la similitud se calculará entre UBC.

En el ejemplo que se presenta a continuación se ha utilizado la matriz de proyección sobre los componentes rotados.

Página 192

Page 197: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1.4.2.2. Calcular y dibujr el dendrograma y dibujarlo.Se seguirá el mismo procedimiento que el indicado en el punto 1.4.1.3. (Pág. 19)

1.5. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS DOBLE-ESTADO .

Es preciso indicar que algunos coeficientes admiten también datos multiestadocualitativos sin secuencia lógica.

El aspecto de la matriz básica de datos será el siguiente:

Parameters

1.5.1. Determinar la matriz de similitud entre las UBC.

El cálculo de la matriz de similitud se hará a partir de la matriz básica de datos, operando por filas o por columnas en función de la estructura que se dio a la matriz básica de datos, teniendo en cuenta que la similitud se calculará entre UBC.

Para calcular una matriz de similitud se emplea el módulo “Dis/similarity”utilizando los siguientes enlaces Dis/similarity / Qualitative data.

Para información sobre coeficientes pueden consultarse en Help/

Página 193

Page 198: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

1.5.2. Calcular y dibujar el dendrograma.

Se seguirá el mismo proceso que el descrito en el apartado 1.4.1.3. (Pág. 19)

La pantalla de entrada de datos se presenta a continuación:

Página 194

Page 199: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

2.1. OBTENCION DE LAS FRECUENCIAS ALÉLICAS.

2.1.1. Preparación de la matriz básica de datos con 0/1/2.

Puede prepararse en el “Editor de NTSYS” (Ntedit) o en un archivo de MS Excel. Son necearias 3 matrices

Primera matriz.

La primera fila indica el tipo de matriz, la segunda designa los loci presentes, y las siguientes representan los diferentes individuos.

La primera columna indica la población de pertenencia de cada individuo. Las columnas a partir de la segunda representan cada una un alelo. Para el caso de un individuo diploide, el número 1 indica presencia de la banda correspondiente al alelo, el número 0 ausencia de dicha banda, y el número 2 se reserva para los homocigotos en el alelo en cuestión.

2. APLICACIÓN A MARCADORES MOLECULARES CODOMINANTES INTERPRETADOS GENÉTICAMENTE.

Locus 1 con 3 alelosLocus 2 con 2 alelos

Locus 3 con 2 alelosLocus 4 con 3 alelos

25 individuos que constituyen la población 1

Tipo de matriz: Ver en Help Contents / Data File / File format

Nº de filas Nº de columnas

Si faltaran datos código correspondiente a los datos que faltan

Página 195

Page 200: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Segunda matriz.

El programa la denomina “Name of sample ID array”. Su utilidad es indicar al programa qué filas de la “Primera matriz” pertenecen a la población, 1, cuáles a la población 2, y cuáles a la 3.

25 individuos que constituyen la población 1

Tercera matriz.

El programa la denomina “Name of loci file”. Su utilidad es indicar al programa quécolumnas de la “Primera matriz” pertenecen al locus 1, cuáles al 2 y cuáles al 3.

Página 196

Page 201: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Locus 1 con 3 alelos

Locus 2 con 2 alelos

Locus 3 con 2 alelos

Locus 4 con 3 alelos

2.1.2. Obtención de la matriz de frecuencias alélicas.

Página 197

Page 202: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Para obtener la matriz de frecuencias, es preciso solicitar del programa la salida de la misma.

Locus 4 con 3 alelos

Locus 1 con 3 alelos

Locus 2 con 2 alelos

Locus 3 con 2 alelos

Pobl. 1 Pobl. 2 Pobl. 3

Antes de continuar puede ser interesante abrir esta matriz en el editor de NSTYS y etiquetar filas y columnas

Página 198

Page 203: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

La pantalla resultante es la que se presenta a continuación.

Página 199

Page 204: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Pulsando en y se modificarán las etiquetas de las filas y de las columnas

Row labs Col labs

Como alternativa también es posible crear directamente en el programa una matriz de frecuencias alélicas, en lugar de crear una matriz de 0/1/2 y solicitar del programa el cálculo de la matriz de frecuencias alélicas.

2.2. DETERMINAR LA MATRIZ DE SIMILITUD GENÉTICA ENTRE LAS POBLACIONES.

El cálculo de la matriz de similitud genética se hará a partir de la matriz de frecuencias alélicas, previamente obtenida, operando por filas o por columnas en función de la estructura que tenga dicha matriz, teniendo en cuenta que la similitud se calculará entre UBC (en este caso concreto poblaciones).

Si se utilizan determinados coeficientes, el programa requerirá otras matrices adicionales, que en este módulo se denominan como:

• “Name of loci array file” que es exactamente la matriz que se describió en al apartado II/1.1 con el nombre de tercera matriz, denominada por el programa en esa ocasión “Name of loci file”.

• “Name of N array”. Es una matriz rectangular que indica el número de individuos que tiene cada una de las poblaciones. Su estructura se especifica en la siguiente figura.

Página 200

Page 205: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Locus 1 con 3 alelos

Locus 2 con 2 alelos

Locus 3 con 2 alelos

Locus 4 con 3 alelos

Número de individuos en cada población

Para calcular una matriz de similitud con datos genéticos se emplea el módulo “Dis/similarity”utilizando los siguientes enlaces Dis/similarity /Genetic distance

Para información sobre coeficientes pueden consultarse en Help/

En este apartado también puede encontrarse información sobre los archivos de entrada requeridos en función de los coeficientes utilizados.

La pantalla de entrada de datos se presenta a continuación.

Parameters

Página 201

Page 206: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

2.3. CALCULAR EL DENDROGRAMA.

Se seguirá el mismo proceso que el descrito en el apartado 1.4.1.3 (Pg. 19)

A continuación se presenta un ejemplo del resultado final.

Página 202

Page 207: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

3. TEMAS COMPLEMENTARIOS.3.1. VISUALIZACIÓN E IMPRESIÓN DE CUALQUIER ARCHIVO GENERADO POR

ALGUNO DE LOS SUBPOGRAMAS.En cualquier momento se puede visualizar cualquiera de los archivos guardados, con el módulo “Output”Los archivos visualizados en el “Report listing” pueden guardarse en formato texto (=.txt) y posteriormente pueden ser recuperados en cualquier programa de tratamiento de textos

Página 203

Page 208: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

3.2. VOLVER A DIBUJAR DENDROGRAMA O PROYECCIONES DE UBC SOBRE COMPONENTES PRINCIPALES.

Se puede volver a dibujar un dendrograma con el módulo “Cluster” utilizando el enlace Cluster / Tree plot.

Página 204

Page 209: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Y un diagrama tridimensinal con el módulo “Graphics” utilizando el enlace Graphics / Mod3D plot.

Página 205

Page 210: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

3.3. VALIDACIÓN DEL ANÁLISIS DE CONGLOMERADOS.

3.3.1. Cuantificación de la distorsión debida al método de agrupación empleado mediante la elaboración de la matriz cofenética.

3.3.1.1. Calcular la matriz de cofenética (matriz diagonal) a partir del fenograma.

3.3.1.2. Comparar la matriz de similitud original y la matriz cofenética.

Página 206

Page 211: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Los resultados obtenidos se presentan a continuación:

Página 207

Page 212: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

3.3.2. Comparación de la similitud entre diferentes métodos de caracterización.

3.3.2.1. Opción 1: Comparar las matrices de similitud.

Los resultados obtenidos se presentan a continuación:

Página 208

Page 213: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

3.3.2.2. Opción 2: Medir la coincidencia entre las estructuras taxonómicas derivadas de las matrices de similitud.

La pantalla resultante se muestra a continuación.

Página 209

Page 214: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Presionando en el botón que aparece en la parte inferior izquierda, señalado en rojo en la pantalla anterior, se obtiene el dendrograma de consenso.

3.3.3. Métodos de remuestreo en las matrices de datos: Bootstrapping.

3.3.3.1. Obtención de las matrices remuestreadas

El primer paso es realizar el remuestreo para lo que se emplea el módulo “Transformation” utilizando los siguientes enlaces Transformation / Resample

La matriz de entrada “Input data file” es la matriz básica de datos.

Lo que se remuestrean son los caracteres. En función de la estructura de la matriz básica de datos, el remuestreo deberá hacerse por filas o por columnas.

El número de remuestreos debe ser como mínimo de 100.

Página 210

Page 215: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

3.3.3.2. Obtención de una matriz de similitud por cada una de las matrices remuestreadas.

Se utiliza el mismo procedimiento descrito para el apartado 1.5.1 (Pág. 22).

En este caso habrá 100 matrices de entrada, las obtenidas mediante la técnica de remuestreo.

A efectos prácticos la salida del módulo anterior guarda las 100 matrices de forma que puedan ser directamente tomadas por el modulo “Dis/similarity”.

Página 211

Page 216: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

3.3.3.3. Obtención de la matriz de similitud promedio.

Para esto se emplea el módulo “Transformation” mediante los siguientes enlaces Transformation / Summary

La matriz de entrada “Input file” es la obtenida en el paso anterior

Página 212

Page 217: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

3.3.3.4. Calcular y dibujar el dendrograma a partir de la matriz de similitud promedio.

Se seguirá el mismo proceso que el descrito en el apartado 1.4.1.3 (Pág. 19).

Página 213

Page 218: Guia Ntsys

Curso Intensivo de Postgrado UACH. México 2012. Fernando González Andrés.

Página 214

Page 219: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

GUÍA RÁPIDA DEL PROGRAMA SPSS ver. 13.0 y superiores

Programa para estudios estadísticos en general, muy completo pero de fácil manejo.

Página 215

Page 220: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Página 216

Page 221: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS. Pg. 2192. ESTANDARIZACIÓN DE LA MATRIZ BÁSICA DE DATOS. Pg. 2213. ANÁLISIS DE COMPONENTES PRINCIPALES (DATOS CUANTITATIVOS). Pg. 223

3.1. Obtención de los componentes principales sin rotar y rotados y el gráfico de saturaciones factoriales. Pg. 223

3.2. Proyección de cada una de las UBC sobre los tres o dos primeros componentes principales.Pg. 228

4. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS MULTI-ESTADO. Pg. 2314.1. Agrupamiento en base a todos los caracteres analizados cuando estos son de tipo multiestado

cualittativo o cuantitativos: Calcular y dibujar el dendrograma. Pg. 2314.2. Agrupamiento en base a los primeros componentes principales (los que recogen una mayor

variabilidad): Calcular y dibujar el dendrograma. Pg.2394.3. Realizar un ANOVA para comprobar si los valores medios de cada cluster para cada carácter

son significativamente diferentes. Pg. 2404.3.1. Creación de una nueva variable en la Matriz Básica de Datos con el número de

conglomerado al que pertenece cada UBC. Pg. 2404.3.2. Realización del ANOVA tomando como variable dependiente el conglomerado de

pertenencia y como variables independientes todos los caracteres analizados. Pg. 241

5. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS DOBLE-ESTADO: CALCULAR Y DIBUJAR EL DENDROGRAMA. Pg. 246

INDICE DEL CONTENIDO

Página 217

Page 222: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Página 218

Page 223: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS.El programa SPSS puede importar directamente matrices del programa Excel. La matriz no precisa codificación especial.Sin embargo es importante que las variables (=caracteres) figuren en las columnas y los casos (=UBC) en las filas.

La importación se realiza mediante los menús desplegables de SPSS como se muestra a continuación.

UBC

Página 219

Page 224: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Una vez presionado “Abrir” se obtiene el “Editor de datos” que presenta dos pantallas, la primera es la vista de datos, ...

UBC

Página 220

Page 225: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

... y la segunda es la vista de variables

2. ESTANDARIZACIÓN DE LA MATRIZ BÁSICA DE DATOS.

Si fuese necesario estandarizar la matriz de datos, la estandarización se haría por caracteres, ya que lo que se pretende es que los valores de todos los caracteres varíen entre los mismos límites.

La estandarización más habitual consiste en convertir cada valor en su puntuación típica, es decir, restarle el valor medio y dividirlo por su desviación típica. Para hacerlo de forma automática se utilizará el módulo de “Estadísticos descriptivos”, al que se accede a través del menú deplegable “Analizar”. Dentro de dicho módulo seabrirá el subprograma “Descriptivos”(Ver las figuras siguientes).

UBC

Página 221

Page 226: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

La pantalla que se obtiene es la que se presenta a continuación.

Página 222

Page 227: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

3. ANÁLISIS DE COMPONENTES PRINCIPALES (DATOS CUANTITATIVOS).3.1. Obtención de los componentes principales sin rotar y rotados y el gráfico de saturaciones

factoriales.En SPSS el ACP se encuentra dentro del módulo “Reducción de datos”, al que se accede a través del menú desplegable “Analizar, en el subprograma “Análisis factorial”.

Las variables que se utilizan en el análisis factorial son los caracteres estandarizados o normalizados.

La pantalla que se obtiene es la que se presenta a continuación.

Si se precisan otros tipos de transformaciones de variables, como por ejemplo una transformación logarítmica, el consejo es realizar dichas transformaciones en MS Excel, y luego importar con SPSS el archivo resultante. Esto reduce las necesidades de aprendizaje de un nuevo programa.

Página 223

Page 228: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Presionando el botón de “Extracción” es preciso indicar• En “Método”: El método factorial a utilizar: En este caso componentes principales.• En “Analizar” debe elegirse si se quiere trabajar con la matriz de correlaciones entre caracteres

o con la de varianzas-covarianzas.• En “Mostrar”: Si se desea que la salida del programa muestre la solución factorial antes de la

rotación y el gráfico de sedimentación.• En “Extraer”: El número de factores principales que se desea que extraiga el programa, que

puede estar en función de sus autovalores (eiguen-valores) o puede ser un número fijo.

�� �

Página 224

Page 229: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

El botón de “Rotación” sirve para realizar una rotación de los Componentes Principales, en el caso en que se quiera realizar. Si así fuera es preciso indicar:

• En “Método”: El método de rotación de los ejes más habitual y que sigue dejando los ejes ortogonales es el Varimax.

• En “Mostrar”: Si se desea que la salida del programa muestre la solución rotada y el gráfico de proyección de los caracteres sobre los componentes principales, que es lo que se denomina “Gráfico de saturaciones”. Si en “Extraer” (ver figura anterior) se indicó que se extrajeran 3 o más componentes el gráfico será 3-D; para 2 componentes será 2-D.

Presionando el botón de “Puntuaciones” se puede solicitar que para cada Unidad Básica de Caracterización (o caso) el programa guarde las coordenadas de sus proyecciones sobre los componentes principales. Para ello hay que activar la casilla “Guardar como variables”. Es necesario seleccionar el método para obtener las puntaciones factoriales.Sí en el apartado “Rotación” se solicitó del programa algún tipo de rotación, entonces las puntuaciones factoriales guardadas como variables serán los referidos a los componentes rotados.

Página 225

Page 230: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

En la pantalla de Resultados (pagina siguiente) la información que más nos interesa es la siguiente:

• Comunalidades: Las comunalidades más bajas correspondesa a aquellas variables peor explicadas por el análisis.

• Varianza total explicada: Nos da información de los eiguen-valores de cada uno de los componentes principales.

• Gráfico de sedimentación: Explica como van disminuyendo los eiguen-valores de los componentes principales.

• Matriz de componentes: Da la información sobre los eiguen-vectores de cada carácter sobre cada uno de los componentes principales.

• Matriz de componentes rotados: Idem al caso anterior pero para los componentes rotados.• Gráfico de componentes de los factores 1, 2, 3: Proyecciones de los caracteres sobre los

primeros componentes principales (máximo 3).

Una vez realizadas las operaciones anteriores, para la ejecución del análisis se presionará el botón “Aceptar”, como se indica en la siguiente figura.

Página 226

Page 231: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Página 227

Page 232: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

3.2. Proyección de cada una de las UBC sobre los tres o dos primeros componentes principales.

A partir de la versión 15 se han mejorado los gráficos y la interfaz es ahora la que se presenta a continuación.

Los gráficos interactivos son completamente intuitivos y de muy fácil manejo.

Sin embargo la versión 15.0 mantiene lo que denomina “Cuadros de diálogos antiguos” que es la que se va a analizar a continuación, para el caso de usuarios que utilicen versiones anteriores

Página 228

Page 233: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Para obtener un diagrama tridimensinal de las UBC, en los “Gráficos antiguos” de SPSS, es preciso acceder al submenú “Dispersión/puntos”.

Dentro del subprograma “Dispersion/puntos” se elegirá “Dispersión 3-D”.

En el cuadro de diálogo resultante habrá que introducir las puntuaciones factoriales de cada UBC (=caso) sobre los 3 primeros componentes principales. Para llevar a cabo esta acción, es preciso introducir en cada uno de los ejes las nuevas variables (columnas) creadas por el programa, tal como se indica en la figura de la página siguiente.

Página 229

Page 234: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Tras presionar el botón “Aceptar” en la pantalla de la figura anterior, la página de resultados es la siguiente.

Aquí se introduce la variable que lleva los nombre asignado a las UBC

Página 230

Page 235: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Si lo que se pretende es realizar un diagrama bidimensional, dentro del subprograma “Dispersión/puntos” se elegirá “Dispersión matricial”, y se procederá de forma análoga.

4. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS MULTI-ESTADO.4.1. Agrupamiento en base a todos los caracteres analizados cuando estos son de tipo

multiestado cualitativo o cuantitativos: Calcular y dibujar el dendrograma (puede ser necesario estandarizar o normalizar variables).En SPSS el Análisis de Agrupamientos se encuentra dentro del módulo “Clasificar”, al que se accede a través del menú desplegable “Analizar”. Lo normal en caracterización de germoplasma es usar el método de conglomerados jerárquicos, que se encuentra en el subprograma “Conglomerados jerárquicos” (ver figura siguiente).

Página 231

Page 236: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

La pantalla que se obtiene se presenta en la siguiente figura.

• Lo primero es indicar cuales son las variables utilizadas para la conglomeración, y la variable que va a proporcionar las etiquetas de los casos.

• Es preciso señalar si se quieren conglomerar casos o variables.

• También debe señalarse si se desea que la salida del programa muestre los Estadísticos y los Gráficos.

UBC

Página 232

Page 237: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Presionando el botón de “Estadísticos” es preciso señalar:• “Historial de conglomeración” si se desea conocer como se forma el dendrograma• “Matriz de distancias” si se desea que el programa la muestre.• En “Conglomerado de pertenencia” se puede señalar si se quiere que para cada UBC (= caso)

el programa le asigne un conglomerado de pertenencia. Si se indica “Solución única”, es preciso señalar el número de conglomerados que quieren considerarse. Con la opción “Rango de soluciones” el programa realiza una optimización. Dado que se trabaja con material biológico, no parece adecuado que un algoritmo decida por el investigador, Por ello es preferible analizar primero el dendrograma obtenido, y luego volver a realizar el análisis e indicar ya el número de conglomerados que el investigador desee considerar.

� � � �

UBC

UBC

Página 233

Page 238: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Presionando el botón de “Gráficos” es preciso señalar:• “Dendrograma” si se desea que el programa lo muestre.

Presionando el botón de “Método” es preciso señalar:• “Método de conglomeración” El método de Ligamiento Promedio en SPSS recibe el nombre

de “Vinculación inter-grupos”.

Página 234

Page 239: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

• En “Medida” hay que indicar el coeficiente a utilizar para el cálculo de la matriz de distancias. � Los coeficientes a utilizar en el caso de matrices de datos multi-estado figuran en el

apartado “Intervalo”.� Los coeficientes a utilizar en el caso de matrices de datos doble-estado figuran en el

apartado “Binaria”.• “Transformar valores” sirve para realizar la estandarización de las variables. Hay diferentes

opciones de estandarización, la más habitual es la obtención de Puntuaciones Z

Presionando el botón de “Guardar...” es posible que el programa guarde el número de conglomerado de pertenencia de cada UBC como una nueva variable (ver discusión de la página 16). Esto es útil para realizar ulteriores análisis como por ejemplo un análisis de varianza para detectar las diferencias entre los valores medios de cada conglomerado para cada carácter.

Página 235

Page 240: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

En la pantalla de Resultados (pagina siguiente) la información que más nos interesa es la se indica a continaución:•Matriz de distancias.•Dendrograma.

Una vez realizadas las operaciones anteriores, para ejecutar el análisis se presionará el botón “Aceptar”, como se indica en la siguiente figura.

UBC

UBC

Página 236

Page 241: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

El dendrograma puede editarse haciendo doble click sobre el mismo.

Para evitar que salga cortado en los casos en los que es muy largo, hay que ralizar algunos cambios en el módulo “Opciones” del menú desplegable “Edición”-

Página 237

Page 242: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Página 238

Page 243: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

4.2. Agrupamiento en base a los primeros componentes principales (los que recogen una mayor variabilidad): Calcular y dibujar el dendrograma.

El cálculo de la matriz de similitud se hará en este caso a partir de la matriz de proyección de las UBC sobre el número de componentes principales que el investigador quiera considerar, que en este caso harán las veces de caracteres. SPSS denomina a dichas proyecciones “Puntuaciones factoriales”. Para poder utilizarlas ahora es preciso haberlas guardado en el ACP (apartado 3.1. Pg. 9).

El número de Componentes Principales a utilizar debe ser definido por el investigador. Por ejemplo el bastante común utilizar los que presentan eiguen-valores mayores que 1.

Los pasos a realizar en el análisis son los ya descritos en el punto 4.1. (Pags. 14 a 20), pero con las siguientes variaciones:

• Las variables (=caracteres) serán ahora las puntuaciones factoriales del ACP, que si se solicitó al programa que las guardara lo habrá hecho bajo el nombre REGRfactorscore#for analysis, haciendo alusión al método utilizado para el cálculo de las puntuaciones (REGR) y al número de Componente Principal respecto al que se ha realizado la proyección (#)

UBC

UBC

Página 239

Page 244: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

• Otra variación es que en el cuadro de diálogo que aparece al presionar el botón “Método” en “Transformar variables” ahora no hay que hacer ningún tipo de transformación, ya que las nuevas variables no lo precisan.

4.3. Realizar un ANOVA para comprobar si los valores medios de cada cluster paracada carácter son significativamente diferentes.4.3.1. Creación de una nueva variable en la Matriz Básica de Datos con el número de conglomerado al que pertenece cada UBC.La primera condición es que a la hora de realizar el Análisis de Conglomerados, se haya solicitado, tras presionar el botón “Guardar...”, la creación en la Matriz Básica de Datos de una nueva variable que es el número de conglomerado de pertenencia de cada UBC (Pg 18).La figura siguiente resume los pasos a realizar.

Página 240

Page 245: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

4.3.2. Realización del ANOVA tomando como variable dependiente el conglomerado depertenencia y como variables independientes todos los caracteres analizados.En SPSS el Análisis de Varianza de un factor encuentra dentro del módulo “Reducción de datos”, al que se accede a través del menú desplegable “Analizar”, en el subprograma “Análisis factorial”.

UBC

Página 241

Page 246: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

La pantalla que se obtiene es la que se presenta a continuación:

UBC

� �

Esta es la nueva variable que indica el conglomerado de

pertenencia UBC

Página 242

Page 247: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Presionando el botón de “Opciones ...” es preciso señalar:• En “Estadísticos”:

�Descriptivos para obtener los estadísticos descriptivos.�Prueba de homogeneidad de la varianza.�Si hubiera que rechazar la hipótesis de igualdad de varianzas habría que señalar Brown-

Forsythe para utilizarlo en lugar del valor F cuando las varianzas son desiguales.

Presionando el botón de “Post-Hoc” es preciso señalar las pruebas post-hoc que se quiere que realice el programa:

• Asumiendo varianzas iguales la más aconsejada es la de Tukey.• Si no se pudieran asumir varianzas iguales, estaría aconsejada la prueba de Games-Howell

Página 243

Page 248: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Nota importante: Para que puedan realizarse las pruebas Post-Hoc es necesario que todos y cada uno de los grupos tenga al menos dos casos.

Una vez realizadas las operaciones anteriores, para la realización del análisis se presionaráel botón “Aceptar”, como se indica en la siguiente figura.

En la pantalla de Resultados (pagina siguiente) la información que más nos interesa es la siguiente:

• Descriptivos: Incluye los estadísticos descriptivos.• Prueba de homogeneidad de varianzas: Resultados de la prueba de Levene para la

homogeneidad de varianzas. Si no se rechaza la hipótesis nula entonces las varianzas son homogéneas.

• ANOVA: Es la tabla del ANOVA.• Pruebas post-hoc: Presenta el resultado de las pruebas post-hoc. Algunas de las pruebas

post-hoc, como por ejemplo Tukey, hacen grupos homogéneos, que es lo que se presenta en el subapartado “Subconjuntos homogéneos”.

UBC

Página 244

Page 249: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Página 245

Page 250: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

• En el cuadro de diálogo que aparece al presionar el botón “Método” en “Medida” hay que indicar el coeficiente a utilizar para el cálculo de la matriz de distancias. Al tratarse de matrices de datos doble-estado debe utilizarse uno de los coeficientes que figuran en elapartado “Binaria”.

5. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS DOBLE-ESTADO: CALCULAR Y DIBUJAR EL DENDROGRAMA.

Los pasos a realizar en el análisis son los ya descritos en el punto 4.1. (Pags. 14 a 20), pero con las siguientes variaciones:

UBC

UBC

Página 246

Page 251: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Página 247

Page 252: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México 2012. Fernando González Andrés.

Página 248

Page 253: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

GUÍA RÁPIDA DEL PROGRAMA POPGENE ver 1.32.Programa de análisis de poblaciones.

Página 249

Page 254: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

Página 250

Page 255: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

I. APLICACIÓN A DATOS CODOMINANTES. Pg. 253

1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS. 2. CARGA DE LOS DATOS EN EL PROGRAMA POPGENE. Pg. 254

3. REALIZACIÓN DEL ANÁLISIS. Pg. 255

3.1. Para realizar el análisis de manera ordenada, primero se realizarán los análisis intrapoblacionales. Pg. 255

3.2. A continuación se realizarán los análisis interpoblacionales. Pg. 256

II. APLICACIÓN A DATOS DOMINANTES. Pg. 258

1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS. Pg. 258

2. CARGA DE LOS DATOS EN EL PROGRAMA POPGENE. Pg. 259

3. REALIZACIÓN DEL ANÁLISIS. Pg. 260

3.1. Para realizar el análisis de manera ordenada, primero se realizarán los análisis intrapoblacionales. Pg. 260

3.2. A continuación se realizarán los análisis interpoblacionales. Pg. 261

Página 251

Page 256: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

Página 252

Page 257: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

Este programa calcula índices para estimar la diversidad genética dentro de las poblaciones y entre poblaciones. Además también calcula las relaciones genéticas entre las poblaciones, realizando una labor análoga al programa NTSYS.I. APLICACIÓN A DATOS CODOMINANTES.1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS.

El archivo de entrada en este programa es de tipo “solo texto”.

El archivo de entrada debe describir el genotipo para cada uno de los individuos de la población considerada.

Lo más aconsejable es preparar los datos en un archivo de MS Excel, y luego guardarlo como texto delimitado por tabulaciones. Hay que poner especial cuidado para que no se corten columnas, pues el ancho de campo en los archivos solo texto es menor que el que permite MS Excel. La reducción de la anchura de las columnas es una medida eficaz para evitar el problema descrito.

Dat

os d

e la

Pob

laci

ón

1

Locus 1

Locus 2

Locus 3 Locus 4

Dat

os d

e la

Pob

laci

ón

2

Individuo 1

Individuo n

El contenido de estas filas es importante, sobre todo el número

de poblaciones y el número de loci.

Entre estas líneas y el inicio de los datos debe haber una línea de

separación.

Página 253

Page 258: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

2. CARGA DE LOS DATOS EN EL PROGRAMA POPGENE.

La opción de carga debe coincidir con el tipo de datos que se tengan.

Página 254

Page 259: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

3. REALIZACIÓN DEL ANÁLISIS.

La opción de análisis debe ser congruente con el tipo de datos que se tengan.

3.1. Para realizar el análisis de manera ordenada, primero se realizarán los análisis intrapoblacionales.

Página 255

Page 260: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

3.2. A continuación se realizarán los análisis interpoblacionales.

Página 256

Page 261: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

Página 257

Page 262: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

II. APLICACIÓN A DATOS DOMINANTES.1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS.

Las consideraciones generales son las mismas realizadas para el caso de datos codominantes (I)..

El contenido de estas filas es importante, sobre todo el número

de poblaciones y el número de loci.

Entre estas líneas y el inicio de los datos debe haber una línea de

separación.

Dat

os p

obla

ción

1

Dat

os p

obla

ción

2

Individuo 1

Individuo n

Cebador 1 (locus 1) Cebador n (locus n)... ...

Página 258

Page 263: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

2. CARGA DE LOS DATOS EN EL PROGRAMA POPGENE.Igual que en el caso anteior, la opción de carga debe coincidir con el tipo de datos que se tengan.

Página 259

Page 264: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

3. REALIZACIÓN DEL ANÁLISIS.

La opción de análisis debe ser congruente con el tipo de datos que se tengan.

3.1. Para realizar el análisis de manera ordenada, primero se realizarán los análisis intrapoblacionales.

Página 260

Page 265: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

3.2. A continuación se realizarán los análisis interpoblacionales.

Página 261

Page 266: Guia Ntsys

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

Página 262

Page 267: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

GUÍA RÁPIDA DEL PROGRAMA IDENTITY 1.0.

Programa de análisis de datos de microsatélites (STMS) .

Página 263

Page 268: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Página 264

Page 269: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS. Pg. 267

2. CARGA DE LOS DATOS EN EL PROGRAMA IDENTITY. Pg. 268

3. REALIZACIÓN DEL ANÁLISIS. Pg. 269

4. PRESENTACIÓN DE LOS RESULTADOS. Pg. 271

Página 265

Page 270: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Página 266

Page 271: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Este programa puede obtenerse libremente a través del WWW en la dirección:

El programa ha sido específicamente diseñado para el análisis de marcadores microsatélites (STMS) en un estudio de cultivares de vid.

Los principales análisis que realiza son los siguientes:•Evaluación de polimorfismos (parámetros generales de genética de poblaciones).•Análisis de posibles genotipos idénticos.•Reconstrucción del “pedigrí” de las OTU en estudio

1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS.

El archivo de entrada en este programa es un archivo de MS Excel guardado en formato *.csv.

El archivo de entrada debe describir el genotipo para cada una de las OTU (cultivares o variedades) y debe tener la estructura del ejemplo.

Nombre de la variedad o cultivar

Tamaño del 1er alelo del Locus 1 para cada variedad

Tamaño del 2º alelo del Locus 1para cada variedad

Página 267

Page 272: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

2. CARGA DE LOS DATOS EN EL PROGRAMA IDENTITY.

La hoja de MS Excel deberá guardarse con formato de extensión *.csv.

El archivo debe de ser visualizado en el propio MS Excel ya que es necesario comprobar que al ser guardado en formato *.csv, se han utilizado como separadores “,” y no “;”. En caso de que se hayan utilizado caracteres no adecuados, hacer una “búsqueda y reemplazo”por “,”. Si se desea se puede visualizar el archivo en un editor de “solo texto”

Página 268

Page 273: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

3. REALIZACIÓN DEL ANÁLISIS.

El programa consta de un solo archivo ejecutable, que debe guardarse en la misma carpeta electrónica que el archivo con la matriz básica de datos archivada como *.csv.

Abrir una ventana de DOS, entrar en la carpeta electrónica donde se hayan colocado el archivo ejecutable del programa y teclear: identity_“nombre del archivo con datos”.csv.

Página 269

Page 274: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Página 270

Page 275: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

4. PRESENTACIÓN DE LOS RESULTADOS.

El programa crea los tipos de archivos que se presentan en el gráfico. Todos ellos pueden abrirse con cualquier editor de “solo texto”

• El archivo “nombre de archivo con datos”.stat tiene la siguiente información:

– Número de alelos.– Frecuencias alélicas.– Desviación estándar de las frecuencias alélicas.– Límite del 95% superior del intervalo de confianza de las frecuencias alélicas (para ser

utilizado en estadísticas de la máxima verosimilitud.– Suma de alelos detectados (2 x número de muestras si no faltan datos).– Heterocigosidad esperada y observada.– Frecuencia de alelos nulos.– Probabilidad de identidad (Paetkau et al., 1995)– Probabilidad de excusión de paternidad (Weir, 1996).

Página 271

Page 276: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

El archivo “nombre de archivo con datos”.syn proporciona una lista de las OTU con genotipo idéntico.

El archivo “nombre de archivo con datos”.par da una lista de las posibles combinaciones parentales-descendencia asumiendo herencia mendeliana de los alelos de los STMS.

El archivo “nombre de archivo con datos”.lik proporciona datos de la máxima verosimilitud correspondientes a las diferentes combinaciones parentales-descendencia propuestos.

Página 272

Page 277: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

GUÍA RÁPIDA DEL PROCESO DE IDENTIFICACIÓN Y ANÁLISIS

FILOGENÉTICO DE RECURSOS GENÉTICOS, BASADO EN LA COMPARACIÓN DE SECUENCIAS

DE ADN.

CASO PARTICULAR DE BACTERIAS.

Programas CHROMAS, DNA Star, EZ-TAXON, MEGA y CLUSTAL.

Página 273

Page 278: Guia Ntsys

2

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

Página 274

Page 279: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

I. LIMPIEZA DE LA SECUENCIA EN EL PROGRAMA CHROMAS. Pg. 277

1. ABRIR EL CROMATROGRAMA . Pg. 277

2. ELIMINAR LOS EXTREMOS EN LOS QUE LA IDENTIFICACIÓN DE BASES NO ES FIABLE. Pg. 278

3. VOLTEAR LA SECUENCIA “R” (REVERSA) Y OBTENER LA COMPLEMENTARIA. Pg. 280

II. OBTENCIÓN DE LA SECUENCIA CONSENSO O “CONTIG” CON EL PROGRAMA DNASTAR Pg. 281

1. OBTENER AUTOMÁTICAMENTE LA SECUENCIA CONSENSO CON EL SUBPROGRAMA SEQMAN . Pg. 281

2. ABRIR LA SECUENCIA CON EL PROGRAMA Edit Seq . Pg. 288

III. IDENTIFICACIÓN DE LA BACTERIA PROBLEMA POR COMPARACIÓN DE LA SECUENCIA DEL GEN 16 S DNA CON LA BASE DE DATOS EN LA QUE FIGURA ESTA SECUENCIA PARA TODAS LAS BACERIAS TIPO, DENOMINADA EZ-TAXON. Pg. 290

IV. ANÁLISIS DE LAS RELACIONES FILOGENÉTICAS ENTRE UBC. Pg. 292

1. REALIZAR EL ALINEAMIENTO MÚLTIPLE UTILIZANDO EL PROGRAMA MEGA. Pg. 293

2. CONSTRUIR EL ÁRBOL FILOGÉNÉTICO CON EL PROGRAMA MEGA.

Pg. 301

Página 275

Page 280: Guia Ntsys

4

Curso Intensivo de Postgrado. UACH. México. 2012. Fernando González Andrés.

Página 276

Page 281: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Básicamente la técnica consiste en comparar la secuencia de un determinado gen o espacio intergénico, entre diferentes accesiones (UBC). Normalmente se compara la secuencia de una o varias UBC problema contra la misma secuencia de accesiones depositadas en las bases de datos.

En primer lugar hay que limpiar la secuencia, a continuación hacer el “contig” y finalmente comparar la secuencia con las que están depositadas en las bases de datos, que es lo que se denomina alineación.

Esta alineación puede tener una doble finalidad: (i) Por una parte puede tener como objetivo identificar la UBC en estudio por comparación, dos a dos, con las secuencias depositadas en las bases de datos. (ii) El segundo objetivo es realizar un estudio filogenético de la UBC. En este caso se realizarán comparaciones múltiples (lo que se denomina alineamiento múltiple) de la secuencia correspondiente a la UBC problema, con la misma secuencia en otras accesiones que estén filogenéticamente próximas

El ejemplo que se presenta corresponde a la secuencia del gen 16S ADN de bacterias de suelo

I. LIMPIEZA DE LA SECUENCIA EN EL PROGRAMA CHROMAS.1. ABRIR EL CROMATROGRAMA .

La extensión del cromatograma debe ser *.abi, *.ab1, *.scf, o *.esd.

Para observar el cromatograma, no solamente la secuencia en forma de texto, debe pulsarse el icono señalado en la figura.

Página 277

Page 282: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

2. ELIMINAR LOS EXTREMOS EN LOS QUE LA IDENTIFICACIÓN DE BASES NO ES FIABLE.

Es necesario realizar este proceso en ambos extremos.

En el extremo izquierdo se selecciona con el ratón, la base a partir de la cual la secuencia es aceptable (leyendo de izquierda a derecha), y en el menú “Edit” se elige la opción “Set LeftCutoff”, con lo que la secuencia situada a la izquierda de dicha base queda resaltada en amarillo para su posterior eliminación.

Página 278

Page 283: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

En el extremo derecho se selecciona con el ratón, la base a partir de la cual la secuencia NO es aceptable (leyendo de izquierda a derecha), y en el menú “Edit” se elige la opción “Set Right Cutoff”, con lo que la secuencia situada a la derecha de dicha base queda resaltada en amarillo para su posterior eliminación.

Página 279

Page 284: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Para hacer efectivo el corte, dentro del menú “Edit” se pulsa “Delete Cutoff Sequences”, con lo que desaparece la secuencia pero no el cromatograma.

A continuación se graba la secuencia con el mismo nombre que tenía, pero añadiendo algún sufijo para identificar que corresponde a la secuencia corregida.

IMPORTANTE: Esta tarea debe realizarse con las secuencias “F” y “R” de cada gen amplificado en cada UBC.

3. VOLTEAR LA SECUENCIA “R” (REVERSA) Y OBTENER LA COMPLEMENTARIA.

¡¡Importante!! Esto solo se hace con la secuencia R.

Una vez realizado el paso 2 para la secuencia R, antes de guardarla, es necesario voltear esta secuencia y obtener la complementaria, para poder unirla a la anterior y obtener la secuencia consenso o “contig” en un paso posterior.

Para ello, en el apartado “Edit” se pulsa “Reverse+Complement” y posteriormente se procede a guardar el archivo, mediante el mismo proceso explicado en el paso 2.

Página 280

Page 285: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

II. OBTENCIÓN DE LA SECUENCIA CONSENSO O “CONTIG” CON EL PROGRAMA DNASTAR En el apartado I se ha explicado como limpiar y acondicionar las secuencias “F” y “R” de cada gen amplificado para cada UBC. En este apartado se va a explicar como unirlas (mediante la zona de solape) para obtener la secuencia consenso o “Contig”.

1. OBTENER AUTOMÁTICAMENTE LA SECUENCIA CONSENSO CON EL SUBPROGRAMA SEQMAN .

Abrir el programa SEQMAN y en el menú “File” seleccionar “New”, lo que abre un nuevo proyecto.

Inmediatamente se abre una ventana, que debe cerrarse con la opción “Skip”. Al cerrar esta nueva ventana se abre otra en la que se empieza a trabajar.

Página 281

Page 286: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Página 282

Page 287: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

En esta nueva ventana se pulsa la “Add Sequences”

Alternativa: otra manera de llegar a la pantalla anterior es, desde la pantalla de inicio, pulsar en el menú principal “Sequence” y luego “Add”

Página 283

Page 288: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Para poder recuperar los archivos corregidos con el programa Chormas es necesario señalar como “Tipo” de archivos: “Abi Trace Files w/o Extension(*.*,*.abi,*.ab1)

Se seleccionan los dos archivos “F” y “R” de una misma accesión, se añaden con “Add” y luego se pulsa “Done”

Página 284

Page 289: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Antes de realizar el análisis es preciso cambiar algunos parámetros. Para acceder a ellos se pulsa “Project” en el menú principal y luego en “Parameters”

En la siguiente figura se indican los parámetros a modificar:

Página 285

Page 290: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Posteriormente se presiona “Assemble” y se obtiene en la ventan de la derecha la secuencia consenso o “Contig”.

Página 286

Page 291: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Pulsando dos veces en “Contig” en la ventana de la derecha, aparece una nueva ventana con la secuencia consenso o contig.

Pulsando la opción “Find conflict” del menú desplegable “Edit” el programa resalta en rojo los conflictos detectados en la zona de solape del “contig”. Luego se corrigen a mano cada uno de ellos, tomando la decisión que parezca la más adecuada.

Página 287

Page 292: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

El último paso es guardar la secuencia consenso o “contig”, lo que se hace desde la opción “Contig” del menú principal, en la opción “Save Consensus” y “Single File”.Debe guardarse con dos extensiones diferentes:

• Como el archivo propio del programa (Lasergene DNA file (*.seq)• Como archivo FastA (*.fas), para trabajar posteriormente en MEGA

2. ABRIR LA SECUENCIA CON EL PROGRAMA Edit Seq .

Para abrir la secuencia, hay que hacerlo en otro subprograma del programa “DNA Star” que es Edit Seq.

� �

Página 288

Page 293: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

En el menú principal, se pulsa “File” y a continuación en el desplegable que se abre “Open”.

Página 289

Page 294: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Para seguir trabajando con una nueva secuencia, primero se cierra con doble click del botón izquierdo del ratón ese “contig”, para empezar a trabajar en uno nuevo. Luego se siguen los pasos indicados en recuadro de la página 11.

III. IDENTIFICACIÓN DE LA BACTERIA PROBLEMA POR COMPARACIÓN DE LA SECUENCIA DEL GEN 16 S DNA CON LA BASE DE DATOS EN LA QUE FIGURA ESTA SECUENCIA PARA TODAS LAS BACERIAS TIPO, DENOMINADA EZ-TAXON.En el caso de haber trabajado con bacterias, lo más probable es que se haya secuenciado el gen 16 S DNA, en el que se basa la taxonomía. La identificación consiste en la comparación de dicha secuencia en la bacteria problema, con la secuencia de esa mismo gen para otras bacterias incluidas en la base de datos ez-taxon, que aloja la secuencia del gen 16 S DNA para todas las cepas tipo.

Se trabaja online, en la dirección web http://eztaxon-e.ezbiocloud.net/

Para tener acceso es necesario registrarse como usuario.

Una vez realizado el registro y el acceso, para proceder a identificar la UBC problema se accede en el menú de la izquierda a la opción “Identify”.

A continuación se introduce el nombre asignado a la UBC en estudio y la secuencia consenso o “contig” que se ha obtenido con el programa Seq Man, para lo que es suficiente copiarla del EditSeq (página 17) y pegarla en la casilla correspondiente del ez-taxon. Para proceder a la identificación se pulsa el botón “Identify”.

abierto

cerrado

Página 290

Page 295: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Página 291

Page 296: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

El resultado informa sobre la identidad de la bacteria depositada en la base de datos, que mayor similitud presenta con la bacteria problema, indicando el porcentaje de dicha similitud y el % de la secuencia que ha sido comparada. La página de resultados conserva la información de todas las identificaciones realizadas

IV. ANÁLISIS DE LAS RELACIONES FILOGENÉTICAS ENTRE UBC.Se trabaja normalmente con varios programas.

BLAST (Basic Local Alignment Search Tool) es una base de datos del NCBI (National Center forBiotechnology Information – USA), que permite comparar en tiempo real una determinada secuencia con todas las depositadas en dicha base de datos, indicando al mismo tiempo el grado de similitud. Por tanto realiza una tarea similar a la de EzTaxon

MEGA. Se trata de un programa para realizar alineamiento múltiples y árboles filogenéticos. Para los alineamientos múltiples recurre a otro programa que es el de mayor difusión para realizar esta tarea, que es CLUSTAL, concretamente la versión CLUSTALW que es la versión que opera online.

Página 292

Page 297: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

1. REALIZAR EL ALINEAMIENTO MÚLTIPLE UTILIZANDO EL PROGRAMA MEGA.

En primer lugar hay que abrir un nuevo archivo pulsando la techa “Align” y luego en el desplegable que se abre “Edit/Build Alignment”.

Sucesivamente aparecen dos avisos a los que hay que responder, según se indica en las siguientes figuras, y a continuación se abre una nueva pantalla, en la que se añaden las secuencias que vayan a ser sometidas a un alineamiento múltiple.

��

Página 293

Page 298: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

1.1. En primer lugar se añaden las secuencias consenso o “contig” de las UBC problema (en el apartado II se ha explicado como se obtiene el “contig”) , presionado la tecla que se señala en la figura. Lo que se añade son archivos en formato FASTA, pues este fue uno de los formatos en los que se guardó la secuencia consenso o “contig” en el SeqMan, para poder incorporarlos al MEGA.

Página 294

Page 299: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Se pueden añadir todas las secuencias a la vez o de una en una. Es posible que el programa no traslade correctamente el nombre de la UBC, por lo que habrá que corregirla a mano. Esto es especialmente importante, si se añaden todas las secuencias a la vez.

1.2. A continuación se añadirán las secuencias correspondientes a las UBC procedentes de las bases de datos. Una opción es importarlas de la base de datos BLAST.

Presionando en la tecla que se señala en la figura, el programa redirecciona a dicha base de datos, abriéndose una nueva ventana.

En esa nueva ventana se incluye el número de Locus en el Genebank de la secuencia que queramos recuperar y señalamos que se trata de una base de datos de nucleótidos (ver figura). Para ejecutar la búsqueda se pulsa la tecla BLAST que aparece al final de la pantalla.

Página 295

Page 300: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

El proceso de búsqueda se realiza online y tarda un cierto tiempo, al final se obtiene una pantalla como la que aparece en la figura. En esta pantalla aparece toda la información que guarda la base de datos BLAST sobre la UBC de la que se ha solicitado información, e indica cuales son los organismos más similares en lo que respecta a la secuencia del gen analizado (para verlo desplazar hacia abajo la ventana que se ha abierto).Para obtener la secuencia es preciso presionar sobre “Query ID”, obteniéndose la información que se observa en la figura siguiente, en la que como puede apreciarse está la secuencia del gen 16S DNA tal como se depositó en la base de datos BLAST.

Página 296

Page 301: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

A continuación se incorpora esta información en el programa MEGA. Para ello primero se presiona en “Display Settings” y se señala como tipo de formato “FASTA (text)” y luego se presiona “Add To Alignment” con lo que automáticamente se incorpora a MEGA:

Página 297

Page 302: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Nota: Si se está trabajando con ez-taxon, otra manera de incorporar las secuencias de las bacterias procedentes de dicha base de datos, es guardar la información de la accesión y la secuencia en formato FASTA (existe una opción que así lo permite en el ez-taxon). Una vez que se dispone de las secuencias en formato FASTA, la introducción en el MEGA se realizarápor el mismo procedimiento indicado en la pág. 22.

Una vez que se dispone de todas las secuencias que se quieren alinear en el “AlignmentExplorer” (ver Figura), el siguiente paso es seleccionarlas, lo que se ejecuta entrando en el menú desplegable “Edit” y seleccionado la opción “Select All” si se quieren utilizar todas ellas en el alineamiento.

El alineamiento se realiza con Clustal W, pero esto puede hacerse directamente desde el programa MEGA, para lo que se entra en el menú desplegable “Aligment” y se selecciona la opción “Align by ClustalW”.

Página 298

Page 303: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Aparece una pantalla en la que se pueden seleccionar algunos parámetros

Página 299

Page 304: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

De esta manera se obtiene el resultado del alineamiento múltiple.

Página 300

Page 305: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Es necesario guardar el archivo resultante del alineamiento múltiple para posteriormente poder realizar un árbol filogenético. Para ello hay que recurrir a exportarlo, opción que se encuentra dentro del menú desplegable “Data”, y dentro de él “Export Alignment”. Es necesario elegir el formato. Si se va a seguir trabajando en el programa MEGA, la opción mejor es “MEGA Format”

2. CONSTRUIR EL ÁRBOL FILOGÉNÉTICO CON EL PROGRAMA MEGA.

En la página de inicio del programa MEGA se pulsa en la tecla “Phylogeny” con lo que se abre un menú desplegable, en el que debe elegirse el procedimiento para el cálculo de árbol filogenético.

Página 301

Page 306: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

Se abre una nueva ventana en la que el programa pide que introduzcamos el archivo a analizar, que es el de alineamiento múltiple obtenido según se ha explicado en el apartado anterior

Una vez recuperado dicho archivo, se abra una nueva ventana, en la que hay que pulsar el botón “Compute” para realizar el análisis.

Página 302

Page 307: Guia Ntsys

Curso Intensivo de Postgrado. UACH. Mexico.2012 Fernando González Andrés

El resultado se presenta en una nueva ventana, en la que existen varias opciones para trabajar con este árbol

Página 303