Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián...

99
Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA CCCCCCCCCCCCCCCCCC GGGGGGGGGGGGGGGG TTTTTTTTTTTTTTTT Laboratorio de BioSistemas del Departamento de Ingeniería Genética del CINVESTAV Unidad Irapuato

Transcript of Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián...

Page 1: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Marcadores moleculares:más allá de lareconstrucción

filogenética

Dra. Amanda Castillo CobiánDepto. de Ingeniería Genética

CINVESTAV-IrapuatoIPN

AAAAAAAAAAAAAAACCCCCCCCCCCCCCCCCCGGGGGGGGGGGGGGGGTTTTTTTTTTTTTTTT

Laboratorio de BioSistemasdel Departamento de Ingeniería Genética del CINVESTAV Unidad Irapuato

Page 2: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Objetivos

1) Dar a conocer los fundamentos teórico-prácticos de las técnicas más comúnmente utilizadas en el estudio de evolución molecular. Desde la selección de un buen marcador hasta la fechación molecular, pasando por la reconstrucción filogenética como fundamento de todos los estudios en biología evolutiva moderna.

2) Demostrar el tipo de preguntas que pueden resolverse mediante los estudios de evolución molecular y el alcance que pueden tener.

3) Que los participantes adquieran un panorama general sobre los análisis estadísticos y el software disponible para el análisis de datos moleculares.

4) Demostrar el impacto que los estudios evolutivos pueden tener en trabajos aplicados y como han creado un puente de análisis para entender los procesos macro y microevolutivos.

Page 3: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

“ DNA: that registry of chance, that tone-deaf conservatory where the noise is preserved with the music”

-Jaques Monod

Historia

Procesos demográficos

Procesos estocásticos

Page 4: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Análisis de datos moleculares

* Proteínas

*DNA

Puede cubrir varios aspectos como :

Estudios a nivel genética de poblaciones (estructura de poblaciones naturales)

Estudios de selección natural (Adaptación molecular)

Cálculos de tiempos de divergencia(Relojes moleculares)

Page 5: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

A partir de la teoría Darwin-Wallace:

Se generaron dos campos de estudio:

1) la historia evolutiva de los organismos

2) elucidación de las fuerzas evolutivas que moldean la biodiversidad y sus adaptaciones

DarwinWallace

Page 6: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

La representación de relaciones evolutivas…… es ancestral…...

Page 7: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Evolución = Cambio

"Evolution is the idea that all existing animals and

plants are descended from some one ancestor many

millions of years ago or at least a small number of

ancestors many millions of years ago”

John Maynard Smith

Page 8: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Darwin defined evolution as "descent with modification" and the word 'descent' refers to the way evolutionary modification takes place in a series of populations that are descended from

one another.

Page 9: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Fuerzas EvolutivasFuerzas Evolutivas

Selección Natural

Mutación

Deriva Génica

Migración

Endogamia

Page 10: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Tasa

¿ Porqué es importante la reconstrucción de las relaciones

de ancestría-descendencia/ reconstruir la filogenia de los

organismos?

Page 11: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

FILOGENIA

Hipótesis estadística de relaciones evolutivas

Nos habla no sólo de las relaciones sino del proceso…..

Page 12: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Reconstrucción filogenética

Metodología que seguimos para estimar relaciones

evolutivas… Mirada al pasado…….

Page 13: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

HOMOLOGÍA: Relación entre dos especies que han descendido a partirde un origen en común, comparten un mismo ancestro, divergencia evolutiva.

ANALOGÍA: Relación entre características comúnes, pero no a partir de un ancestro común, no de origen, relación convergente.

Datos curiosos:

1) La homología no es una cantidad, se es o no homólogo, no hay tal cosa como un porcentaje de homología.

2) Se dice que dos secuencias poseen un 95% de SIMILITUD!!!!! o identidad.

3) Sólo podemos hacer reconstrucción filogenética con caracteres homólogos!!!

Page 14: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 15: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Las relaciones entre los genes homólogos pueden ser del tipo:

1) Ortólogos – relacionados a un evento de especiación.

2) Parálogos – relacionados a un evento de duplicación génica.

3) Xenólogos – producto de un evento de transferencia horizontal.

Page 16: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 17: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Se pueden obtener distintos arboles filogenéticos donde las relacionesdescritas entre las especies sean: monofiléticas, polifiléticas o parafiléticas.

Page 18: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Monofilético

Polifilético

Page 19: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Un árbol filogenético es un diagrama compuesto por nodos y ramas.

A

BC

D

E

nodo terminal

nodo interno

Rama

(OTU)

Enraizado

Por lo tanto un árbol filogenético es una hipótesis de relaciones evolutivas.

Posee dos componentes: tasa y tiempo (la que se acerca más a la descripción real de tiempo evolutivo)

Page 20: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Árbol de especies

Árboles de especies: contiene un representativo de cada especie, los nodos se refieren a eventos de especiación.

Page 21: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Árboles de genes (genealogías): representan la historia de un gen en particular, los nodos pueden ser relacionados con eventos de especiación o de duplicación génica.

Árbol de genes

Page 22: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

* Los árboles se construyen en base a las similitudes entre los distintos OTUs (Unidades taxonómicas).

* Estas diferencias o similitudes son cuantificadas con diferentes métodos para generar la topología del árbolbasado en las distancias existentes en los organismos.

* En las filogenias moleculares la base de la comparación son sustituciones en nucleótidos cuando se trata de DNA o amino ácidos para las proteínas.

Page 23: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Ser o no ser un marcador molecular…….

Ese es el dilema…….

O mejor dicho…..

¿Qué es un marcador molecular?

Page 24: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Un marcador molecular es un indicador de la historia evolutiva,es lo que vamos a analizar para poder dilucidar historia, así como, diferentes procesos evolutivos.Posee información genética y/o fenotípica y sobre todo estadística acerca del proceso evolutivo.

Marcadores moleculares utilizados para análisis filogenético:

1) RFLP´S.

2) Fingerprints genómicos (AFLP´s, RAPDS, SNP´s,).

3) Análisis de enzimas multilocus.

4) Secuencias DNA y proteínas.

Page 25: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Características ideales de un marcador molecular:

1)Suficiente información (estadísticamente hablando) +/- de 500 pb

2) Que posea resolución (dependerá del nivel taxonómico)

3) Que nos relate la historia de la especie (ortólogos, dependiendo del tipo de estudio).

Page 26: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Los marcadores moleculares, al ser marcadores del proceso evolutivo,

poseen restricciones de diversos tipos:

1) Sitios catalíticos (función)

2) Exones

3) Intrones

4) Secuencias reguladoras

5) Estructura

6) Posiciones

7) Pseudogenes

8) Diferencias en tasas de sustitución (cambio)

Page 27: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Un árbol filogenético es un diagrama compuesto por nodos y ramas.

A

BC

D

E

nodo terminal

nodo interno

Rama

(OTU)

Enraizado

Por lo tanto un árbol filogenético es una hipótesis de relaciones evolutivas.

Posee dos componentes: tasa y tiempo (la que se acerca más a la descripción real de tiempo evolutivo)

Page 28: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

5453557569676872730.98

0.730.97

7476798684850.988789900.990.57

0.51

919293

0.97

0.97

0.97

0.970.97

0.96

0.97

63960.98616059625865660.970.97

0.970.73

0.97

64710.977080818283

0.88

32341972680.990.98

0.790.89

161724

0.98

0.96

351122233133282927300.92

0.970.73

0.96

0.97

1438390.9840410.98

0.980.98

0.97

0.89

0.97

4150.99

0.96

111791040.962526360.970.96

0.91

7856371010.980.97

0.97

52940.9695991020.930.96

0.56

1161181141154244110111

0.950.96

4346474950105106107109112

0.94

4548108113

0.96

0.69

0.95

0.87

0.77

571001030.970.93

0.72

2051889818770.66

0.86

0.51

10210.98

0.53

123513970.980.94

0.86

0.73

0.79

0.94

0.65

0.96

0.59

politomía

Clados resueltos

Topología con longitudes de ramas (aditiva)

Page 29: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

La reconstrucción filogenética requiere de la estimaciónde las relaciones evolutivas, y dependiendo del método de reconstrucción se tendrá también la estimación dela diferencia o divergencia genética.

Se estima:

1) Topología

2) Distancia genética

Mediante el uso de algoritmos o métodos de optimización. (NJ/UPGMA) (Parsimonia/Verosimilitud)

1) Los algoritmos hacen estimación de topología y distancia,al mismo tiempo. Por lo mismo son muy rápidos.

2) Los métodos basados en un criterio de optimización, hacenuna separación y escogen en un espacio de óptimos los mejores,para posteriormente describir el proceso evolutivo como un espaciode probabilidades. Por lo mismo son computacionalmente intensivosy lentos.

Page 30: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Pero, ¿cómo se determina la homología en los caracteres moleculares?

* Alineación de secuencias (aa ó nucleótidos)

-Cada sitio es un caracter con origen compartido (homólogo).

-Equivale a una característica morfológica.

-Estadísticamente es más robusto.

-Para mantener la correspondencia en sitios homólogos es necesario laintroducción de ‘gaps’.

-Indeles

-Gaps e indeles NO se introducen de manera aleatoria.

-No interrumpen el marco delectura y respetan estructura (loops)

Page 31: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Existen diversos programas que realizan alineaciones de secuencias:

1) ClustalW (y sus variaciones)

2) Muscle

3) T-Coffe

Estos programas realizan una alineación global, es decir, fuerzan elalineamiento de las secuencias en su longitud total.

Page 32: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 33: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Otros algoritmos de alineación:

1)FASTA

2)BLAST

Son programas de alineación local sólo buscan segmentos conla puntuación más alta. (por ejemplo, localizan dominios de proteínas)

Page 34: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

A mayor distancia genética es mayor la acumulación de mutaciones. Dependiendo del tiempo de acumulación deestos cambios puede llegar a ser muy difícil o imposiblela alineación en algunas regiones de las secuencias.(Saturación)

Las regiones que no son alineables o de homología dudosadeben de ser excluidas de cualquier análisis filogenético,pues meten ruido y generan hipótesis de relaciones falsas.

Page 35: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Para los métodos que utilizan un CO, es necesario el desarrollo deun modelo de sustitución (nucleótidos, aa o codones).

Estos modelos son aproximaciones a los procesos naturales de sustituciónen el tiempo.

Debido a que los métodos con CO ajustan los datos observados a un determinado modelo de sustitución y de acuerdo a esto modelan las diferentes topologías y les brindan un soporte estadístico, es de suma importancia la determinación del modelo de sustitución que más se ajustea los datos.

Los modelos de sustitución describen las probabilidades de cambioya sea de un nucleótido por otro (A-G, A-C), de un aa por otro Ala-Try, de un codon por otro AGT-GGG, por ejemplo.

Page 36: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

La reconstrucción filogenética requiere de estimaciones de:

1) Topología

2) Proceso evolutivo (requiere de un modelo de sustitución o cambio)

3) Estos modelos de sustitución nos describen las probabilidades en quese dan las sustituciones.

4) Los métodos que determinan una distancia genética o usan un criteriode optimización ocupan un modelo explícito de sustitución.

5) Los métodos de distancia estiman un parámetro (Número de sust. por sitio)

6) Los métodos con criterio de optimización estiman el valor de cada unode los parámetros del modelo dada una topología y un grupo de datos.

7) Es necesario usar una prueba estadística para seleccionar el modelo desustitución que posea un mayor ajuste a nuestros datos.

Page 37: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Modelos de sustitución

A <=> G

T <=> C

T

G

A

C

A

Page 38: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Existen dos aproximaciones para la construcción de modelosde sustitución:

1) Modelos empíricos = Calculados a partir de la comparación de numerosas alineaciones y que resultan en valores fijos de los parámetros de sustitución. Se utilizan principalmente para AA´s.(Matrices Dayhoff, BLOSUM,etc)

2) Modelos paramétricos = Se basan en el modelado de ciertaspropiedades químicas (AA´s) o composicionales, inferidos a partirde cada base de datos. Se utilizan principalmente para nucleótidosy codones (Uso diferencial de codones).

Ambos resultan en modelos de procesos Markovianos, definidos pormatrices que contienen tasas relativas de ocurrencia de todos lostipos de sustituciones.

Page 39: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Ambos métodos describen las tasas relativas, ocurrencia de todoslos tipos de cambio en el tiempo.

Se asume que esta matriz es reversible no existe direcciónen el tiempo evolutivo, árboles no enraizados, el proceso puede fluir en ambas direcciones.

Las sustituciones se describen como resultado de un proceso de mutaciónal azar, es decir, las mutaciones futuras ocurren al azar y sonindependientes del estado anterior, dependen únicamente del estado actual(proceso Markoviano).

La probabilidad de intercambio de un carácter (mutación) por otro está modelada por una distribución de Poisson.

Page 40: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Se manejan tres tipos de parámetros en el modelado del proceso de sustitución:

1)Frecuencia (proporción de cada nucleótido en la muestra)

2)Tasas de cambio (transiciones, transversiones, uso de codones)

1)Heterogeneidad en tasas de sustitución (entre posiciones,regiones codificantes VS no codificantes, etc) (Distribución gamma)

Page 41: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Los diferentes modelos se distinguen por algunos factores básicos:

1) Frecuencias de nucleótidos

= Frecuencia ΠA= ΠG =ΠT= ΠC (JC69, K2P,K3P..)

≠ Frecuencia ΠA ≠ ΠG ≠ ΠT ≠ ΠC (F81, HKY85, Tr93, GTR…)

2) Tasas de transición VS. transversión

ti/tv ≠ 0.5 existe un sesgo en algún tipo de sustituciones

Generalmente las transiciones son mayores a las transversiones.

Page 42: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Los diversos modelos de sustitución se distinguen por suparametrización:

1) Frecuencia nucleótidos= o ≠

2) Tasas de sustitución (ti/tv)

Tasa 1 Modelo Jukes-Cantor, 1969Tasa 2 Modelo Kimura-2, F84Tasa 3 Modelo TrN (2 ti, 1tv)Tasa 6 Modelo GTR (cada sustitución su tasa)

Page 43: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Rate matrix

Jukes-Cantor (JC) (Jukes-Cantor, 1969)

Equal base frequencies, all substitutions are equally likely.

Equal base frequencies

T C A G

T fN a a a

C a fN a a

A a a fN a

G a a a fN

Page 44: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Jukes-Cantor (un parámetro)

A G

C T

Page 45: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Equal base frequencies

Rate matrix

Kimura 2-parameters (K80) (Kimura, 1980)

Equal base frequencies, variable transition and transversion frequencies.

T C A G

T fN a b b

C a fN b b

A b b fN a

G b b a fN

Page 46: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Kimura-dos parámetros

A G

C T

Page 47: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Rate matrix

Variable base frequencies

Felsenstein (F81) (Felsenstein, 1981)

Variable base frequencies, all substitutions equally likely.

T C A G

T fT a a a

C a fC a a

A a a fA a

G a a a fG

Page 48: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Rate matrix

Variable base frequencies

Hasegawa-Kishino-Yano (HKY85) (Hasegawa,Kishino,Yano, 1985)

Variable base frequencies, variable transition and transversion frequencies.

T C A G

T fT a b b

C a fC b b

A b b fA a

G b b a fG

Page 49: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Rate matrix

Variable base frequencies

Tamura-Nei (TN93) (Tamura and Nei, 1993)

Distinguish between two different types of transition (A<=>G)is different to (C <=> T), equal transversion frequencies.

T C A G

T fT a b b

C a fC b b

A b b fA c

G b b c fG

Page 50: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Kimura 3-parameter (K3P)

Variable base frequencies, distinguish between two different types oftransvesions (A<=>T) is different to (G <=>C), equal transition frequencies.

Variable base frequencies

T C A G

T fN a b c

C a fN c b

A b c fN a

G c b a fN

Page 51: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

General Time Reversible (GTR) (Tavaré, 1986)

Variable base frequencies, symmetrical substituion matrix.

Variable base frequencies

Rate matrixGeneral Time Reversible

General Time Reversible

T C A G

T fT a b c

C a fC d e

A b d fA f

G c e f fG

Page 52: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Distribución gammaModela la heterogeneidad de tasas. Cada sitio posee una tasa tomadaaleatoriamente de esta distribución. α controla la forma de la distribución, arriba de 1 es forma de campana, lo que significa baja heterogeneidad en tasas, arriba de uno, parece una Ly refleja una gran heterogeneidad de tasas.

Page 53: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Modelos de substitución de codones

Durante la traducción se involucra el reconocimiento de tripletes o codones que comprenden el Código Genético Universal, de los 64 codones sabemos que tres de ellos son de término, por lo tanto tenemos 61 codones, lo que supone que algunos aminoácidos serán codificados por más de un codón.

Debido a la degeneración del código genético, existen tasas de sustitucióndiferenciales para los codones y por lo consiguiente para cada una de lasdiferentes posiciones.

Existen sustituciones sinónimas (que no cambian el tipo de aa)y no sinónimas que cambian el tipo de aa.

A T G

1a 2a 3a

dSdN

dN dSdN

Page 54: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

1*Base

Segunda base3*BaseU C A G

U

UUUPhe

UCUSer

UAUTyr

UGUCys

U

UUC UCC UAC UGC C

UUALeu

UCASer

UAAStop

UGA Stop A

UUG UCG UAG UGG Trp G

C

CUULeu

CCUPro

CAUHis

CGUArg

U

CUC CCC CAC CGC C

CUALeu

CCAPro

CAAGln

CGAArg

A

CUG CCG CAG CGG G

A

AUUIle

ACUThr

AAUAsn

AGUSer

U

AUC ACC AAC AGC C

AUA Ile ACAThr

AAALys

AGAArg

A

AUG Met ACG AAG AGG G

G

GUUVal

GCUAla

GAUAsp

GGUGly

U

GUC GCC GAC GGC C

GUAVal

GCAAla

GAAGlu

GGAGly

A

GUG GCG GAG GGG G

Page 55: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 56: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Modelos de substitución de aminoácidos

PAM matrices- Matriz que describe el cambio en tiempo evolutivodel 1% de los aminoácidos de una proteína.

Dayhoff matrices – Se llevo a cabo utilizando 34 superfamilias conocidasde proteínas cercanas entre sí y sus tasas de mutación.

BLOSSUM matrices – Utilizan comparaciones entre familias distantesde proteínas y sus valores de similitud.

Page 57: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

* La reconstrucción filogenética es un proceso de estimación de la topología y la longitud de las ramas.

* Los métodos de reconstrucción filogenética están basados endos estrategias diferentes:

1) Definición de un algoritmo que determina los pasos a seguir para la reconstrucción de la topología. (Combinan la inferencia de la topología con la mejor topología posible, esto los hace más rápidos)

2) Usando un criterio de optimización que permite decidir cuál de las topologías se ajusta más a nuestros datos. (En este caso topologíay su soporte están desacoplados, son más lentos)

Page 58: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Existen varios métodos de reconstrucción filogenética:

1)Distancia (Algoritmo)(sustituciones de caracteres)

2) Parsimonia (CO)(estados de carácter, sitios informativos)

3) Máxima verosimilitud (CO)(distribución de probabilidades)

4) Bayesianos (CO)

Page 59: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Dentro de estos mismos métodos los más utilizados históricamente han sido:

1)UPGMA (Parsimonia)

2) NJ (Vecino más cercano) (Distancia)

3) MP (Máxima Parsimonia) (Parsimonia)

4) ML (Máxima verosimilitud)

5)Bayesianos

Page 60: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Los métodos de distancia convierten primero la alineación enuna matriz de distancias.

Los más utilizados se basan en el criterio de mínima evolución(UPGMA y NJ).

Se apoya el árbol/topología cuya longitud total minimice las distancias entre los otus, a partir de una matriz de distancias pareadas.

Page 61: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Distancias ultramétricas

Usualmente se ajustan a un árbol bajo el supuesto de reloj molecular.

Son equidistantes a la raíz del árbol.

Las distancias son aditivas.

Para un par de secuencias el valor en la matriz corresponde a la suma de longitudes de ramas en el camino más corto que las une(dentro del árbol).En los métodos de evolución mínima se busca el árbol cuyalongitud de ramas sea mínima.

Page 62: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

UPGMA (Unweighted pair-group method with arithmetic mean)

(a)

A

B

A A

B BC C

D

dAB/2 d(AB)C/2 d(ABC)D/2

Tasas de cambio constantes, distancias aritméticas, escala las distancias,reloj molecular, distancias equidistantes, árbol enraizado, topología enraizadase obtiene las longitudes de rama simultáneamente a la topología.

Page 63: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

87

6

54

1

2

3

8

7

6

5

43

2

1

Neighbor-joinig method (vecino más cercano)

X X Y

Se escoge el que da la mínima suma de las distancias entre las ramas, minimizala longitud total del árbol, se obtiene un solo árbol,

Page 64: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Máxima Parsimonia (MP)

Busca el árbol que requiere el mínimo número de pasos evolutivos (árbol más parsimonioso)

Utiliza el concepto de sitios informativos, todos los demás sitios no son tomados en consideración para la reconstrucción de la topología.

Se apoya el árbol con mayor número de sitios informativos.

Para el caso de MP la situación se complica pues podemos reconstruir más de un árbol igualmente parsimonioso.

Page 65: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

1 2 3 4 51 A T A T T2 A T C G T3 G C A G T4 G C C G T

Este proceso se repite para otros árboles…….

Page 66: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

1

3 4

2 2

34

1

Page 67: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Unweighted ParsimonyTodas las sustituciones son iguales.

Weighted parsimonyHace diferencias entre transiciones y transversiones.

Page 68: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 69: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Métodos de búsqueda de árboles óptimos:

1) Exactos .- Garantizan la obtención de un solo árbol.

a) Búsqueda exhaustivab) Búsqueda branch-bound

2) Heurísticos (aproximados). – Encontrar soluciones óptimas.

a) Stepwise addition (adición secuencial)b) Branch swapping (intercambio de ramas)c) Star decomposition (descomposición a manera de estrella)

Page 70: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Atracción de ramas largas

Se refiere a situaciones en las que linajes con una tasas de cambio

muy diferente al promedio, muestran relaciones con otros linajes

a pesar de no ser cierto.

Una estrategia para reducir el efecto es agregar más outgroups a nuestra base de datos o secuencias que pudiesen romper estas

relaciones aparentes.

Page 71: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Métodos de Máxima verosimilitud (ML)

Requiere un modelo probabilístico de substitución de nucleótidos, es decir, necesitamos especificar la probabilidad de transición o cambio de un tipo de nucleótido a otro en un intervalo de tiempo para cada rama.

Page 72: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

P ( D | H)

Hipótesis (H):- árbol (topología)

- longitud de ramas- parámetros del modelo de

substitución

Datos (D):- secuencias de nucleótidos- secuencias de aminoácidos

Probabilidad de los datos dada una hipótesis

* Método paramétrico que utiliza explícitamente un modelo de sustitución.

* Utiliza la matriz original de los datos.

* CO para escoger entre árboles

Page 73: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

1 2 3 4i j k l

X

Y

Z

t1

t2

t3

X- nucleótido del nodo ancestral

La probabilidad de encontrar el nucleótido l en laSecuencia 4:

Pxl (t1+t2+t3) (tiempo total de X a l, entre los dos nodos)

La probabilidad de encontrar el nucleótido Y en el nodoAncestral de las secs 1, 2, 3 es

Pxy (t1)

Y así sucesivamente……

Page 74: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Por lo tanto, la probabildiad de tener i, j, k, l en las puntas del árbol se calcula:

Pxl (t1+t2+t3) Pxy (t1) Pyk (t2+t3) Pyz 8t2) Pzi (t3) Pzj (t3)

Sólo podemos asumir probabilidades porque en la práctica no conocemos el nucleótido ancestral real. Esta probabilidad se puede inferir a partir de la frecuenciadel nucleótido en la muestra real de las secuencias.

El cálculo de la función de verosimilitud para una secuencia se puede definir como:

nL = ni Prob (ni mi, t) i=1

La verosimilitud para una secuencia de DNAcon un número n de bases que posea la base mi en el sitio i y base ni en el mismo sitio de otra secuencia.

Page 75: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 76: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 77: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 78: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 79: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Validación estadística de las reconstrucciones filogenéticas

Existen numerosos métodos los más utilizados en la actualidad son:

1) Bootstrap

Page 80: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

BOOTSTRAPMétodo estadístico más utilizado.Se basa en el remuestreo de las secuencias, es decir, aleatoriamentecambia las posiciones de las bases y rehace la construcción filogenética.La medida de soporte estadístico se refiere a un intervalo de confianza de 0 a 100.

Supongamos que tenemos la sig. Secuencias:

AGTCGGTAAAGTGGGTAAATCTTGTAA

Si cambiamos la posición 7

TAGTCGGAATAGTGGGAATATCTTGAA(esta es una submuestra de la distribución original)

Page 81: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 82: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Bootstrapping - an example

Ciliate SSUrDNA - parsimony bootstrap

Ochromonas (1)

Symbiodinium (2)

Prorocentrum (3)

Euplotes (8)

Tetrahymena (9)

Loxodes (4)

Tracheloraphis (5)

Spirostomum (6)

Gruberia (7)

100

96

84

100

100

100

Page 83: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Inferencia Bayesiana

Page 84: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 85: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 86: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 87: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Teorema de Bayes

Población hipotética 1 2

60% 40% Población total

Tipo de enfermedad 1% 0.01%

Muestreo al azar de 100 individuos (incluyendo grupo I y II)

¿Cuál es la probabilidad que 3 de ellos estén enfermos?

Page 88: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

D (probabilidad) definida por:

P= P(D) = P(G1) * P(DI G1) +P(G2) * P(D IG2)

0.6*0.01 +0.4*0.001= 0.0064

Probabilidad de que un individuo esté enfermo

1- 0.0064= La probabilidad de no estar enfermo.

Page 89: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Probabilidada de que 3 de cada 100 estén enfermos:

P = 100! P3 (1-P)97 / 3!* 97! = 0.0227

BAYES

Lo realizamos de manera inversa

¿Cuál es la probabilidad de que un individuo de la muestra al azar

que se encuentre enfermo pertenezca al grupo I?

Page 90: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

PI G1I D I= P(G1)* P(DI G1)/P(D)

0.6*0.01/0.0064=0.94

(Esta es la probabilidad de que pertenezca al grupo I)

D - datos – topología de un árbolG1 – clase de sitio, probabilidad de transcición, etc)

Page 91: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 92: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

- cadenas markovianas de Monte Carlo- la probabilidad posterior de un árbol puede interpretarse como la probabilidad de que dicho árbol o clado sea correcto

- es imposible estimar dicha pP analíticamente ni siquiera para el caso más simple de 4 OTUs ( (2s - 3)!/2s - 2 (s - 2)! topologías y 2n-3 long. de rama, para arb. no enraiz.)

- existen métodos numéricos que permiten aproximar la probabilidad posterior de un árbol (o de cualquier otra hipótesis compleja). El más útil es el de las cadenas markovianas de Monte Carlo (MCMC), implementado en algoritmos como el de Metropolis-Hastings

- MCMC se basa en el muestreo de una distribución simulada en vez de calcular dicha distribución mediante integración. Así es posible aproximar el área bajo la curva que representa la distribución de densidad probabilística posterior para inferencias complejas

Page 93: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 94: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 95: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 96: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 97: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 98: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.
Page 99: Marcadores moleculares: más allá de la reconstrucción filogenética Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN AAAAAAAAAAAAAAA.

Impacto de la reconstrucción filogenética:

1)Cálculo de tiempos de divergencia

2)Selección natural

3)Evolución de la patogénesis

4)Determinación de tasas de sustitución molecular

5)Criminología