Modelado de interacciones proteína-ligando y...

67
Modelado de interacciones proteína-ligando y proteína-proteína Eduardo López Viñas FUNDAMENTOS DE BIOINFORMÁTICA ZARAGOZA, 7-11 de Mayo de 2012

Transcript of Modelado de interacciones proteína-ligando y...

Page 1: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Modelado de interacciones proteína-ligando

y proteína-proteína

Eduardo López Viñas

FUNDAMENTOS DE BIOINFORMÁTICA

ZARAGOZA,7-11 de Mayo de 2012

Page 2: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

La idea de función biológica es compleja.

Función biologica e interacciones moleculares

Procesos

- Control del ciclo celular

- Metabolismo s.s.

- Diferenciación

- Plegamiento de proteínas

- Señalización

- Trasnscripción

- Traducción

- Modificación post-trad.

- Transporte

BIOQUÍMICOS

CELULARES

MOLECULARES

1

2

3

4

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Proteínas

Page 3: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

La idea de función biológica es compleja.

Función biologica e interacciones moleculares

Procesos

- Control del ciclo celular

- Metabolismo s.s.

- Diferenciación

- Plegamiento de proteínas

- Señalización

- Trasnscripción

- Traducción

- Modificación post-trad.

- Transporte

BIOQUÍMICOS

CELULARES

MOLECULARES

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Proteínas

LMWm DNA/RNA

Lípidos – Polisacáridos – (…)

Page 4: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Métodologías de docking.

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Modelado y predicción de interacciones moleculares

+

Page 5: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- SIGNIFICADO: “Acoplamiento molecular” s.l.

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Modelado y predicción de interacciones moleculares

+

- Predicción teórica (in silico) de los complejos proteína-ligando a partir desus respectivas estructuras moleculares individuales.

- La estructura más probable del complejo vendría sugerida por lasorientaciones recíprocas en las que la energía de la interacción en elcomplejo es mínima.

- Métodologías de docking.

IMPORTANTE: integración información evolutiva y estructural.

Page 6: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Docking PROTEÍNA-LIGANDO

+

- APLICACIONES: modelado interacciones moleculares.- Construcción de modelos fundamentales de investigación en biol.mol.- Mejora de inhibidores.- Diseño de nuevos inhibidores (cribado virtual de quimiotecas).

- SIGNIFICADO: “Acoplamiento molecular” de estructuras de LWM PROTEÍNAS

- Métodologías de docking.

IMPORTANTE: integración información evolutiva y estructural.

Page 7: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Modelos estructurales de proteínas Rx/NMR (EXPERIMENTALES) Protein Data Bank

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Representación de la Proteína: métodos basados en grids.

Page 8: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Representación de la Proteína: métodos basados en grids.- Modelos estructurales de proteínas

- Rx/NMR (EXPERIMENTALES) Protein Data Bank? - Rx/NMR (EXPERIMENTALES) Protein Data Bank

Page 9: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Representación de la Proteína: métodos basados en grids.

- Representación RÍGIDA/FIJA.

Page 10: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Representación de la Proteína: métodos basados en grids.

- Representación RÍGIDA/FIJA.

Page 11: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Funciones de puntuación (scoring functions)

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Representación de la Proteína: métodos basados en grids.

- Representación RÍGIDA/FIJA.

∑=ij ij

ji

0elect r

qq4

1Eεπε

repulsive

atractive

∑ −=−ij

6ij

ij12ij

ijJonesLennard r

BrA

E

Page 12: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Funciones de puntuación (scoring functions)

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Representación de la Proteína: métodos basados en grids.

- Representación RÍGIDA/FIJA.

∑=ij ij

ji

0elect r

qq4

1Eεπε

repulsive

atractive

∑ −=−ij

6ij

ij12ij

ijJonesLennard r

BrA

E

Page 13: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Funciones de puntuación (scoring functions)

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Representación de la Proteína: métodos basados en grids.

- Representación RÍGIDA/FIJA.

Page 14: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

…7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Representación de la Proteína: métodos basados en grids.

- Funciones de puntuación (scoring functions)

- Representación RÍGIDA/FIJA.

- Una matriz para cada tipo de átomo presente en el ligando.

Page 15: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Modelos de moléculas de bajo peso molecular.

mn

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Representación del LIGANDO: flexibilidad

- Descripción precisa geometrías y cargas electrostáticas.

- Flexibilidad BÚSQUEDA CONFORMACIONAL.

- Montecarlo simulated annealing

- Algoritmos genéticos

- Montecarlo Replica Exchange

- (…)

- Métodos de búsqueda conformacional :

Page 16: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Modelos de moléculas de bajo peso molecular.

- Estrategia habitual: búsqueda restringida.

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Representación del LIGANDO: flexibilidad

- Descripción precisa geometrías y cargas electrostáticas.

- FLEXIBILIDAD Búsqueda conformacional.

Page 17: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Colección de modelos estructurales: Biotina vs. Estreptavidina

22.875 Å

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Docking proteína-ligando: RESULTADOS

Page 18: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Colección de modelos estructurales: XK-263 vs. Proteasa HIV-1

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Docking proteína-ligando: RESULTADOS

Page 19: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Energía de interacción (scoring function)

- RMSD

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Docking proteína-ligando: CLUSTERING

CASO“A”

CASO“B”

Page 20: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

FAMILIA CARNITINA/COLINA-ACIL-TRANSFERASAS (CCAT)

SCOP: Fold + Superfamily: “CoA-dependent acyl-transferases”

Subfamilias con diferentes propiedades funcionales: CrAT, COT, CPT1, CPT2 & ChAT

Choline acetyl-transferasesEC. 2.3.1.6

Carnitine acetyl-transferasesEC. 2.3.1.7

Carnitine palmitoyl-transferases IIEC. 2.3.1.24

Carnitine palmitoyl-transferases IEC. 2.3.1.24

Carnitine octanoyl-transferasesEC. 2.3.1.137

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 21: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

acil-CoA de cadena media

acil-CoA de cadena larga

acil-CoA de cadena corta

FAMILIA CARNITINA/COLINA-ACIL-TRANSFERASAS (CCAT)

SCOP: Fold + Superfamily: “CoA-dependent acyl-transferases”

Subfamilias con diferentes propiedades funcionales: CrAT, COT, CPT1, CPT2 & ChAT

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 22: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

DETERMINANTES ESTRUCTURALES de ESPECIFICIDAD en CCAT

CrATH343 carnitina

acetil-CoA

H12

E1E14 E13

COT

decanoíl-CoA

carnitinaH327

H12

E1E14 E13

CPT1

Page 23: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Modelado de centros activos, sitios alostéricos, etc.- Construcción de nuevas hipótesis: desarrollo dirigido de fármacos.- Ingeniería de proteínas.

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

APLICACIÓN II: GENERACIÓN DE MODELOS BÁSICOS en BM

acetil-CoA

H343

M564

CrAT wt

miristoíl-CoA

H343

G564

CrAT M564G

Page 24: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

IMM

OMM

malonyl-CoA

acyl-CoA + carnitine

CPT2CACT

Ct

Nt3x

CPT1 INHIBITION BY MALONYL-CoA

CPT1

acyl-CoA + carnitine

acyl-carnitine + CoA

acyl-L-carnitine + CoA

β-oxidation

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 25: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Modelado: Swiss-Model

agrupamientospo

blac

ión

ener

gía

de d

ocki

ng

N=100

RMSD.clus.tol.=1.0Å

Docking C16:0-CoA: AutodockPalmitoíl-CoA [C16:0]

Calidad estructural: ProSA-web

MOPAC: optim. & cargasMod. sobre estruct. real CoA

DETERMINANTES ESTRUCTURALES de ESPECIFICIDAD en CCAT

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 26: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Modelado: Swiss-Model

Docking C16:0-CoA: Autodock

agrupamientospo

blac

ión

ener

gía

de d

ocki

ng

N=100; RMSD.clus.tol.=1.0Å

H12

B14

Palmitoíl-CoA

Carnitina

H473

V481

G482

G711

V488M489

A490

V706

G710G709

W485

Calidad estructural: ProSA-web

Palmitoíl-CoA [C16:0]

MOPAC: optim. & cargasMod. sobre estruct. real CoA

DETERMINANTES ESTRUCTURALES de ESPECIFICIDAD en CCAT

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 27: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

SB DRUG DISCOVERYVirtual HT Combinatorial Screening for lead optimization

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 28: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

cribadovirtual

SO

O

Br

NH2

O

NC

N

S

O OH

CH3

CH3

O

NH2

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

APLICACIÓN I: VIRTUAL SCREENING

Page 29: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

“A SMILES string is a way to represent a molecular graph as a 1D string”

SB DRUG DISCOVERYVirtual HT Combinatorial Screening for lead optimization

- Simple approach based on enumeration of SMILES substructures (1D)- Structure based VS of combinatorial libraries.

Enumeration of combinatorial libraries

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 30: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Structure based VS of combinatorial libraries.- C8-substituted GTP derivatives

(Lappchen et al., 2005)

SB DRUG DISCOVERYVirtual HT Combinatorial Screening for lead optimization

Enumeration of combinatorial libraries

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 31: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Simple approach based on enumerationof SMILES substructures (1D)

O=P(O)(O)OP(=O)(O)OP(=O)(O)OC[C@@H]1O[C@H]([C@@H]([C@@H]1O)O)n1cnc(X)2c(=O)[nH]c(N)nc12

X

SB DRUG DISCOVERYVirtual HT Combinatorial Screening for lead optimization

- Structure based VS of combinatorial libraries.- C8-substituted GTP derivatives

(Lappchen et al., 2005)

Enumeration of combinatorial libraries

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 32: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

O[P@@](=O)(O)OC[C@H]1O[C@H]([C@@H]([C@@H]1O)O)n1cnc2c(=O)[nH]c(N)nc12

SB DRUG DISCOVERYVirtual HT Combinatorial Screening for lead optimization

- Simple approach based on enumerationof SMILES substructures (1D)

- Structure based VS of combinatorial libraries.Enumeration of combinatorial libraries

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 33: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

O[P@](=O)(O(R1))OC[C@@H]1O[C@H]([C@@H]([C@@H]1O(R2))O(R3))n1c(R4)nc2c(=O)[nH]c(N)nc12

R1

R2

R3

R4

SB DRUG DISCOVERYVirtual HT Combinatorial Screening for lead optimization

- Simple approach based on enumerationof SMILES substructures (1D)

- Structure based VS of combinatorial libraries.Enumeration of combinatorial libraries

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 34: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Practical testing strategy: GMP analogues scaffolds- LINKERS- BUILDING BLOCKS

SB DRUG DISCOVERYVirtual HT Combinatorial Screening for lead optimization

- Simple approach based on enumeration of SMILES substructures (1D)Enumeration of combinatorial libraries

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 35: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Lead Improvement based on combinatorial libraries.- Integrating virtual screening in lead discovery

- Practical testing strategy: GMP analogues scaffolds- LINKERS: L1, L2, …- BUILDING BLOCKS: BB1, BB2, …

SB DRUG DISCOVERYVirtual HT Combinatorial Screening for lead optimization

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 36: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Lead Improvement based on combinatorial libraries.- Integrating virtual screening in lead discovery

?

- Practical testing strategy: GMP analogues scaffolds- LINKERS: L1, L2, …- BUILDING BLOCKS: BB1, BB2, …

SB DRUG DISCOVERYVirtual HT Combinatorial Screening for lead optimization

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 37: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

DESIGN AND IMPROVING OF CPT1’s INHIBITORS

BUILDING OF COMBINATORIAL LIBRARIES

Precomputed libraries (geom. & charges OK)

Predefined sets of combinatorial rules.

( … )

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 38: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

DESIGN AND IMPROVING OF CPT1’s INHIBITORS

BUILDING OF COMBINATORIAL LIBRARIES

I.e. CARNITINE OH- function replacement.

( … )

+

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 39: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Haloalkane derivatives

outgoing group

Complex-alkane derivatives

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 40: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

SB DRUG DISCOVERYVirtual HT Combinatorial Screening for lead optimization

Fine structural model ofreceptor binding interfaceby molecular dynamics

A collection of putative newantibacterial compounds based on

the structure of the receptor

Affinity, safety, pharmacokinetics, and

ADME

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 41: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

- Predicción in silico de los complejos estructurales proteína-proteína a partirde sus respectivas estructuras moleculares individuales.

- Las orientaciones recíprocas que minimizan la energía de la interacciónsugieren la estructura más probable del complejo.

- Búsqueda conformacional.

DOCKING proteína-proteína.

-RESTRICCIONES NECESARIAS.

- Integración + Extracción de información estructural y evolutiva.

mn

r

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 42: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Interfaces proteína:proteína: descripción general de los sitios de unión

-Las interfaces proteína:proteína tiene lugar entre residuos de dos cadenas polipeptídicas.

- Un criterio de contacto: ej. di,j ≤ vdW radii + 0.5 Å

- Un criterio de proximidad: dCα-Cα(i,j) < 6.0 ÅInteractions

Interface scaffold

- Ejemplo: Granzyme B (Homodímero).

· Cadena A :

· Cadena B:

- Contacto : 9

- Contacto : 14

- Proximidad : 20

- Proximidad : 14

Interacciones proteína:proteína

Puntos “Calientes”

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 43: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Interacciones proteína:proteína in silico

(All: R=0.90)

Interfaces proteína:proteína: descripción general de los sitios de unión

- Un buen punto de partida para describir las interfases de interacción es tomar como base la existencia de “puntos

calientes”.

- Los residuos que integran dichas regiones contribuyen a una fracción grande la energía de binding (estudios de

mutagénesis alanine-scanning).

Algunos de los residuos que integran las

interfases se encuentran conservados tanto en

secuencia como en estructura.

Conservation score threshold value ≥ 0.5

Las matrices tipo Blossum, etc., capturan gran parte de esta relación, de ahí su importancia en él establecimiento de relaciones de homología de secuencia.

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 44: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Interfaces proteína:proteína: descripción general de los sitios de unión

El número de “puntos calientes” aumenta a

medida que aumenta el tamaño de las interfases.

Interacciones proteína:proteína in silico

A medida que la superficie de contacto se hace mayor, es lógico que la estabilidad de la unión requiera por término medio que el número de contribuciones parciales aumente en dicha medida.

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 45: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Interfaces proteína:proteína: descripción general de los sitios de unión

Interacciones proteína:proteína in silico

A

C

B

El hecho de que el número de puntos calientes aumente con el tamaño de las interfases, pero no la superficie expuesta (ASA), sugiere que los puntos calientes se tienden a estar enterrados en bolsillos superficiales de las proteínas.

Los puntos calientes están menos expuestos en

las interfases de contacto.

A : Proteínas accesorias (Proteínas de cápside viral,complejos rotos)

B : Enzimas (ligasas, proteasas o sintasas)

C : Proteínas de transporte de metales, proteínas reguladoras de complejos enzimáticos, complejos enzima/péptidos, proteínas fotosintéticas, proteínas de membrana.

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 46: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Interfaces proteína:proteína: descripción general de los sitios de unión

Interacciones proteína:proteína in silico

Hot spots residues

All interfaceresidues

El hecho de que las zonas importantes tiendan a estar constituidas por motivos altamente empaquetados es consistente con la propuesta clásica de considerar procesos similares las interacciones proteína-proteína y el plegamiento individual de proteínas.

Las regiones densamente empaquetadas son menos móviles, lo que podría favorecer el binding tras la interacción favorable teniendo en cuenta la menor penalización entrópica en el paso desde su forma no unida a la unida.

El empaquetamiento de residuos alrededor de

los puntos calientes es mayor que en el resto de

la interfaz.

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 47: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Interfaces proteína:proteína: descripción general de los sitios de unión

Interacciones proteína:proteína in silico

El perfil de conservación de los puntos calientes no es uniforme, sino que se encuentran rodeados por residuos moderadamente conservados en la interfaz; todos ellos se agrupan a su vez en “regiones calientes”.

Las “regiones calientes” resultan del empaquetamiento denso de “puntos calientes” junto con una serie de residuos adicionales en distinto grado de conservación.

Los puntos calientes no están distribuidos

uniformemente en las interfaces, sino que se

agrupan en varias “regiones calientes”

dependiendo del tamaño de la interfaz.

Los “puntos calientes”pueden considerarse

como dispositivos de acoplamiento molecular

dirigidos por gradientes de potencial en las

interacciones proteína-proteína.

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 48: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

\hex /heks/ v. & n. US { v. 1. practise witchcraft. 2. bewitch. { n. 1. a magic spell. 2. a witch. [GK hex six]." (The ConciseOxford Dictionary).

-Computational method of docking pairs of proteins by using spherical polar Fourier correlations.

- Accelerate the search for candidate low-energy conformations.

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 49: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Special functions of the spherical coordinates: r(θ, φ)

Standing waves on a sphere.

Characterised by two quantum numbers: L and M. number and spatial arrangement of nodes in each function.

In general, there are 2L+1 allowed values of M for a given L. Adding another row and column to the image would give 7 functions with L=3, etc.

Protein surface representation by spherical harmonics

Y(L=0,M=0)

Y(L=2,M=0) To use spherical harmonics to represent molecular surface shapes, we need tokeep going up to about L=25, or higher...

L=14

HEX: alm coefficient estimation method sampling schemebased on an icosahedral tesselation of the unit sphere.

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 50: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

So can spherical harmonics be used to calculate how a pair of proteins might fit together, or "dock"?

Interaction at atomic level high degree of surface complementarity :

PREDICT FEASIBLE BINDING ORIENTATION MODELS

Protein docking using spherical harmonics

antibody HyHel-5 (left) vs. lysozyme antigen (right); d=5Å

- small degree of conformational change: domain displacement and sidechains orientations

- solvation

- availability of at least some information about the binding site(s): other methods.

Rigid-body docking limits

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 51: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Docking using Polar Fourier correlation with Hex

Double skin model: enhancing the harmonic surface representation

Special orthogonal radial functions: 3D density functions

- tau (τ) :exterior; volume bounded by the molecular surfaceand the solvent-accessible surface

-sigma (σ) :interior; van der Waals volumes of all atoms justinside the molecular surface

τ

σ

Protein representation based on 2 vectors of expansioncoefficients on the Polar Fourier space.

Exploring the conformational space: 6-D docking search using tessellated icosahedra

For localized search:

- known binding site on protein A- assumed to be centered on the z-axis,

correlation only for orientations where (β1|| β2) ≤ βA.

The angular coordinates of each tessellation vertex providemolecular rotational increments (β, γ).

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 52: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Strategy to find good docking orientations

RECIPROCALLY MAXIMIZE the degree of overlap between the surface skinof one protein with the interior density of the other.

Scoring Function

- steric clashes can be penalised by subtracting an interior-interior overlap term from the scoring function.

- expression for the volume of solvent expelled from theprotein surfaces upon association (kind of first-orderapproximation to the hydrophobic free energy of association.)

Docking using Polar Fourier correlation with Hex (II)

- rigorous but “soft” model of electrostatic complementarity based on the OPLS forcefield.

BASIC: steric complementarity

ENHANCED: electrostatic complementarity

- search over all six rigid-body degrees of freedom- performed by rotating and translating only the initial expansion coefficients- rapid elimination of many infeasible orientations using only low-resolution

terms- correlations easily localized around known binding epitopes when this

knowledge is available.- FAST!!!

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 53: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 54: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

malonyl-CoA

C-TER

malonyl-CoAA-SITE

Protein-Protein docking: Hex.

N-TER

Ligand-Protein docking: Autodock 3.0Cluster tol. (rmsd) = 1.0Å

cluster

popu

latio

n

dock

ing

ener

gy

docked conformation

MODEL of INTERACTION BETWEEN CATALYTIC & REGULATORY DOMAINS

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas

Page 55: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

90º

Glu26

Single mutants

Wild type “Swap” mutan

E26

K561

malonyl-CoA

Wild type

MODEL of INTERACTION BETWEEN CATALYTIC & REGULATORY DOMAINS

K561 and E26 are fully conserved in all CPT1 enzymes

Page 56: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

90º

Glu26

Single mutants

Wild type “Swap” mutant

E26

K561

malonyl-CoA

Wild type

K561 and E26 are fully conserved in all CPT1 enzymes

MODEL of INTERACTION BETWEEN CATALYTIC & REGULATORY DOMAINS

Page 57: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

WHAT THESE METHODOGIES ARE USEFUL FOR… AND WHAT FOR NOT.

… and if we take them to the limit …

Modeling of UNKNOWN structures by hypothetically remote structuralsimilarity (i.e. CPT1 N-terminaldomain) (risky!)

Prediction of quaternary contacts.

Prediction of new binding sites.

Page 58: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

WHAT THESE METHODOGIES ARE USEFUL FOR… AND WHAT FOR NOT.

Structural comparative modeling ofclosely related proteins.

Phylogenetic analyses of proteinfamilies.

Search for evolutionary and structuralmotives related to functionalcharacteristics. In CCAT:

• Common hydrophobic pocket.

• CrAT M564 vs. COT G553 (rat)

• CrAT D356

• Common binding regions of structurally related inhibitors (i.e. carnitine+acylgroups locus in C75-CoA bound to CPT1 models, and others).

• etc.

Making up one’s mind about the EVOLUTIONARY basis of functionaldifferences.

CPT1A

H473C75-CoA

Carnitine

(best 7 docking solutions)

Page 59: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

o Model accurately active centers and bindingsites in terms of precise atomic interactions.

o Estimate energetic parameters in protein-ligand and protein-protein interactions.

o Explain certain functional differences that fallbeyond sequence analysis and comparativemodeling capabilities (i.e. M593 mutants)

o Estimate dynamic properties of molecularstructures and activities (i.e. conformationalchanges/differences upon ligands’ binding).

o VS (virtual screening or in silico HTS).

o In silico improvement of known lead compounds.

WHAT THESE METHODOGIES ARE USEFUL FOR…

… AND WHAT FOR NOT …

Page 60: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

o Model accurately active centers and bindingsites in terms of precise atomic interactions.

o Estimate energetic parameters in protein-ligand and protein-protein interactions.

o Explain certain functional differences that fallbeyond sequence analysis and comparativemodeling capabilities (i.e. M593 mutants)

o Estimate dynamic properties of molecularstructures and activities (i.e. conformationalchanges/differences upon ligands’ binding).

o VS (virtual screening or in silico HTS).

o In silico improvement of known lead compounds.

WHAT THESE METHODOGIES ARE USEFUL FOR…

… nevertheless …

Page 61: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

o Model accurately active centers and bindingsites in terms of precise atomic interactions.

o Estimate energetic parameters in protein-ligand and protein-protein interactions.

o Explain certain functional differences that fallbeyond sequence analysis and comparativemodeling capabilities (i.e. M593 mutants)

o Estimate dynamic properties of molecularstructures and activities (i.e. conformationalchanges/differences upon ligands’ binding).

o VS (virtual screening or in silico HTS).

o In silico improvement of known lead compounds.

WHAT THESE METHODOGIES ARE USEFUL FOR…

… MOLECULAR DYNAMICS CAN HELP!

Page 62: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

MOLECULAR DYNAMICS CAN HELP!

( )20bbonds

bonds bbk21E −= ∑

( )[ ]∑ −+=dihedrals

0ddihedral cos1k21E θθ

( )∑ −=angles

20angle k

21E θθθ

MOLECULAR MECHANICS: representation of POTENTIAL ENERGY of asystem in a certain state.

• bonding terms

Page 63: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

MOLECULAR DYNAMICS CAN HELP!

∑=ij ij

ji

0elect r

qq4

1Eεπε

repulsive

atractive

∑ −=−ij

6ij

ij12ij

ijJonesLennard r

BrA

E

MOLECULAR MECHANICS: representation of POTENTIAL ENERGY of asystem in a certain state.

• non-bonding terms

Page 64: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

• Newton:dtvdmF i

ij

ij

rr=∑ ij

ij

ijij r

rF ˆ

∂∂

−=φr

• Updated Position:( ) ( )

i

iiii m

tFttvttrttr )(21)()()( 2

rrrr

Δ+Δ+=Δ+

• Updated Velocity:

( )i

iii m

tFttvttv )(21)(

2

rrr

Δ+=⎟⎠⎞

⎜⎝⎛ Δ+ ( )

i

iii m

ttFtttvttv )(21

2)( Δ+

Δ+⎟⎠⎞

⎜⎝⎛ Δ+=Δ+

rr

• System Temperature:

TNkmv B

N

ii 2

321

1

2 =∑=

∑=

=N

iii

B

vmNk

T1

2

31

system kinetic energy

equipartitiontheorem

Fij

vi

i

(t)

Fij

vi

(t + Dt)

j

i

MOLECULAR DYNAMICS CAN HELP!

MOLECULAR DYNAMICS: yields numeric solutions of Newton’s equationfor movement.

Page 65: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

MOLECULAR DYNAMICS CAN HELP!

Page 66: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

MOLECULAR DYNAMICS CAN HELP!

REQUIRES high quality structures, and setting up the system:• Replacements (commonly MSE)• Sidechains reconstruction• Protonation states (HIS, HID,

HIE)• Electrostatic neutrality• Periodic Boundary Conditions.• Solvent model

• Explícit• Implicit (i.e. GB)

• Constraints• Other simulation conditions.

MOLECULAR DYNAMICS: yields numeric solutions of Newton’s equationfor movement.

Page 67: Modelado de interacciones proteína-ligando y proteína-proteínabioweb.cbm.uam.es/courses/MasterVirol2013/interact/... · - SIGNIFICADO: “Acoplamiento molecular” s.l. 7 - 11

Preguntas…

7 - 11 de Mayo de 2012. CITA-DGA Zaragoza Eduardo López Viñas