ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

24
I)in<unica cstructuraI de macromolecules (Lluis Cornudella, ed.) I reballs de Ia SCB. Vol. 48 (1998) 49-72 ENGINYERIA DE PROTEINES: COMPLEMENTARIETAT DE LES APROXIMACIONS EXPERIMENTALS I COMPUTACIONALS EN EL DISSENY DE PROTEINES F'. Qt iROL, J. A. Pi lu t-PONS, V. VILLIGiAS, F. CANALS, 13. OLIVA, J. Vi N1)inii i F. X. Avit.t1s /n.ctitut de Biologia Fonamental i Departarnent do Bioquimica i Biologia Molecular. Universitat Autonoma de Barcelona. 08193 Bellaterra. SUMMARY Protein engineering originated in the development of site directed mutagenesis and het- erologous expression methods that allow to incorporate different amino acid residues into a protein, in a conservative or even non-conservative fashion. The redesigned or new pro- teins are used for structure/ function analysis and for biotechnological purposes. It is a fas- cinating mixture of genetic engineering, protein chemistry, biophysics, biocomputation and several other biochemical and molecular biology approaches. Straddling so many disci- plines, it nevertheless has a form and style of its own. In this chapter both the methodology and some selected examples are described. RESUM Els origens de I'enginyeria de proteines es troben en el desenvolupament dels methoes de mutagenesi dirigida i d'expressio heterologa. Aquestes metodologies ens permeten in- corporar diferents aminoacids en una proteina, de forma conservada o no conservada. La proteina redissenyada o nova serveix per a estudis d'estructura/funcio i per a objectius bio- tecnologics. Es tracta d'una mescla fascinant d'enginyeria genetica, quimica de proteines, biofisica, biocomputaci6 i altres aproximacions bioquimiques i de Biologia molecular. Tot i que hi ha tantes disciplines, l'enginyeria de proteines to una estructura i un estil propis. En aquest capitol es presenten la metodologia i alguns exemples seleccionats.

Transcript of ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

Page 1: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

I)in<unica cstructuraI de macromolecules

(Lluis Cornudella, ed.)

I reballs de Ia SCB. Vol. 48 (1998) 49-72

ENGINYERIA DE PROTEINES: COMPLEMENTARIETAT DE LESAPROXIMACIONS EXPERIMENTALS I COMPUTACIONALS EN ELDISSENY DE PROTEINES

F'. Qt iROL, J. A. Pi lu t-PONS, V. VILLIGiAS, F. CANALS, 13. OLIVA, J. Vi N1)inii i F. X. Avit.t1s

/n.ctitut de Biologia Fonamental i Departarnent do Bioquimica i Biologia Molecular.Universitat Autonoma de Barcelona. 08193 Bellaterra.

SUMMARY

Protein engineering originated in the development of site directed mutagenesis and het-erologous expression methods that allow to incorporate different amino acid residues into aprotein, in a conservative or even non-conservative fashion. The redesigned or new pro-teins are used for structure/ function analysis and for biotechnological purposes. It is a fas-cinating mixture of genetic engineering, protein chemistry, biophysics, biocomputation andseveral other biochemical and molecular biology approaches. Straddling so many disci-plines, it nevertheless has a form and style of its own. In this chapter both the methodologyand some selected examples are described.

RESUM

Els origens de I'enginyeria de proteines es troben en el desenvolupament dels methoesde mutagenesi dirigida i d'expressio heterologa. Aquestes metodologies ens permeten in-corporar diferents aminoacids en una proteina, de forma conservada o no conservada. Laproteina redissenyada o nova serveix per a estudis d'estructura/funcio i per a objectius bio-tecnologics. Es tracta d'una mescla fascinant d'enginyeria genetica, quimica de proteines,biofisica, biocomputaci6 i altres aproximacions bioquimiques i de Biologia molecular. Tot ique hi ha tantes disciplines, l'enginyeria de proteines to una estructura i un estil propis. Enaquest capitol es presenten la metodologia i alguns exemples seleccionats.

Page 2: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

'o l- ((/I0)1 / I I I llll (, 1^, I (JA.!1.ti. It Ulli I,./ 17// \ JI ///-:,1

INTRODUCCIO

L'enginyeria de proteines (EP) es el con-

junt de les tOcniques que permeten el redis-

seny d'una proteina actual o el dissenv d'u-

na proteina nova a partir del seu gen

mitjancant tecniques de DNA recombinant.

Es podria incloure dins d'aquesta definici6

la construcci6 de proteines mitjancant sinte-

si quimica. L'enginyeria de proteines neix

els anys vuitanta amb l'aparici6 de la tecni-

ca de la mutagOnesi dirigida per oligonu-

cleotid, tOcnica creada per Zoller i Smith. A

causa que el coneixement de les /leis que

determinen corn una sequencia d'aminoa-

cids determina una estructura tridimensio-

nal i una funci6 es insuficient, el procOs de

redisseny proteic habitualment es fa de for-

ma iterativa, seguint 1'anomenat ,cicle de

('enginyeria de proteines» . La figura I mos-

tra aquest cicle de forma simplificada. L'in-

vestigador inicia el cicle amb I'aillament

d'un gen corresponent a la proteina que vol

redissenyar (o produir) i amb el maxim

nombre possible de coneixements estructu-

rals previs sobre la proteina. Hi ha diferents

nivells de complexitat i aplicaci6 de /'engin-

yeria de proteines. En aquest capitol hem

escollit tres casos (i tres estrategies) per

exemplificar-los, d'acord amb el nivell de

coneixements estructurals previs de clue es

parteix.

Un dels primers passos que s'han de for

es decidir quina regi6 i quins aminoacids

cal mutar i per quins altres s'han de mu-

tar. Aquest es el primer punt feble que fa

que aquest proces no sigui, en sentit estric-

te, una veritable enginyeria per motiu de

l'abans esmentada insuficiOncia de conei-

xement. Precisament un dels principals ob-

jectius de ('enginyeria de proteines es mi-

Ilorar aquest coneixement. El que a la

practica es fa es establir hipotesis per pro-

var d'acord amb una sOrie de criteris basics,

alguns dels quals es descriuran mes enda-

Maxim coneixement de I'estructura de laproteina , donatge i segiienciacio del gen

Decidir el reemplacament de I'aa

Mutagenesidirigida Cicle de

1'enginyeriade

proteines

Analisisestructuralsi funcionals

Expressio de Purificaci6 de lagen mutat proteina mutant

hlc1 RA I . Cicle de I'enginycria de proteines

vant. Una vegada decidit el mutant es crea

mitjancant qualsevol dels procediments ex-

perimentals que es descriuen mes enda-

vant.

A continuaci6 es tracta d'expressar, si es

pot, el gen mutant o nou (normalment tot el

procOs s'intenta for inicialment on E. colt pel

coneixement del sistema i la facilitat de ma-

nipulaci6). S'ailla i es purifica la proteina

mutant i es caracteritza (activitat biologica,

conformacio i cami del plegament, etc.). Si la

proteina no es expressada be en E. coli, cal

fer servir altres organismes hoste, com Ile-

vats (Reverter et al., 1998), baculovirus o cul-

tius de cel•lules animals, entre d'altres (ve-

geu llibre Cleland i Craik a la bibliografia).

A partir de les lades obtingudes sobre els

mutants inicials es fan noves hipotesis i es

dissenven nous mutants, i s'entra aixi de

nou en el cicle. La gran quantitat de tecni-

ques i especialitats necessaries (DNA re-

combinant, enzimologia, microbiologia, di-

verses espectroscopies, etc.) fan de l'engin-

veria de proteines una de les arees, de

recerca mes interdisciplinaries que existei-

xen.

Page 3: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

L\(;l.AIJ?I Idl:l'ROll:l\I' /

Objectius de l'enginyeria de proteiines

En EP es molt dificil de separar els aspec-

tes de coneixement basic i els de coneixement

aplicat. Entre els objectius basics habituals es

poden considerar els seguents: determinar el

paper estructural o funcional d'un residu (o

diversos), determinar la seva contribucio

energetica en interaccions , analitzar el proces

i I'energetica del plegament, trobar els deter-

minants de la funcionalitat , dissenyar va-

riants funcionals, etc. Serien objectius apli-

cats, biotecnologics: estabilitzar una proteina

davant d ' altes temperatures , o d'un medi no

fisiologic, o de condicions oxidants; modifi-

car el seu pH optim, o I'activitat o l'especifici-

tat; minimitzarestructures mantenint la seva

funcio, etc. Tanmateix, I'EPesta molt relacio-

nada amb el disseny de Iligands a protemes i,

per tant, amb el dissent' de farmacs. Final-

ment, es obvi que un objectiu molt important,

pero encara futur, es el disseny de protemes

completament noves amb estructures i fun-

cions diferents de les actuals.

Alguns criteris o <<regles>> basics generals

en EP

A I'hora de prendre una decisio sobre on i

quin reemplacament cal fer , l'investigador

pot elegir entre dues estrategies : crear un

mutant de pertorbacio o un mutant de con-

servaci6 . Aixo vol dir un mutant que alteri

drasticamentobequeconservi l'estructurao

la funci6 de la protema. Com a regla general,

al comencament dels estudis amb una pro-

tema se Bolen fer mutants que conserven les

estructures ( p.e., substituir un residu per un

altre amb propensio pel mateix tipus d'es-

tructura secundaria o (Yexposicib al dissol-

vent) i que pertorben la funci6 ( p.e., substi-

tuint un residu per un altre de diferent

caracter quimic). De totes maneres, una de

les llicons dels milers de mutants fets en pro-

te'fnes es que aquestes son molt mes capaces

de suportar mutacions sense efectes massadeleteris del que abans es creia. Per exemple,s'han produ'it mes de 1.700 diferents mutants

artificials de 1'enzim lisozim i la major part

son protemes mes o menys estables pero ex-

pressablesa la cel-lula hoste (cosaque indica-

ria que es pleguen mes o menys be).

En tot cas , alguns dels criteris o ,regles»

basics generals que es poden donar per re-

dissenyar una protema son els seguents:

- En EP hi ha poques regles generals.

- Les protemes toleren mes be els reem-

placaments en els arcs (loops) que en altres

estructures , tant les mutacions substituto-

ries com les insercions i delecions.

- No es convenient desestabilitzar les es-tructures secundaries regulars.

- Conve fer reemplacaments isosterics.

No conve modificar el volum dels aminoa-

cids, especialment els del nucli hidrofobic de

la protein . Si s'ha de fer, millor fer us d'un

aminoacid de volum mes petitque a I' inreves.

- Els canvis de carrega o polaritat solenser mes pertorbadors i dificils d'acceptarque els que les mantenen.

- Les regions invariants (molt conserva-des) compartides per prote"ines homologuesen un alineament son importants per a laconformacio, el plegament o la funcio. Laseva modificacio Os delicada. Les regionsmes variables de l'alineament solen corres-pondre a regions externes, molt soviet arcs.

Alguns dels reemplacaments mes em-prats, que trobem reiteradament a la litera-

ture, son:

- Per valorar el paper de la carrega negati-

va, per exemple la participacio en processos

acid-base o en una interaccio electrostatica:

Asp, ^ Asn

Glu' <Gln

- Per determinar el paper d'un grup tiol:

Cys ' Ser, Ala

Page 4: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

_' / (1(Lk0/. /I I Ij/LL(' IS/ (.1\ 11S.8 0//II../ 11 \/)/?/// //' \ II///.S

Per determinar el paper d'un grup hi-

droxil o fenol:

Ser, Thr -' AlaTyr -* Phe

Per determinar el paper d'un grup imi-

dazol:

His -' Gln, Asn

Per analitzar el paper del grup R de qual-

sevol residu:

aminoacid ' Ala

L'aminoacid Ala es pot considerar un

veritable comodi des del punt de vista es-

tructural, ja que no sol pertorbar 1'estructu-

ra secundaria ni la polaritat de la regio de la

proteina en que s'introdueix. De fet existeix

una estrategia que es I'escombrat d'alanines

(Alanine scanning) per un rastreig sistematic,

un per un, de tots els aminoacids d'una re-

gio d'una proteina per valorar el seu paper

estructural/ funcional.

El proces pet qual un aminoacid se subs-

titueix pets altres dinou repel nom de muta-

genesi de saturacio.Finalment, corn a criteri general, cal dir

que hi ha casos en que el reemplacament ne-

cessari pot ser identificable de forma facil

(p.e., ]'acid general d'un centre actiu, si

aquest centre es coneix), mentre que en d'al-

tres es molt dificil de predir el lloc i per quin

aminoacid cal substituir-lo, sobretot quan hi

ha contribucions multiples (p.e., per termo-

estabilitzar una proteina o per canviar la

seva especificitat).

LA MUTAGENESI DIRIGIDA

La mutagenesi dirigida es la modificacio

del DNA per introduccio d'una mutacio es-

pecifica (un o mes nucleotids) en un punt

concret de la seva sequencia. Existeixen di-

versos procediments per introduir muta-

cions selectives at DNA, entre els quals des-

criurem aqui tres dels rues utilitzats (figura

2). En tots els casos, la mutagenesi dirigida

requereix la sintesi previa d'un petit oligo-

nucleotid (generalment 15-20 nucleotids)

complementari de la sequencia on es vol in-

troduir la mutacio, pero que presenta un de-

saparellament, precisament a la base (o ba-

ses) que es vol canviar.

El primer procediment, que van descriu-

re Zoller i Smith (com a revisio vegeu Smith,

1985), es basa en el clonatge del DNA que es

vol mutar dins del bacteriofag M13, que ens

permet tenir el DNA en forma de monoca-

dena o de doble cadena (forma replicativa).

Aquest DNA monocadena s'hibrida amb

l'oligonucleotid mutagenic, que actua com a

encebador de la DNA polimerasa Klenow.

Amb una DNA lligasa, tat coin la T4 DNA

lligasa, lligarem 1'extrem 3' del DNA sinte-

titzat amb I'extrem 5' de l'oligonucleotid, i

obtindrem un DNA de doble cadena circular,

covalent i tancat (figura 2A). La introduccio

d'aquest DNA a ]'interior d'E. coli originara

dues poblacions de bacteris, una infectada

amb el genorna del bacteriofag que conte la

sequencia silvestre i una altra infectada amb

el genoma del bacteri6fag que conte la

sequencia mutada. Encara que ambdues

sequencies es poden distingir per hibridacio

amb cl mateix oligonucleotid que havia es-

tat utilitzat per a la mutagenesi (marcal ra-

dioactivament) i per la diferent temperatura

de fusio (Tm), en general aquesta distincio

es fa per sequenciacio de diversos dons. El

(ligament del fragment mutat a un vector

d'expressio i la posterior introduccio en un

hoste adient permeten obtenir la proteina

mutant.

El rendiment en formes mutants del me-

tode basic es unicament del 0,5`%, dels dons.

A causa d'aixo, a partir d'aquest metode ini-

Page 5: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

/^:SG/.Al'ER/A DF. PRO7'[i%.^Yi.S ??

w1°w

m LL

a

U

^ ozwN

m ^>̂ z

O

U

U

m

Q

E

^^

Q

C-;io

^ /J

w

-iti^ c ^ U

'o

0N ^

CN ^

a ^xd

^

Page 6: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

HI I. (II I R ( .1 1 /'I.la /-I'U\;1, I I I/ / h_(, I, U. / ( I A I/.S, B UI II I / I / A; )R/ / I I / \ 11 1LI

cial s'han desenvolupat tota una sOrie d'es-

trategies per eliminar la cadena de DNAmotile, i s'ha evitat aixi la necessitat de se-leccionar els dons mutants. Un bon exemple

es el metode de Nakavarne i Eckstein (1986),

en el qua] la sfntesi de la cadena comple-

rnentaria es realitza mitjancant una barreja

de desoxiribonucle6tids, dels quals un (per

exemple dCTP) porta un grup tiol inclos. La

presencia d'una cadena de DNA amb grups

tiol fa que molts enzims de restriccio (perexemple, Ava I, Ava 11, Ban II, Hind 11, Nci I i

Pvu I) no la reconeguin i nomes siguin ca-

pacos de tallar la cadena no derivatitzada

que havia actuat com a motile. Si a continua-

ci6 afegim exonucleasa 111, el motile sera de-gradat i la cadena de DNA mutagenica res-

tara intacta. Aquesta cadena es pot convertir

en doble cadena per addici6 de l'encebador

rnutagenic, de DNA polimerasa I i de DNA

lligasa. Amb aquest metode s'obtenen ren-

diments en mutants del 90'%, o mes. Existei-

xen altres metodes equivalents (p.e., el de

Kunkel, el de les dianes EcoA/EcoB alterna-

tives, etc.), que per limitacions d'espai no

descriu rem.

Tambe es poden introduir mutacions es-

pecifiques mitjancant el metode de la casset.

Si el nuclebtid que cal mutar esta flanquejat

per dianes de restriccio uniques, es pot ex-

treure la sequencia salvatge amb enzims de

restriccio i col•locar en el seu lloc, com si d'u-

na casset es tractes, una sequencia mutant

sintetica (fig 2B). Aquesta metodologia to

l'avantatge que es pot realitzar directament

sobre el vector d'expressi6, per6 presenta

els dos problemes segiients: 1) la necessitat

de dianes de restriccio uniques flanquejant

la zona que s'ha de mutar; i 2) els oligonu-

cleotids sintetitzats no pollen superar unes

destines de nuclebtids per raons de fidelitat

en la sintesi.

Finalment, la tecnica de la PCR (vegeu

Mullis et al., 1994) es actualment la mes uti-

litzada per a la rnutagenesi dirigida. En una

PCR, els oligonucleotids actuen com a ence-

badors de I'amplificacio d'un DNA motile i

generen un producte que en cicles poste-

riors actua, juntament amb el motile, de

sequencia complementaria a partir de la

qual es genera mes producte. D'aquesta ma-

nera, es produeix una amplificacio de 2"

molecules per molecula motile inicial, on«n» es el nombre de cicles de ]a reaccio. Es adir, a partir d'una unica molecula se'n pro-

dueixen 3,5 milions en 30 cicles. Si I'oligonu-cle6tid incorpora una mutaci6, aquesta seraintroduida als productes de la reaccio i, per

tant, el producte final incorporara ]a muta-

cio. Si els encebadors dels extrems es dissen-

yen amb les sequencies de les dianes de res-

triccio adients situades al seu extrern 5', el

producte de ]a PCR es pot clonar directa-

ment sobre el vector d'expressio. Quan la

mutacio que s'ha de realitzar es troba en un

dels extrems del DNA, un dissent/ adient

dels encebadors dels extrems permet acon-

seguir el producte mutat amb una sola reac-

cio d'amp]ificacio (fig 2C). Si la rnutaci6 clues'ha de realitzar es troba al mig de lasequencia, es necessaria 1'amplificaci6 per

fases. En una primera fase, s'amplifiquen les

dues meitats de la sequencia en dues reac-

cions separades, tenint en compte que han

de contenir una sequencia encoberta, de talmanera que aquestes dues mcitats puguinactuar com a motile en una segona fase

d'amplificacio que originara el producte

complet de la reaccio amb la mutacio desit-

jada, utilitzant els encebadors dels extrems.

Una variacio d'aquesta metodologia es I'a-

nomenat metode del rncgacncebador, que im-

plica una unica reaccio d'amplificacio a laprimera fase on s'incorpora la mutaci6 de-sitjada i utilitza aquest producte com a ence-

bador de la segona fase, juntament amb

I'encebador de 1'extrem oposat. Sigui quina

sigui I'estrategia de la PCR mutagenica, es

molt important la polimerasa utilitzada. La

Tart polimerasa no mostra activitat correcto-

Page 7: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

I;\Y,l\11/?!I1)1:IKUl7.7\I c5

ra 3'- 5', que si be no es crucial per a moltes

aplicacions de la PCR, si que ho es per a la

incorporacio d'una mutacio especifica, do-

nada la importancia de la fidelitat de la co-

pia. Algunes polimerases termofiliques te-

non activitat correctora i originen productes

amb una fidelitat de copia deu vegades mes

gran. Entre d'altres, es pot citar la DNA po-

limerasa GB-D de les especies de Pyrococus,

tambe anomenada ,Deep Vent"' DNA

polymerasa». Amb IaVent polimerasa s'ha

demostrat una eficiencia del 98-10077 en la

construccio d'una bateria de mutants (Jun-

cosa et al., 1994).

La mutagenesi dirigida no solament es

util per introduir mutacions puntuals, sing

que tambe permet la introduccio de muta-

cions multiples, d'insercions, la delecio

d'un fragment determinat i, fins i tot, I'inter-

canvi de fragments dins d'una mateixa

sequencia. Encara que la potencialitat de la

tecnica es molt diversa, calla experiment ha

de ser dissenyat racionalment i requereix

unes condicions determinades. Es impor-

tant remarcar que cal sequenciar el DNA

dels dons transformants per assegurar la in-

troduccio de la mutacio desitjada i la fideli-

tat de les copies.

APLICACIONS COMPUTACIONALS A

UENGINYERIA DE PROTEINES

L'enginyeria de proteines no seria possi-

ble sense l' ajut de la biocomputacio. Les

principals aplicacions d'aquesta tecnica

en I'enginyeria de proteines son les se-

guents:

Analisi de proteines amb estructura

tridimensional coneguda

Una de les principals utilitats de la

computacio a l'enginyeria de protemes es

la representacio tridimensional d'una pro-

tema mitjancant algun dels programes

existents (FRODO, RASMOL, SIBYL,

BIOSYM, PREPI, etc.). En particular, son

Utils per caracteritzar els entorns dels

atoms i residus , discernir les seves interac-

cions, o intuir la seva funcionalitat dins de

la proteIna . AixO permet suggerir vies per

al seu redisseny , possibles mutacions, i ob-

servar com aquestes podrien afectar el con-

junt d ' una protema (estructura i funciona-

litat).

Estudi de la sequencia d'una prote'ina

En els casos en que tan sols tenim la

sequencia d'una protema (obtinguda per

deterrninacio directa o be per clonatge i

sequenciacio del DNA, etc.) i no I'estructura

3D, tambe es poden fer diverses analisis:

Hoinologia sequencial

Quan s'ha trobat un nou gen/protema i

s'ha determinat la seva sequencia, el metode

mes important per predir la seva funcio po-

tencial es la recerca de sequencies homo-

logues amb funcio coneguda a les bases de

dades de sequencies (GenBank, EMBL,

SwissProt, PIR). Els prograrnes mes utilit-

zats per esbrinar les sequencies homolo-

gues son el FASTA (Pearson i Lipman,

1988) i BLAST (Altschul et al., 1990), que

es poden usar a molts servidors a traves

de la xarxa d'Internet; un dels millors es a

1'EBI (European Bioinformatics Institute:

http://www.embl-heidelberg.Lie). El pro-blema de la recerca d'homolegs implica el

de I'alineament de sequencies, que general-

ment es fa mitjancant un algoritme dinamic

(Needelman i Wunch, 1970) on s'alineen el

maxim nombre possible de residus segons

les identitats o les seves probables substitu-

cions (Davhoff, 1978; Henikoff i Henikoff,

1992), i s'afegeixen forats, produiits per in-

sercions o delecions (amb les corresponents

Page 8: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

16 1. U(l I l'l_kl// )\S.1 17//1.(;111 ( !\I/.1,/i U//1 I./ IlA/)/,'///// \ Ii//I

penalitzacions), a una sequencia o a una al-

tra. Els alineaments multiples donen molta

informaci6 Otil; per exemple, permeten

identificar les regions estructuralment con-

servades, les quals solen correspondre a es-

tructures secundaries regulars o a ,motius>>

(patrons relacionats amb funcio). Les re-

gions mes variables generalment corres-

ponen a arcs. Els aminoacids individuals

conservats a totes les proteInes solen ser

residus importants per a Ia funci6 (catalisi,

etc.).

Predicci(i 1 t'structura secundaria i d'helicestransmembrana

Les prediccions d'estructura secundariade protemes globulars tenen per objectiuidentificar les regions d'una sequencia deproteina amb conformaci6 en a-helix, es-tructura (3, gir invers i desordenada. Elsprimers metodes estadistics (Chou i Fas-man, GOR, etc.) no han arribat a superar

percentatges del 60-65% d'exactitud en Iapredicci6. Actualment es fan servir algorit-mes basats en xarxes neuronals (Rost i San-der, 1993) o algoritmes d'aprenentatge (Kinget al., 1997) que arriben al 70-75`%, d'encerti son utilitzables a traves de Ia xarxa d'In-ternet (http://www.embl-heidelberg.de ihttp://www.icnet.uk).

La prediccio de I'estructura de protei-nes de membrana exigeix aproximacionsdiferents. Si be son poques les protemes

de membrana de les quals es coneix l'es-tructura tridimensional, el tipus de plega-ment del dornini transmembrana pot serde dos tipus: 1) d'helix transmembrana(p.e. bacteriorodopsina); i 2) de (3-trans-membrana (p.e. porines) insertades en Iabicapa lipidica. Els metodes utilitzats per ala predicci6 de les helices fan us de xarxesneuronals (Rost i Sander, 1995; Alov et al.,1997), i obtenen percentatges del 90-95`%,d'encert.

Representacio dels perfils

d'hidrofobicitat/hidrofilicitat

Una de les analisis mes senzilles que espoden fer sobre una sequencia proteica esla predicci6 de I'accessibilitat al dissolventdels residus al llarg de Ia cadena polipep-tidica basada en la predisposicio hidrof6bi-ca/hidrofflica de cada residu. Aix6 permetlocalitzar aquelles regions amb major pro-babilitat de ser enterrades dins del nucli dela proteina o be dins Ia doble capa lipidicade Ia membrana. Si be els valors assignats ala hidrofobicitat/hidrofilicitat dels residusvarien segons els metodes, tots ells donenprediccions qualitativament similars. D'en-tre els metodes mes utilitzats, es poden es-mentar els de Kyte i Doolittle, 1982, i Hopp iWoods, 1981.

Modelat de 1'estructura tridimensional

d'una proteina

Modelat per homolo,'ia

El coneixement de 1'estructura tridimen-sional es, coin ja s'ha esmentat, de gran im-portancia en el red isseny de prote'ines per al

plantejament de possibles mutants. El prin-cipal problerna es l'obtenci6 de 1'estructuratridimensional detallada d'una proteina deIa mateixa farnilia. Coin que protemeshomologues (amb percentatges d'identitatsuperiors al 30%) conserven tota o una bonapart de l'estructura tridimensional, princi-palment les estructures secundaries, aix6ens permet proposar un model de l'estruc-tura tridimensional d'una sequencia a partirdel patr6 conformacional d'una o diversesproteYnes homologues (modelat per homo-logia). Les claus principals per al modelatper homologia son dues: 1) trobar els alinea-ments correctes entre la sequencia problemai les sequencies patr6; i 2) construir un bonmodel per a aquelles regions on Ia segiien-

Page 9: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

/ v(;[\ )7:R/.1 /rE PROTF/\E.S 57

cia no es conservada. El model de 1'estructu-

ra tridimensional es construeix per frag-

ments, dividint la proteina en regions es-

tructuralment conservades (REC) i regions

variables (RV). La construccio dels frag-

ments REC es fa per substitucio de la

sequencia problema en 1'estructura de la

sequencia patro, per exemple amb el pro-

grama COMPOSER (Topham et al., 1991).

Una forma alternativa per construir aquests

fragments es mitjancant I'aplicacio de res-

triccions de distancies definides a partir de

les conformations de les proteines patro,

per exemple amb el programa MODELLER

(Sali i Blundell, 1993).

Hom sot seguir tres metodes per a ]a

prediccio de la conformacio de la cadena

principal dels fragments RV: 1) tent servir

algoritmes de construccio de cadenes poli-

peptidiques amb posicions restringides als

extrems N i C terminals (ring closure); 2) cer-

cant regions de conformacio coneguda amb

el mateix nombre de residus on les posi-

tions en els extrems siguin similars a les de-

sitjades per unir els fragments REC (Jones i

Thirup, 1986); i 3) classificant el conjunt

d'arcs d'estructura coneguda (Oliva et al.,

1997), determinant els residus conformacio-

nalment importants per a 1'estructura de

]'arc, i cercant la classe a que pertany el frag-

ment RV (Rufino et al., 1997).

Algoritmes al ternatius per al rnodelat:

enfiilat

Quan no existeixen proteines homolo-

gues amb estructura tridimensional cone-

guda, es fa servir el metode de threading o

enfilat (Jones ct al., 1992). Aquest metode es

basa en el fet que els tipus de plegament es

repeteixen en proteines no homologues,

postulant que la proteina problema pot te-

nor un determinat plegament independent-

ment de la seva homologia. El rnodelat es fa

per substitucio de la sequencia problema en

les estructures conegudes, determinant el

plegament mes adient. Aquest plegament

s'obte sobre la base de potencials estadistics,

generats a partir de bases de dades tridi-

mensionals (PDB), escollint el plegament

que mostra l'energia optima d'entre tots els

provats (Sippl i Weitckus, 1992).

Estudi de les caracteristiques

fisicoquimiques d'una proteina

Aletodes de sinrulacio. Din0'miica molecular

Un dels principals atractius de la biocom-

putacio per a I'enginyeria de proteines es

basa en la seva capacitat per predir l'efecte de

mutacions. Per aquest motiu, es basic I'estudi

de l'espai conformational de la forma nativa

de la proteina i dels sous mutants. Aquest es-

tudi permet predir les variations en flexibili-

tat, estabilitzacio i reactivitat del sistema. Per

estudiar aquest espai es fan servir els meto-

des de simulacio i, concretament, les simula-

tions per mecanica/dinamica molecular son

les que ens poden donar mes informacio del

sistema en les regions properes al seu estat

natiu. La dinamica molecular es basa en

l'aplicacio directa de les ]leis de Newton

a un sistema multidimensionat. D'aques-

ta manera, 1'equaci6 F = -m - VE, on E Os

I'energia potencial, resol les equations de

1'espai i de la velocitat en funcio del temps

per a cadascun dell atoms constituents del

sistema (proteina mes dissolvent i contra-

ions). Corn a resultat s'obtenen les positions

i les velocitats de cada atom del sistema en

les conditions requerides, generalment les

del sistema isotermic-isobaric, que definei-

xen el conjunt estadistic del qual es poden

extreure les propietats tennodinhmiques

(Oliva et al., 1995, Daura ct al., 1996).

En particular, les propietats mes interes-

sants per analitzar son les variations confor-

macionals (plasticitat) i la seva capacitat de

retorn (flexibilitat) que permeten identificar

Page 10: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

.)^1 L:. Ql( FRHL,,1 :l I'LRLL-I'OV'S, 1, 17LLLUIS, 1 (.3,A.1L5, B 01,11 , 1,.J l I: A'URLLI. I F..C11 Ii L5

(hamiltonia) per una combinacio de les

equacions que descriuen les del sistema fi-

nal i inicial. D'aquesta manera, per coneixer

l'efecte d'una mutacio es fa us d'un cicle ter-

modinamic, on coneixem experimental-

ment el resultat per a la forma nativa i obte-

nim la diferencia d'energia lliure respecte

d'aquesta per a la forma mutada, fet que ens

permet determinar si el mutant es mes o

menys estable o reactiu:

AGI

Fiat RN 3 . Analisi de la dinamica molecular ( DM) d'una pro-teina de l'inhibidor de carboxipeptidasa de patata (PCI ). I'srepresenten superposades les diferents conformacions deles cadenes de carboni alfa del PCI al Ilarg d'una simulaciOen presencia d'aigua (vegeu I'exemple in d'aquest capitolper a mes detal ls).

E+S --------------- P

AGm

+rE'+S --------------- P

AG'

AG2

els punts mes febles i els mes estables dinsde la proteina. Aixo pot ser igualment utilit-

zat per comprovar la idoneitat d'un model

d'estructura quan no ha estat possible obte-nir dales experimentals de la proteina (od'una regio d'aquesta proteina). L'analisi deles variacions conformacionals es fa mit-jancant el calcul del RMSD (desviacio estan-dard) de les posicions atomiques amb rela-cio al seu estat original (vegeu figura 3), i alde ]a flexibilitat del sistema mitjancant lesfluctuacions (factors B de temperature oRMSD respecte a les posicions atomiquesmitjanes) (Oliva etal.,1995).

Variacions d'ener,c is lliure. Pertorbacions

La forma mes natural de diferenciar I'es-tabilitat d'una forma mutant en relacio ambla forma nativa es mitjancant el calcul de lavariacio d'energia lliure (AG), la qual es potpredir mitjancant simulacions de dinamicamolecular amb pertorbacions. Aquestes si-mulacions consisteixen a canviar les equa-cions que descriuen l'energia del sistema

A(AG)=AG1-AG2=AGm+ AG'

Aquestes simulacions presenten un grancost computacional i nomes poden ser apli-cades quan l'espai conformacional de la for-ma mutada es prou similar al de la formanativa (aixo no es factible en casos de des-plegament local o total de la proteina)(Mark i Van Gunsteren, 1994).

Reactivitat gnin(ica

L'aproximacio teorica mes acurada perestudiar el mecanisme enzimatic d'una pro-teina Os I'estudi de la seva reactivitat mit-jancant mecanica quantica. Fer aquest calculamb un sistema proteic complet es una tascaavui en dia computacionalment inviable. Esper aquest motiu que nomes la part corres-ponent al floc actiu de la proteina i la part re-activa del o dels substrats es tractada quan-ticament, mentre que la resta del sistema estractada per mecanica/dinamica molecular.La combinacio dels dos metodes constitueixavui en dia la forma mes innovadora per

Page 11: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

E.^(,L\}El?!.i1)1;J'XOl7J.AE.1 59

atacar aquest problema (tocnica QM/MM)

(Liu of at., 1996). D'aquesta forma es poden

identificar els diferents passos i els elements

que intervenen en els mecanismes de reac-

cio d'un enzim i proposar possibles muta-

tions que canvim la seva reactivitat (Alva-

rez-Santos et al., 1996).

quo es disposa sobre la proteina. A conti-

nuacio descriurem tres tipus d'investiga-

cions realitzades pels nostres grups de re-

cerca, amb objectius especifics diferents i

que han partit d'un nivell de coneixement

del sistema molt diferent, fet que condiciona

la velocitat d'avanc en la recerca portada a

terme.

Encaix proteiita/protcinn i protcina/lligand

El problema de conoixer la conformacio

de complexos protema/protema i prote'i-

na/Iligand a partir de les conformations de

les estructures no complexades, tambe co-

negut com a encaix o docking, constitueix un

repte de la biocomputacio. La via mes obvia

per resoldre aquest problema implica pro-

var totes les possibles formes de disposar cis

elements que cal encaixar entre si, tenint on

compte at mateix temps la deformacio que

es produeix en el contacte. Aixo fa que avui

en dia sigui practicament impossible resol-

dre aquest problerna de forma rigorosa per

motiu de I'alt cost computacional, de mane-

ra quo s'intenta resoldre el problerna amb

aproximacions, com per exemple sense con-

siderar la deformacio produida on l'encaix.

En aquest sentit, els algoritmes quo han do-

nat cis millors resultats s'han basat en la re-

cerca de I'area complementaria amb les mi-

Ilors interactions electrostatiques (Gabb of

at., 1997). Cal rernarcar que aquesta area to

un gran interes biotecnologic en el disseny

de farmacs.

DIFERENTS NIVELLS D'APLICACIO

DE L'ENGINYERIA DE PROTEINES

Exemples escollits

Les estratcgies emprades per caracte-

ritzar una proteina mitjancant El', i per re-

dissenvar-la, s'han d'adaptar als nivells de

coneixements estructurals i funcionals de

EXEMPLE I. Es coneix unicament la

segiuencia de la protefna : glicosidases

Les glicosidases son enzims que catalit-

zen la hidrolisi estereoespecifica d'enllacos

glicosidics en oligosacarids i polisacarids.

Es tracta d'enzims amb gran aplicabilitat

industrial i agroalimentaria. Actualment hi

ha dipositades en els banes de dades mes

de 900 sequencies de glicosidases que han

estat agrupades per Bairoch i I lenrissat en

mes de seixanta families mitjan4ant l'analisi

de clusters hidrofobics (HCA) i el multiali-

neament de sequencies, especialment aque-

lles relacionades amb el domini catalitic

(http://expasy.hcuge.ch/cgi-bin/lists.gly-

cosid.txt). L'HCA permet examinar l'entorn

de cada aminoacid at llarg de tota la sequen-

cia i ha demostrat ser particularment Otil

per establir relations entre families que hau-

rien passat desapercebudes amb la sola

comparacio entre sequencies (Henrissat,

1991). Des del punt de vista estructural, ac-

tualment es coneix l'estructura tridimensio-

nal d'almenys un representant de vint-i-tres

families de glicosidases. Quant it plega-

ment, les glicosidases resoltes per raigs X

mostren topologies del tipus barril

barril ji, barril u/u i sandvitx (3. Nomes

s'han observat tres topologies de centre

actiu: butxaca (pocket), escletxa (cleft) i t6-

net (tunnel). La funci6 basica de cada enzim,

la hidrolisi de l'enlla4 glicosidic, esta deter-

minada per la topologia del centre actiu,

mentre que el posicionament de les cadenes

laterals dels aminoacids dins del centre

actiu determina tant 1'estereoquimica com

Page 12: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

hl) !i O( 7J?OL. J .I. I'IiRLL-I'O:A:S, I 1ILLE(i.I.S, I _ (.IA.ILS, R 0111 ,1,.J I LAI)RFLL I L..1..1IiLJLS

1'especificitat de substrat i d'enllac. En con-

sequencia, el fet que dos enzims pertanyin

a la mateixa familia no implica necessa-

riament que duguin a terme la mateixa fun-

ciO.

Pel que fa al seu mecanisme, les glicosi-dases es divideixen en dos tipus basics: a)enzims que utilitzen un mecanisme de do-ble desplacarnent per catalitzar la hidroliside l'enllac glicosidic amb retencio de confi-guracio en el carboni anomeric; i b) enzimsque utilitzen un mecanisme de desplaca-ment unic que dona Iloc a la inversio de con-figuraci6 en el centre anomeric (McCarter iWithers, 1994) (figura 4). En ambd6s meca-nismes, hi participen un pare]] d'acids car-boxilics. En els enzims amb retencio, un car-boxilat amb carrega actua com a nucleofil iun grup carboxilic protonat coin a catalitza-dor acid-base. La reaccio inclou la formaci6d'un intermedi covalent enzim-substrat peratac del nucleofil sobre el carboni anomeric(etapa de glicosidaci6) i la posterior forma-cio d'un nou extrern reductor per atac sobreel carboni anomeric d'una molecula d'ai-gua, la nucleofilia de la qual esta augmenta-da per la base conjugada de ]'acid general

Inversid Retenciode configuracid de configuracio

O^O O10

H

^,oH

1

e (,To

OH

H

^yoH

e0` '0

- ROH + H2O

H H1HO

^r ) H O

OTO

101 -0

0OH

Fu,t itn 4. Mcainismci proposats pcr a les glicosidases.

(etapa de desglicosidacio). En els enzimsamb inversio, un grup carboxilic actua coma acid i l'altre com a base que augmenta lanucleofilia de la molecula d'aigua que des-placa el grup aglico sortint.

Estem estudiant dues glicosidases: una1,3-1,4-(3-glucanasa i una (3-glucosidasa. Eltreball dut a terme amb aquests enzims esun bon exemple de corn, a partir de lasequencia i combinant metodes predictius ianalisi d'homologia, es poden formularhip6tesis que, un cop contrastades experi-mentalment, permetin esbrinar la relaci6 es-tructura/funci6 i, fins i tot, tractar de millo-rar-ne les propietats enzimatiques.

1,3-1,4-f3-Glucanasa (EC 3.2.1.73)

La 1,3-1,4-13-glucanasa (endo-1,3-1,4-f3-

D-glucan 4-glucanohirolasa) hidrolitza en-

Ilacos (3-1,4 dels (3-glucans, polisacarids line-

als formats per residus de glucosa units per

enlla4os mixtos (3-1,3 i j3-1,4. El gen de la glu-

canasa de Bacillus licbcuif)ruris es va clonar

en E. coli (Lloberas et al., 1991). En absencia

d'informacio sobre 1'estructura tridimensio-

nal, els intents inicials per identificar els re-

sidus essencials del centre actiu es van basar

en la comparacio de la segti ncia amb les

corresponents a lisozirns eucari6tics i virals,

mes conegudes des del punt de vista me-

canistic. Aixi es van predir dos possibles se-

tins actius: 1) un segment de vint-i-cinc ami-

noacids que presentava un 70`%, de similitud

(40% d'identitat) amb el seti actiu del liso-

zim del fag T4 i que contenia els residus Glu

i Asp en les mateixes posicions que els assig-

nats com ]'acid general (Glu-11) i el nucle6-

fil (Asp-20) a I'enzim de T4; i 2) un segment

de vint-i-un aminoacids amb un 20% de si-

militud amb la regi6 que inclou els residus

catalitics Glu-35 i Asp-52 en el lisozim de

clara d'ou. D'una Banda, aquest segon

possible seti actiu no estava conservat en

1,3-1,4-j3-glucanases d'altres especies de Ba-

cillus i, de l'altra, la predicci6 d'estructura

Page 13: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

E,VG/.VYER/.I /)/'. PR OI /JA i. 6/

secundaria estava rues d'acord amb la del

T4 lisozim (Querol et al., 1992). Es va proce-

dir a substituir per mutagenesi dirigida tots

els catorze residus acidics conservats a les

dues regions pel corresponent arninoacid

isosteric sense carrega (Asn i Gln). Aixf es va

demostrar que la mutacio Glu-138-Gln do-

nava lloc a un enzirn totalment inactiu; a

aquest residu se li va atribuir el paper d'acid

general, aixi corn que el Glu-134 actuava

com a nucleofil (Juncosa et al., 1994). La figu-

ra 5 mostra el resultat de l'assaig d'activitat

en placa fet directament sobre dons porta-

dors de les diferents mutacions puntuals. El

paper dels residus essentials ha estat poste-

riorment confirmat rnitjancant diverses ana-

lisis cinetiques.

L'estructura cristal-lografica de 1'enzim

posteriorment obtinguda (Hahn c t al., 1995)

mostra que la glucanasa presenta un plega-

ment del tipus [i sandvitx. Tambe s'ha posat

en evidencia 1'existencia d'un Pont disulfur

entre les dues uniques cisteines que presen-

ta I'enzim i que connecta un llac que cobreix

parcialment la cavitat del centre actiu i una

cadena (3 del nucli hidrofbbic de la proteina.

Per tal d'estudiar el paper del pont disulfur i

del Ilac del centre actiu en la catalisi i per

Fiol kn 5. Assaig d'actis tat en placa utilitzant Ij-&6 com

a substrat i tincio arch roig Congo dels dons portadors dc

les diferents mutacions puntuals indicades.

tractar de redissenyar 1'especificitat i l'acti-

vitat enzimatiques, es va procedir a fer el

que s'anomena « escombrat d'alanines,, amb

club tots els residus son substituits « un per

un,, per Ala. Aquesta estrategia de mutage-

nesi en combinacio amb prediccions per

dinamica molecular i docking de substrats ha

proporcionat el mutant Met-58-Ala, que es

set vegades mes actiu que 1'enzim salvatge.

Aixi mateix, s'ha comprovat que ]a substi-

tucio de l'Asn-57 per Ala augmenta la ter-

moresistencia de 1'enzim en un 70`%% (Pons et

at., 1995 i 1997). En aquest moment, s'estan

aplicant regles teoricopredictives (Querol et

al., 1996) en el dissent' racional d'estrategies

encaminades a millorar tant la termostabili-

tat com la termoresistencia, propietats irn-

portants des del punt de vista de la utilitza-

cio industrial de 1'enzim.

(3-Glucosidasa (EC 3.2.1.21)

La 1i-glucosidasa ((3-gluc6sid glucohi-

drolasa) catalitza la transferencia de grups

glucosidics entre oxigens nucleofilics. En

conditions fisiologiques, aquesta reaccio de

transferencia generalment dona com a resul-

tat la hidrolisi d'un enllac glicosidic. El gen

de la p-glucosidasa Bgl3 (479 aminoacids, 53

kDa) de Streptonnyces sp. es va clonar incial-

ment en S. liz'idans i posteriorment en E. colt

(Perez-Pons et al., 1994). Per analisi d'horno-

logia, 1'enzim es va classificar dins de la fa-

milia 1 de glicosilhidrolases. En el moment

de la comparacio, formaven part d'aquesta

familia almenys catorze enzims d'origen

bacteria, animal i vegetal, anib la qua] cosa la

identificacio de residus altarnent conservats

per comparacio de secloOncies es vela molt

simplificada. A mes, s'havia localitzat per

RMN del complex covalent enzim-inhibidor

(Withers i Street, 1988) i per mutagenesi diri-

gida (Trimbur et al., 1992) el residu Glu que

actua de nucleofil catalitic a I'enzim d'Axro-

bacterium faecalis. Aquest residu (Glu-383 en

la glucosidasa de Streptonuices com hem

Page 14: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

h' li O I ROL..! I P111"LJ-l'O\S I I'lLLI (,IS. l II OIJI .I../ 1 L,A7)RLI I, l l \ U 71.I.S

comprovat substituint-lo per Gln) esta total-ment conservat entre tots els membres de lafamilia 1 que actualment inclou almenvsvint proteines. Quedava per identificarI'aminoacid que fa el paper de catalitzadoracid/ base i tampoc noes coneixia I'estructu-ra cristal-lografica de cap representant de lafamilia. Per tant, igual que amb ]a glucanasa,I'estrategia que es va seguir va ser la d'apli-car mutagenesi de rastreig sobre tots els resi-dus Glu i Asp mes conservats, i es va trobarque el Glu-178 es l'altre residu essencial.Posteriorment va sortir publicada 1'estruc-tura tridimensional de la glucosidasa de Tri-foliunl rcpens (Barrett etaL.,1995), cosa que vapermetre aplicar tecniques de modelat idinamica molecular sobre la glucosidasa deTrifolinni, amb la qual Bgl3 mostra un 36%d'identitat per sequencia d'aminoacids.Amb l'estructura modelada, s'han dissenyatracionalment mutants del centre actiu quehan permes establir la seva contribucio a lacatalisi (p.e., Arg-89) i, fins i tot, alterar-la(per exemple, el mutant Cys-181-Ser que, adiferencia de l'enzim salvitge, no presentainhibici6 per substrats del tipus aril-glue6-sid). Actualment ja es disposa de cristalls dela Bg13 (A. Guasch, manuscriten preparacio)i s'esta refinant I'estructura amb dades d'es-pectres de difraccio recollits a 1,8 A. Els re-sultats preliminars mostren que aquestaglucosidasa es una proteina globular, moltcompacta i amb una topologic del tipus ba-rril La regio catalitica adopta la for-ma de ,butxaca,,, a l'entrada de la qual estrobarien els residus que intervenen en launio de la part aglicona de la molecula desubstrat. Tambe determina l'especificitat deI'enzim; la Cvs-181 esta precisament localit-zada en aquesta regio. Es disposa aixi de lesbases estructurals que permetran futures in-vestigacions dirigides en aquest enzim pertractar de millorar especialment la seva ca-pacitat do transglicosidacio tot adaptant-la ala sintesi de glicoconjugats.

EXEMPLE H. Es disposa d'informacio 3Dparcial : el domini d ' activacio de la procar-boxipeptidasa A2 humana; la utilitat d'unmodelat i del coneixement del proces deplegament

Les carboxipeptidases pancreatiques sesintetitzen com a precursors inactius ozim6gens gracies a una extensio N-terminalanomenada segment pro, que es alliberadaal duode per accio de la tripsina. El segmentpro esta format per un domini globular devuitanta residus (Ii direm dornini pro),tambe anomenat domini d'activacie, con-nectat a 1'enzim per una helix a C-terminal.Experiments de calorimetria (DSC) demos-tren que les carboxipeptidases presentenuna desnaturalitzacio totalment irrever-sible, mentre que el domini pro presentauna desnaturalitzacio reversible (Conejero-Lara of al., 1991; Sanchez-Ruiz, of al., 1991).D'altra Banda, l'expressio heterologa de lescarboxipeptidases produeix proteina inso-luble, i I'unica manera d'aconseguir el ple-gament correcte de la proteina recombinantes expressant-la en forma de proenzim.Aix6 suggereix que el domini pro actua comuna proteina de plegament interna i que potesser un model interessant per estudiar elproces de plegament de les proteines.

El fragment de DNA que codifica la pro-carboxipeptidasa A2 (PCPA2) humana es vaobtenir a partir d'una genoteca de DNAc(Catasus of al., 1995). L'estructura primariade la proteina codificada es va modelar sobreles coordenades de I'estructura terciaria deproteines hon16logues, com la procarboxi-peptidasa Al de pore i la mateixa forma enbou (Catasus of al., 19951- Aloy of al., 1997). Elresultat mostra que el domini pro de laPCPA2 esta constitult per dues helices a ques'empaqueten contra una fulla-1i de quatrecadenes (figura 6). Les helices a es troben ex-posades al solvent i la fulla-13 es la que con-tacta parcialment amb el centre actiu de 1'en-zim. Observant les estructures secundaries

Page 15: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

L;A ( 1V } '/ Rl. l 1)1; l'KO'l7a:VfiS 6 3

(1)

Sec.St TT SSSSS THHHHHHHHHHTT 333 SSSS TTTT SSSSS 333HHHHHHHHHHTT SSSSST

Prot MRSLETFVGDQVLEIVPSNEEQIKNLLQLEAQEHLQLDFWKSPTTPGETAHVRVPFVNVQAVKVFLESQGIAYSIMIEDVQ

H1Wt VPSNEEQIKNLLQLEAQEHLQ Y

H1Mt VPSNEEQIK K LL E LEAKK HLQY

H2Wt

H.Y'

I,)

I i(,i i<% 6. Isquema de I'estructura secundaria i palm general de contormaeio del domini d'activaci6 dc la P( TA-2 humans.

de la proteina modelada ens varem adonar

que els aminoacids constituents de les heli-

ces a a la proteina silvestre son deficients

com a formadors d'aquest tipus d'estructura

i que el dipol electric de les helices es gran i

desestabilitza el plegament global. A partir

d'aquestes observacions varem dissenyar

mutacions per tal d'incrementar la capacitat

de mantenir-se en conformacio de helix a, a

la vegada que disminuiem el dipol electric i

creavem interaccions estabilitzants de la

conformacici a (i, i+3; i, i+4) (figura 6).

Utilitzant 1'algoritme AGADIR (Munoz

i Serrano, 1997), es va predir un percentat-

ge de conformacio a del 16'% i del 5% per

a les sequencies de les helices 1 i 2, respec-

tivament. La predicci6 per a les sequen-

cies mutants va ser del 63%, i del 44 cosa

que implica un augment de 1'estabilitat de

2,5 i 1,6 kcal mol', respectivament. Final-

ment, es van construir tres mutants: 1) helix

1 estabilitzada, 2) helix 2 estabilitzada, i 3) el

doble mutant. Els fragments que codifiquen

el domini pro silvestre i els dominis mutats

es van clonar en un vector d'expressi6

d'E. coli (Villegas of a!.,19956).

A la figura 7 es mostren alguns dels re-

sultats experimentals obtinguts en 1'estudi

de la proteYna salvatge i dels seus mutants.

L'estudi de la variaci6 de la intensitat de

fluorescencia en variar la concentracio d'un

agent desnaturalitzant com la urea (figura

7) permet deduir dales termodinamiques.

En ser mesures fetes en I'equilibri, i pel fet

d'esser el punt d'infiexi6 de la corba aquell

en el qual la constant d'equilibri es 1 (i I'e-

nergia lliure, per tant, 0), es possible extra-

polar l'energia Iliure del plegament global,

es a dir, la diferencia en estabilitat entre les

formes nativa i desnaturalitzada. Aquesta

estabilitat es de 4,2 kcal mol ' per al domini

pro. El pendent de la corba es una mesura in-

directa de la diferencia en el grau d'exposi-

ci6 a] dissolvent entre les formes nativa i

desnaturalitzada i, per tant, del grau de com-

pactacio de la protefna.

Ara be, I'estudi en condicions d'equilibri

poques vegades permet la detecci6 de for-

mes intermediaries en el proces de plega-

ment. Si tenim trey estats, desnaturalitzat,

intermediari i natiu, la cinetica de conversi6

de 1'estat desnaturalitzat en I'intermediari

Page 16: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

64 L. ()LI:ROL..1..1 l'LRLZ-/'0.A5. 1. l7LLLG.IS, I. (:l.1:ILS, B. O/./I .1, J. I L.SZ)RLLI. 11 .A_IIILLS

1,5]

11

0 2 4 6 8 10

Urea [M]

Fs,IJRA 7. Variacib de la Iluorescencia durant la desnatura-litzaci6 del domini ADA211 i les formes redissenyades, se-gons la concentracio d'urea . (•) ADA211, forma silvestre;(A) mutant amb helix I estabilitzada ; ( o) mutant amb helix 2estabilitzada; (o) doble mutant.

es distinta de la cinetica de conversio Lie Yin-termediari en la forma nativa, ja que son pro-cessos diferents. La cinetica d'una reaccio espot mesurar amb un utillatge anomenat deflux retingut (stopped-flow) que consisteix endues xeringues, una que conte la protefnadesnaturalitzada i I'altra, I'amortidor queserveix per renaturalitzar. La mescla es rea-litza a una concentracio final Lie desnatura-litzant determinada, i un detector de fluo-rescencia connectat en serie ens dona lalectura de la variacio de ]a fluorescencia du-rant el replegament. D'aquesta manera, po-dem coneixer la velocitat de la reaccio a unaconcentracio determinada de desnaturalit-zant. Si es representa el logaritme natural dela velocitat de la reaccio de replegament da-vant de la concentracio de desnaturalitzant(figura 8), ]a grafica obtinguda es lineal si nohi ha intermediaris del proces de replega-ment. Per contra, si l'intermediari existeix,la seva aparicio provocara una desviacio dela linealitat a la concentracio de desnatura-litzant on I'intermediari es estable.

Amb I'aparell de flux retingut tambe po-dem estudiar la reaccio de desplegament siuna xeringa conte la proteina nativa i I'altrauna dissolucio amb desnaturalitzant. La re-presentacio del logaritme natural de lesconstants cinetiques de desplegament da-vant de la concentracio de desnaturalitzantes sempre una recta. A partir de la comhi-nacio lineal d'ambdues parts del proces, re-plegament i desplegament, podern obtenirinformacio sobre la velocitat de reaccio a di-ferents concentracions de desnaturalitzantsi, de la mateixa manera que on I'estudi encondicions d'equilibri, sobre 1'estabilitat i elgrau de compactacio del plegament. Els va-lors obtinguts van ser els mateixos que vanobtenir-se a 1'estudi on I'equilibri i que vanesser tambe corroborats per estudis de CD(Viguera et (al., 1996). Aquests estudis varenindicar tambe que el domini pro de laPCPA2 humana es pot plegar i desplegar enuns pocs mil-lisegons, un dels temps mes ra-pids descrits per a proteines.

5

in

c

11

0 2 4 6 8 10

Urea [M]

FuouSA 8. Representaci6 (semilogaritmica) de la vclocitatde la reaccio de replegament del domini ADA2H i Ies for-mes redissenyades, a ditcrentes concentracions d'urea. (•)ADA2I1 , forma silvcstre; (A) mutant amb helix I estabilit-zada; ( o) mutant amb helix 2 estabilitzada ; ( 0) doble mu-tant.

Page 17: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

E'.tiYil.^) ER/. I Dti /'ROI] la'ES' 65

Tant 1'estudi de la cinetica del proces

corn de la seva calorimetria revelen que el

domini pro es plega sense la formacio d'un

intermediari. Sembla que I'aparici6 d'inter-

mediaris en un proces de plegament depen

de la mida de la cadena polipeptidica que

s'ha de plegar i del tipus de plegament, i son

necessaris quan la proteina excedeix del

centenar de residus (Villegas of al., 1995a).

L'absencia d'intermediari i la rapida veloci-

tat de plegament del domini pro sembla que

son la causa que aquest dornini faciliti el ple-

gament del proenzim i que actui com una

proteina de plegament interna.

En comparar els parametres termodina-

mics i cinetics obtinguts en els quatre casos

estudiats, s'observa un increment de l'es-

tabilitat d'1,5 kcal mol', 1,7 kcal mol-', i de

3,2 kcal mol ' per als mutants de I'helix 1,

de I'helix 2 i per al doble mutant, respecti-

vament (Viguera of al., 1996). L'efecte d'es-

tabilitzaci6 aconseguit amb el redisseny

independent de les helices esdeve, doncs,

additiu. A mes, 1'estabilitzaci6 pot originar

un augment en la velocitat del plegament de

fins a quatre vegades, com s'observa amb el

mutant de I'helix 2. L'exemple de l'estabilit-

z_acio del dornini pro de la procarboxipepti-

dasa A2 demostra que el plegament de les

proteines no esta optirnitzat evolutivarnent

pel que fa referencia a I'estabilitat i a la velo-

citat del plegament, i que aquestes propie-

tats son millorables per l'enginyeria de pro-

temes.

Pero la potencialitat de les tOcniques

d'EP no s'acaba aqui: tambe ens poden ser-

vir per entendre quina es 1'estructura d'un

estat efimer, no aillable ni caracteritzable

per cap altra metodologia, com pot ser Fes-

tat de transici6 en la via de plegament d'una

proteina. Per fer-ho, es parteix del disseny

d'una bateria de mutants de pertorhacio,

disruptius, repartits per tota la sequencia

codificant. Els mutants disruptius son

aquells que eliminen un grup funcional sen-

se introduir noves interaccions amb la resta

de la protema. Un bon exemple es la muta-

cio d'Ala a Gly, amb la qual podriem mesu-

rar l'efecte desestabilizant de I'diminaci6

d'un grup metil i, com a consequencia

d'aixo, la importancia d'aquest metil en I'e-

nergetica del plegament. Mitjancant la de-

terminaci6 de les cinetiques de les reactions

de replegament i desplegament podem de-

duir si la interacci6 en la qual esta implicat

el grup metil esta formada o no a I'estat de

transici6. Si ho esta, la desestabilitzaci6 de

l'estat de transici6 sera la mateixa quo l'ob-

servada al mutant plegat, i aixo es reflectira

a la cinOtica de desplegarnent. Si la interac-

ci6 no esta formada a l'estat de transici6, la

desestabilitzaci6 d'aquest estat sere la ma-

teixa que l'observada al mutant desplegat, i

aixo es reflectira a la cinOtica de replega-

ment. Amb aquesta nietodologia s'ha oh-

servat que les protemes monodomini (es a

dir, petites) es pleguen segons el que s'ha

anomenat el model de nucleaci6 i condensa-

ci6, on la formaci6 d'estructura secundaria

es paral.lela a la formaci6 d'estructura ter-

ciaria. Abans del desenvolupament de les

tecniques d'enginveria de proteines era ini-

maginable poder cone'ixer quires son les in-

teraccions que es donen a I'estat de transici6

i, per tart, entendre quin es el cami de plega-

ment de les prote'ines.

Cal afegir que darrerament hem aconse-

guit determinar experimentalment I'estruc-

tura tridimensional detallada de la PCPA2

humana completa per difracci6 de raigs X

(Garcia-Saez of al., 1997). La comparaci6 de

la conformaci6 derivada per al domini pro i

per a tota la proteina amb les obtingudes

previament per modelat computational in-

dica que aquests modelats varen ser molt

acurats, amb desviacions significatives

nomes en les regions d'unio entre estructu-

res secundaries regulars, i concretament en

els arcs.

En disposar d'una estructura 31) acura-

Page 18: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

6(' / Ul 1 /0 )/ / I /'l Kl / I ) \A I I // / / 0 H I ( IA f/1 /i ()//I I / 17 \l )Rli l 1 f \ 1111L1

da s'obren moltes possibilitats de redissenyd'aquesta proteina amb objectius diferents.Per exemple, per redisseny de la regi6 pro ode la regi6 enzimatica es pot facilitar 1'ex-pressi6 recombinant i la renaturabilitat de laproteina.

EXEMPLE III. Es coneix be l'estructura 3Dde la proteina : l'inhibidor de carboxipepti-dases de patata (PCI)

A molts vegetals s'hi han trohat inhibi-dors de diverses proteases que poden servircom a sistema de defensa de les plantes con-tra insectes o fongs (Ryan, 1989). L'inhihi-dor proteic de carboxipeptidases que es tro-ha a la patata (PCI) es una proteina denomes trenta-nou aminoacids. Es coneix1'estructura tridimensional del PCI en disso-luci6, determinada per ressonancia magne-tica nuclear (Clore of al., 1987) i 1'estructuradel complex que forma el PCI amb la car-boxipeptidasa A (CPA), determinada perdifracci6 de raigs X (figura 9) (Rees i Lips-comb, 1982). De I'estructura d'aquesta pro-teina destaca la presencia dels tres ponts di-sulfur que estabilitzen el seu nucli globular,i tambe l'absencia d'estructures secundaries

I ^'I i, v') 1 11 u II I,I "I),IcI I'1 I

regulars, a excepci6 d'un curt segment en

helix 3,,,. De l'estructura del complex amb la

carboxipeptidasa A, s'observa que el PCI in-

teracciona amb el centre actiu de 1'enzim a

traves de la seva cua C-terminal. Hi ha

tambe una zona de contacte secundari entre

els residus 27 a 30 del PCI i 1'enzim.

Al nostre laboratori varem triar aquestinhibidor com a model d'estudi per a en-ginyeria de proteines per diverses raons.D'una Banda, el fet que es conegues l'es-tructura del seu complex amh la carboxi-peptidasa el feia un hon candidat per estu-diar rues a tons la interacci6 entre les duesproteines. Una gran part de mecanismesfuncionals de les proteines es basen en lainteracci6 especifica proteina-proteina. En-tendre els factors que expliquen 1'especifi-citat i I'estabilitat d'aquestes interaccionses, doncs, basic per arribar a comprendreaquests mecanismes des del punt de vistamolecular. D'altra Banda, el PCI, en ser unaproteina molt petita, presenta el gran avan-tatge de reduir els temps de calcul necessa-ris per efectuar simulacions per dinamicamolecular o per aplicar altres metodes desimulaci6 computacional. Des d'aquestpunt de vista, el PCI es un bon model tantper a I'us dels metodes computacionals peral dissent' d'experiments com per a la con-trastaci6 experimental de ]a validesa o lautilitat de nous metodes computacionals enI'enginyeria de proteines.

Des del punt de vista experimental, labase per iniciar estudis d'enginyeria de pro-teines es disposar d'un bon sistema d'ex-pressi6 de la proteina en forma recombi-nant, que permeti la construcci6 i I'obtenci6de mutants especifics. En el cas del PCI, aix6es va dur a terme rnitjancant el desenvolu-pament d'un sistema molt eficient d'expres-sib en E. Coli (200 mg/L), en bioreactor, apartir d'un gen sintetic codificant per a unade les formes de ]'inhibidor trobades a lapatata, en un vector de secreci6 al periplas-

Page 19: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

EN(il FF.RI.I l)! l'KOTL7.^'ES 67

ma (Molina et al., 1992 ; Marino et al. 1994).

Per tal d'estudiar la interaccio entre la re-

gio de contacte primaria entre el PCI i el cen-

tre actiu de la carboxipeptidasa A, que

compren els residus 36 a 39 de la cua C-ter-

minal (ProTyrValGly), es varen dissenvar

diversos mutants. Posteriorment es va de-

terminar la constant d'inhibicio K de la

CPA per a cada un d'ells, constant que esta

directament relacionada amb l'estabilitat

del complex enzim-inhibidor , mesurat com

I'increment d ' energia Iliure de Gibbs de dis-

sociacio del complex (AG"). En primer lloc,

es va estudiar la contribucio dels dos dar-

rers residus del PCI a l'estabilitat del com-

plex amb la CPA (Molina et al., 1994).

Aquests residus, d'acord amb l'estructura

del complex, son els que ocuparien els hoes

S1 i S1 ' al centre actiu de l'enzim. Per al mu-

tant delectiu deIG39 es va obsevar una K

practicament identica a la del PCI natural

(PCIwt). Aquest resultat implica que la

presencia de la G1y39 al hoc S1' de 1'enzim

no contribueix practicament a l'estabilitat

del complex . Aixi, la hidrolisi d ' aquesta

GIv, que to Iloc quan l ' inhibidor s'uneix a

l'enzim , no modifica practicament la seva

capacitat inhibidora. La contribucio de la

Va138 es va analitzar per rnitja de la produc-

do i I'analisi de les Ki dels mutants del

V38G39, V38G, V38A,V38L i V381. Els resul-

tats obtinguts van permetre « disseccionar,,

la contribucio a l'estabilitat del complex del

residu Va138, de la manera que es mostra a

la figura 10.

La contribucio total del residu Val-38, es-

timada a partir de la diferOncia entre els va-

lors de AG", dels mutants del G39 i del

V38G39, es de 5,2-5,8 Kcal mol-1. Aquest va-

lor represents el 45-48 `%, de l'estabilitat total

del complex PCI-CPA (11,6-12,1 kcal mol-'),

i correspon a un increment en la constant

d'inhibicio pel mutant de1V38G39 d'un fac-

tor de 10', una reduccio dramatica de la

capacitat inhibidora respecte al PCIwt.

Aquests resultats demostren que aquest re-

sidu Va138 Os clau per a l'estabilitat del com-

plex PCI-CPA. Com es mostra a la figura 10,

la contribucio de la cadena lateral d'aquest

residu , per comparacio amb l'estabilitat del

mutant V38G , es de 3,4 -4,0 kcal mol '. Si se

suposa que aquesta contribucio Os deguda a

interaccions hidrofobiques de la cadena

alifatica amb el centre actiu de l'enzim, es

pot subdividir en aportacions individuals

de cada grup d ' aquesta cadena per compa-

racio dels valors de AG° ,del PClwt i dels di-

versos mutants.

Conies mostra a la figura 10 , els resultats

suggereixen que calla un dels grups metil o

metile de la cadena alifatica contribueixen a

l'estabilitat del complex amb una contribu-

cio similar , al voltant d'1,0-1,5 kcal mol ',

fins a la posicio y de la cadena , a partir de la

qual ja no hi hauria interaccio hidrofobica

amb l'enzim (Molina et al., 1994). Per tal de

reforcar aquesta hipotesi , es va dur a terme

un estudi d ' aquesta sOrie de mutants per

metodes computacionals . S'obtO una bona

correlacio entre les variables experimentals

i les calculades, cosa que reforca tant la in-

terpretacio dels resultats experimentals

com la validesa dels models constru'its i els

algoritmes de calcul utilitzats . Una altra

aproximacio computacional que s'h a assajat

per intentar la prediccio teorica de les di-

ferencies entre l'energia d ' estabilitzacio per

diferents complexos CPA-PCI mutants es

I'anomenada teoria de pertorbacions que

s'ha descrit a la pagina 52.

Un altre aspecte referent a la interaccio

entre la regio C-terminal del PCI i la CPA

que ha estat objecte d ' estudi , tant des del

punt de vista experimental com computa-

cional, es el que fa referOncia a I'orientacio

espacial i a la mobilitat conformacional d'a-

questa cua C-terminal , i el seu paper en 1'afi-

nitat de 1'inhibidor per la carboxipeptidasa.

El resultat mes destacat es que la cua C-ter-

minal, es a dir, la zona responsable de la in-

Page 20: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

(,v / u(IIi( ' I I'1III/I'U\V I F ( IA.I/S/; 001 1./ 1I \I(II/III \ 1IIII

a)

PCI wt-CPA

11,6-12,1 kcal/mol

PCI V38L-CPA

10,5-10,7 kcal/mol

PCI V38A-CPA9,4-9,6 kcal/mol

Ala

l3-CH2

1,2-1,5 kcal/mol

PCI V38G-CPA

8,1-8,2 kcal/mol

b)

Gly

Cu

Limit additiu

Ca

C G3

y-CH3

0,9-1,6 kcal/mol

Val Leu

Cu Cu.

CO/CR

CY CY Cy- - -- -------- ----- -/

C6 C6

de la contribuci6

Contribucio

total de lacadena lateral

3,4-4 kcal/mol

lie

Cu.

/C\

Cy CY

Co

Fiats. 10. a) Dilerencies en les energies Iliures de dissociacio (A(i,') dels complexes do CPA i PCI silvestrc i mutants a laposicio 38. h) Esquema dcls gnips R a la posici6 38 del PCI.

teraccio primaria amb 1'enzim, to una mobi-litat forca restringida, i adopta en estat aIllatuna orientacio a l'espai semblant a la ques'observa quan es troba formant el complex

amb la CPA. Aquesta restriccio conforma-tional seria en part la responsable de I'ele-vada afinitat de l'inhibidor per la CPA (Oli-va et al., -1995).

D'altra Banda, s'han dut a terme estudissobre el cami del plegament del PCI. En te-nir tres ponts disulfur a la seva estructura, elcami del plegament de I'inhibidor va poderser estudiat mitjancant I'analisi dels inter-nmediaris que es formen al llarg del proces

de formacio dels ponts disulfur simultani atplegament. Els resultats mostren que el ple-gament de la molecula de PCI segueix uncami que s'inicia amb un rapid collapse, enclue es formen de manera sequential ungran nombre d'intermediaris amb 1, 2 i 3ponts disulfur, seguit d'una etapa lenta dereorganitzacio dels aparellaments dels tresponts disulfur formats, per conduir a I'es-tructura nativa (Chang et al., 1994). La carac-teritzacio experimental del mecanisme deplegament del PCI es la base per a estudis desimulacio computational del plegamentque s'estan portant a terme. D'altra banda,

Page 21: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

L1)1 PRUTELI'/.:S 09

l'estudi d' aquest mecanisme , tant per al

PClwt com per a diversos mutants, ha pro-

porcionat informacio sobre zones o residus

de la molecula que resulten clau per a un

plegament eficient, informacio i til de cara a

projectes de redisseny de l'inhibidor.

PERSPECTIVES FUTURES DE

L'ENGINYERIA DE PROTEINES

A mes de la seva apl icabilitat per aprofun-

dir en el coneixement d'una proteina, I'EP to

un gran futur per dos motius, entre d'altres.

El primer perque des del punt de vista indus-

trial es faro cada vegada mes us d'enzims en

processor de sintesi quimica, de manipulaeio

biologica, de transformacio d'alirnents, etc.,

donat que els enzims, contrariament a la ma-

jor part d'operacions de la quimica organica,

treballenen condicions de medis mescompa-

tibles amb el medi ambient i, a mes, son este-reoespecifics. El segon es que els avencos dela genomica i de la proteomica estan donant

floc a milers d'ORF, protelnes potencials a la

recerca de la seva funcio. Per descomptatque1'EP i la biocomputacio tenen molt a dir en

aquesta situacio.

Des d'un punt de vista mes concret, els

reptes que to I'EP es poden resumir en elspunts segiients:

- Ser capacos de predir el Hoc i I'efecte

d'una mutacio (o de diverses) per arribar aun objectiu determinat (millora d'activitat,

estabilitat, especificitat, etc.).- Partint d'estructures 3D de proteYnes

diana i dades de mutants especificament

dissenyats, ser capacos de dissenyar lli-gands especifics (poden ser inhibidors, far-

macs, etc.). AixO implica la capacitat de si-mular interaccions macromoleculars en el

computador o d'assajar experimentalment i

rapidarnent milions d'interaccions diferents(operacio que ja es fa avui en dia amb les bi-blioteques combinatories o fagiques).

- Del creixent coneixement de biologia

estructural , fruit dels avencos en cristal.lo-

grafia, NMR i la mateixa EP, entre ells la mi-

llora de 1 ' algoritmica d ' alineaments i la pre-

diccio computacional, arribar a comprendre

com es creen a la naturalesa noves protelnes

i noves funcions a partir de les existents.

Aquest coneixement permetria dissenyar

noves prote'ines i noves funcions tit) initio.Ara per ara no som capacos (almenys demanera rutinaria o variada) ni de dissenyar

estructures supersecundaries proteiques

suficientment compactes i estables perque

puguin ser expressades heterologament o

cristal • litzades, com moltes protelnes natu-

rals.

Tot aixo s'inscriu en el que s'anomena un

disseny racional de protelnes i consisteix no

tan sols a millorar el nostre coneixement deles regles segons les quals les protemes arri-

ben a una estructura estable amb una funciobiologica, sing tambe per la millora dels me-todes computacionals en I'us. Aixo vol diraugment de capacitat i velocitat de calcul

dels computadors, pero sobretot del dis-

seny de millors algoritmes de prediccio i si-mulacio de l'estructura de protelnes. Enqualsevol cas, es d'esperar que la interfase il'us combinat d'aproximacions experimen-tals i computacionals en EPcreixin de mane-

ra continua i es facin cada vegada mes utilsbiotecnologicament.

AGRAIMENTS

Una part del resultats aquf presentats haestat recollida per diversos membres no ci-

tats dels nostres grups de recerca , i una altra

part s'ha obtingut en col • laboracio amb elsgrups de recerca dels doctors Luis Serrano(EMBL), Antoni Planas (IQS) i Miquel Coll(CLD-CSIC ) entre d ' altres. Agraim a totsla seva disponibilitat i el seu interes en elsnostres estudis , coin tambe el suport del

Page 22: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

',I / ()(fK(IL,./-I /'II"I//'OAS,I 1/111,(, L1./ ( 1\.I1,B()/./II..!IIA1,RN//I \ iI///

Centre de Referenda en Biotecnologia (Ge-neralitat de Catalunya) i de la Fundaci6 Ma-ria Fca. de Roviralta.

BIBLIOGRAFIA GENERAL

Ri , A.; Sio RyIii iu., M. J. E.; Wi In 1, R. Protein engim'c-ring. R. IRL Press, 1992.

CLEI.AND, J.; CRAIK, C. Protein Engineering : principles andpractice. Wiley Liss, 1996.

BIBLIOGRAFIA CITADA

ALIscHci., S. F.; Gisi I, W.; Mn ii n, W.; M) F:Ia, E. W.; Lu'-

MAN, D. J. (1990). "Basic local alignment search

tool,, . J. Mol. Biol., rid in. 215, pag. 403-410.

ALoN, P.; CEDANO, J.; OI.IVA, B.; Avii.Ls, F. X.; Quiuoi, E.

(1997). «TransMem: A neural network imple-mented in Excel spreadsheets for predicting trans-membrane domains in proteins". Cmnput. Appl.Bioscicn., num. 13, pag. 231-234.

ALVARE/-SANr(x, S.; GONZAI-EZ-LAFON i, A.; Li cun, J. M.;

OLIVA, B.; Avu.rs, F. X. (1996). "Theoretical Study of

the mechanism of Carboxypeptidase A inhibition

by Zinc ions.>. New J. Chemistry, num. 20, pag. 979-

984.

BARRErr, T.; SURI_'in, C. G.; Toi.i I), S. P.; DoosoN, E. J.;Hw;iiEs, M. A. (1995). "The crystal structure of acyanogenic li-glucosidase from white clover, a fa-mily 1 glycosyl hydrolase". Structure, num. 3, pag.951-960.

C% I n<,L s, Li_; Ni \nio Ii, J.; A% ii I,,, F. X.; CARREIRA, S.;Pk (,,+Rvi s, A.; Bii i I I ER, M. (1995). "The sequenceconformation of human pancreatic procarboxy-peptidase A2. cDNA cloning, sequence analysis,and three-dimensional model,,. J. Biol. Che,n., num.270, pig. 6651-6657.

CI TANG, J-Y; CANALS, F.; S(HINDER, I'.; QLEROL, E.; AVILES,

F. X. (1994). «The disulfide folding pathway of po-tato carboxvpeptidase inhibitor,,. J. Biol. Chem.,n6m. 269, pag. 22087-22094.

CLORE:, G. M.; GRO.'iiios\, A. M.; NIECES, M.; RYAN, C. A.(1987). ,Three-dimensional structure of potato car-boxvpeptidase inhibitor in solution. A study usingnuclear magnetic resonance, distance geometryand restrained molecular dynamics". Biochemintri/,num. 26, pig. 8012-8023.

CG.or;T, J.; CEoANo, J.; Qui.Roi., F. (1994). "An Excel spread-sheet computer program for prediction of structu-ral characteristics of proteins". Comput. Appl. Bios-ci., num. 10, p5g. 495-500.

CONrl,R(<-LARA F.; SANCHEZ-RL:v, J. M.; MAreo, P. L.;Buw,os, F. J.; VENDRELL, J.; Avii.i n, F. X. (1991). Dif-ferential scanning calorimetry study of carboxy-peptidase B, procarboxypeptidase B and its globu-lar activation domain". Eur. J. Biochern., num. 200,pag. 663-670.

DAL NA, X.; OLIVA, B.; Qumsoi., E.; Avu.rn, F. X.; TAPIA, 0.(1996). ,On the sensitivity of MD trajectories tochanges in the water-protein interaction parame-ters. The potato carboxypeptidase inhibitor in wa-ter as a test case for the GROMOS force field,,. Pro-teins:Struct., Funct. Genet., num. 25, pag. 89-103.

DAYFIOFF, M. 0. (1978). "Atlas of Protein Sequence andStructure,, Natl. Biomed. Res. Found. Washington, vol5, supl. 3, pag. 345-358.

GARS, H. A.; JACKSON, R. M.; STFRNBERG, M. J. E. (1997).

"Modelling protein docking using shape comple-

mentarity, electrostatics and biochemical infornla-

tion". J. Mol. Biol., num. 272, pag 106-120.

GAR('IA-SAE/, I.; REVERTER, D.; VENDRFI.I., J.; AviLES, F. X.;

COLL, M. (1997). "The three-dimensional structureof human procarboxypeptidase A2. Decipheringthe basis of the inhibition, activation and intrinsicactivity of the /ymogen>". LMBO J., num. 16, p,tg.6906-6913.

HAI IN, M.; PONS, J.; PLANAS, A.; Qumsoi., E.; HEINEMANN,

U. (1995). "Crystal structure of Bacillus licheniformis1,3-1,4-lI-D-glucan 4-glucanohydrolase at 1.8A re-solution,,. FIBS Letters, num. 374, p5g. 221-224.

HENIKOFF, S.; HFNIKOF , J. C. (1992). "Amino acid substi-tution matrices from protein blocks". Proc. Natl.Acad. Sci. LISA, num. 89, pag. 10915-10919.

HFNRISSAi, B. (1991). "A classification of glycosyl hy-drolases based on amino acid sequence similarity,,.Biocliem. J., num. 280, p5g. 309-306.

Ho;, P. B.; CONDRON, R.; TRAEGER, J. C.; MCAUI.IFFe, J. C.;

SroNF, B. A. (1992). "Identification of glutamic acid

105 at the active site of Bacillus arnyloliqucfaciens 1,3-

1,4-B-D-glucan 4-glucanohydrolase using epoxi

based inhibitors". J. Biol. Chem., num. 267, pag.

25059-25066.

H(x)i', T. P.; W(x)[)ti, K. R. (1981). "Prediction of proteinantigenic determinants from amino acid sequence".Proc. Natl. Acad. Scion. USA, num. 78, pag. 3824-3828.

JoNES,T. H,; THIR('P, S. (1986). "Using known substruc-tures in protein model building and crystallo-graphy". EMBO J., num. 5, p5g.819-822.

JONrs, D. T.; TA) I OR, W. R.; 'I i u'RNR'N, J. (1992). "A newapproach to protein told recognition". Nature,num. 358, pag. 86-89.

JLN(OSA M.; PONS, J.; Doi, T.; Qui o'i., F.; PIANAS, A.(1994). "Identification of active site carboxylic resi-dues in Bacillus licheniformis endo-1,3-1,4-D-glucan4-glucanohydrolase by site-directed mutagenesis".1. Biol. Cheni., num. 269, pag.14530-14535.

Page 23: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

ti.A(,I.AIFRI.I /)F PROI7i1\L.5 -1

Jt \cutiA, M.; PO\s, J.; PLANAS, A.; QuoROE, E. (1994). « im-

proved efficiency in site-directed mutagenesis by

PCR using a Pyrococcus sp GB-D polvmerase". Bio-

Tcchniqucs, num. 16, pag. 820-821.

KING, R. D.; SAQ1, M.; SAyuF:, R.; SI HNSIRC, M. J. E. (1997).

"DSC: Public domain protein secondary structure

prediction'. Cornput. Appl. Biosci., num. 13, pag.

473-474.

Krrr, I.; D(x)LrrrLE, R. F. (1982). ,A simple method for

displaying the hydropathic character of a protein' .

1. Mel. Biol., num.157, pag.105-132.

Lit , I I.; Mt I IIR-Pi At 111, F.; \,\\ GuNSi I RF\, W. F. (1996).

«A combined Quantum/Classical Molecular Dy-

namics Study of the catalytic mechanism of HIV

protease'. J. Mel. Biol., num. 261, pag. 454-469.

LLUBERAS, J.; PtsRE/-PONS, J. A.; Qur:Rot., E. (1991). "Mole-

cular cloning, expression and nucleotide sequence

of the endo-13-l,3-1,4-D-glucanase gene from Bacil-

lus licheniferruis. predictive structural analyses of

the encoded polvpeptide". Eur. J. Biochern., num.

197, pag. 337-343.

MARiyO, C.; Mot-i\,\, M. A.; CANTvIS, F.; Avit.is, F. X.;

Qur:S S., E. (1994). "Overproduction of a recombi-

nant carboxypeptidase inhibitor protein by optimi-

zation of the fermentation conditions". Appl. Mi-

crobiol. Biotechnol., nu m. 41, pag. 632-637.

MARK, A. E. ; VAN GVNSrrar.N, W. F. (1994). <Deconnposi-

tion of the free energy of a system in terms of speci-

fic interactions. Implications for theoretical and ex-

perimental studies". J. Mel. Biol., num. 240, pag.

167-176.

MCCARrER, J. D.; Wrrtteas, S. G. (1994). "Mechanisms of

enzymatic glycoside hydrolysis". Curr. Op. Struct.

Biol., num. 4, pag. 885-892.

MOi.iNA, M. A.; Avii rs, F. X.; QUEROr, E. (1992). "Potato

carboxypeptidase inhibitor synthetic gene cloned

and expressed in an active form in Escherichia soli".Gene, num. 116, pag. 129-138.

Mot i\,\, M. A.; MARINO, C.; Oi n A, B.; Av n.rs, F. X.; QuE-

Roi , E. (1994). ,,The C-tail Valine is a key residue for

the stabilization of the complex between potato in-hibitor and carboxypeptidase A , .. J. Biol. Chem.,

num. 269, pag. 21467-21472.

Mui.t.ts, K.; FERRr, F.; Gass, R., eds. (1994). "The polvme-

rasechain reaction". Birkh,iuser, Boston.

Mi yO/, V.; Sr rr.AyO, I. (1997). "Development of themultiple sequence approximation within theAGADIR model of a-helix formation. Comparisonwith the /inn-Bragg and Lifson-Roig forma-lisms,. Biopol., num 41, pag. 495-509.

NAKAYAME, K. L.; EcKS1I IN, F. (1986). "Inhibition of res-

triction endonuclease Neil cleavage by phospho-

thiolate groups and its application to oligonucleo-

tide-directed mutagenesis'. Nucl. Acids Res., num.

14, pag. 9679-9698.

NEE:ULEMAN, S. B.; Wu N"( o, C. D. (1970). "A general me-

thod applicable to the search for similarities in the

aminoacid sequence of two proteins.' J. Mol.Biol.,

num. 48, pag. 443-453.

Oi.nA, B.; DAURA, X.; NILSSON, 0.; QurROi, E.; Avii.is, F.

X.; TAPIA, O. (1995). "Structure and fluctuation pat-

terns of potato carhoxypeptidase A inhibitor pro-

tein in aqueous solution. A molecular dynamics

study'. Eur. Biophys. J., num. 24, pag.1-12.

Oi.ivA, B.; BAIts, P.; QeEROI, E.; A\ ii [S, F. X.; SrERNRrRG,

M. J. E. (1997). "An automatic classification of the

structure of protein loops,. J. Mel. Biol., num. 267,

pa g.1-17.

Pu.ARsON, W. R.; LPMAN, D. J. (1988). "Improved tools for

biological sequence comparison,). Proc. Natl. Acad.

Sci. USA, num. 85, pag. 2444-2448.

PERU-PONS, J. A.; CAYETANO, A.; 1ZEI1(^R[xisA, X.; Linull-

RAS, J.; GUASCII, A.; QuERor, E. (1994). "A (1-glucosi-

dase gene from Strephnnyces sp ATCC 11238. Mole-

cular cloning, nucleotide sequence, purification

and characterization of a new member of family 1

glycosyl hvdrolases,. Eur. J. Biochcru., num. 223,

pig. 557-565.

PFRE.7-PONS, J. A.; I'AUROS, E.; Qeu sni, F. (1995). "Predic-

tion and Fourier transform infrared spectroscopy

estimation of the secondary structure of a recombi-

nant (3-glucosidase from Streptomyces sp (ATCC

11238)". Biocltern. J., num. 308, pig. 791-794.

PLANAS, A.; JUNG SA, M.; CAYFIANO, A.; QuERoi, E.(1992a). "Studies on the Bacillus licheniforuns endo-

0-1,3-1,4-glucanase: characterization and kineticanalyses'. Appl. Microbiol. Biotechnol., num. 37,

pag. 583-589.

PI ANA,, A.; JoNCrnA, M.; Li OsrRAS, J.; QiIiwt, E. (19926).

"Essential catalytic role of GIul34 in endo-R-1,3-

1,4-D-glucan 4-glucanohydrolase from Bacillus Ii-clreuifornus as determined by site-directed mutage-nesis". FEBS Lcttcrs, num. 308, pag. 141-145.

PONS, J.; QurROr, F.; PIANAS, A. (1995). ,Contribution of

the disulfide bridge to the stability of Bacillus liclre-niforrnis endo-1,3-1,4-D-glucan 4-glucanohvdrola-

se,. Prot. Engineer., num. 8, pag. 939-945.

PONS, J.; QUEROE, E.; I'r,vNAs, A. (1997). ,Mutational

analysis of the major loop of Bacillus 1,3-1,4-R-D-

glucan 4-glucanohvdrolase: effects o protein stabi-lity and substrate binding, > . J. Biol. Chem., num. 272,p3g. 13006-13012 (1997).

Qut Roi, E.; PAiRCK, E.; JUNCOSA, M.; P[ ANA,.,, A.; Li.osE-RAS, J. (1992). "Secondary structure of a Bacillus

endo-Ld-1,3-1,4-D-glucanase: a study by FourierTransform Infrared Spectroscopy and predictivemethods". Biochem. Biophys. Rcs. Cornruun., num.184, pag. 612-617.

QLIRoi E.; Priori-PONS, J. A.; MOZO-Vu.iARiAS, A. (1996).

"Analysis of conformational characteristics related

to protein thermostability". Prot. Engineer., num. 9,

pag. 265-271.

Page 24: ENGINYERIADEPROTEINES:COMPLEMENTARIETATDELES ... · I)in

1, GI / R01 , ./ I l ' I/?/ / 1'U \ \ I 1 7 1 1 F(. -IS. / ( 1\ 1/, , B Hi lI I..! 1 7: \ l l 1Ll .

REFS, D. C.; LIi-sc(>MB, W. N. (1982). ,Refined Crystal

Structure of the Potato Inhibitor Complex of Car-

boxypeptidase A at 2,5 A of Resolution'). J. Mol.

Biol., n6m.160, pag. 475-498.

REvixiis D.; VIE.EGAs, V.; VINIUSA, S.; VENUIM ], I.;

AVILES, F. X. (1998). ,Human procarboxypeptidase

A2: overexpression in Pichia pastoris and detailed

characterization of its activation pathway". J. Biol.

Chem., num. 273, pag. 3535-3541.

Rcxr, B.; SANDER, C. (1993). ,Prediction of protein secon-

dary structure at better than 70% accuracy'>. J. Mol.

Biol., num. 232, pag. 584-599.

Rcxr, B.; CnsAi>io, R.; FARM U1, P.; SAND] R, C. (1995).

(,Transmembrane helices predicted at 95% accu-

racy),. Prot. Science, num. 4, pag. 521-533.

RUEINO, S. D.; DONAn, L. E.; CANARD, L. H. J.; BLL;NDIiLF,

T. L. (1997). ,Predicting the Conformational Class

of Short and Medium Size Loops Connecting Re-

gular Secondary Structures: Application to Com-

parative Modelling)'. J. Mol. Biol., num. 267, pag.

352-367.

RYAN, C. A. (1989). ,Proteinase InhibitorGene Families,

Strategies for Transformation to Improve Plant De-

fenses Against Herbivores, >. BioEssays, num. 10,

pag. 20-24.

SANCFiiz-Ruiz, J. M.; Loi'i z, J. L.; MA ISO, P. L.; VILANOVA,

M.; Si sx,s, M. A.; Avu E5, F. X. (1991)., Analysis of the

thermal unfolding of porcine carboxypeptidase A

and its functional pieces by differential scanningca-

lorimetry>'. Eur. J. Biochem., num. 176, pag. 225-230.

SAD, A.; Bi.uNDF:l.i., T. L. (1993). ,Comparative Protein

Modelling by satisfaction of spatial restraints''. J.

Mol. Biol., num. 234, pag. 779-815.

Slrn., M. J.; WEIICKUS, S. (1992). ,Detection of native-

like models for amino acid sequences of unknown

three-dimensional structure in a data base of

known protein conformations'>. Proteins: Struc.

Func. Genet., num. 13, pag. 258-271.

SMITES, M. (1983). ,In vitro mutagenesis>'. Ann. Rev. Ge-

net., num. 19, pag. 423-462.

Top}IAM, C. M.;'FHORMAS, P.; OVERINGION, J. P.; JOHNSON,

M. S.; EisFooirNGER, F.; Bi E xnri i, T. L. (1991). "An

assesment of COMPOSER: a rule based approach

to modelling protein structure>>. Riochem. Soc.

Symp., num. 57, pag.1-9.

TRIMBL;R, D. E.; WARREN, R. A. J.; WimERS, S. C. (1992).

,Region-directed mutagenesis of residues sur-

rounding the active site nucleophile in (3-glucosi-

dase from AgrobacteriuIn faecalis>'. j. Biol. Chem.,

num. 267, pag.10248-10251.

VIGLI RA, A. R.; VILLE(AS, V.; Ay ii.Es, F. X.; SF_RRANO, L.

(1996). ,Native-like favourable helical local inte-

ractions can accelerate protein folding" . Fold. Des.,

num. 2, pag. 23-33.

VILLF:GAS, V.; AZcAGA, A.; CAIASGS, LL.; Rsvss1n, I).;

MAH:o, P. L.; Avues, F. X.; SF-RRANO, L. (1995a).

,Evidence for a two-state transition in the folding

process of the activation domain of human pro-

carboxypeptidase A2,,. Biochemistry, num. 34,

pag. 15105-15110.

VIu.FCas, V.; Vio.ERA, A. R.; A\ ii is, F. X.; SERRANO, L.

(19956). ,Stabilization of proteins by rational de-

sign of a-helix stability using helix-coil transition

theory". Folding awl Design, num. 1, pag. 29-34.

WnHERS, S. G.; SiREEI, I. 1'. (1988). ,Identification of a

covalent a-D-glucopyranosvl enzyme intermedi-

ate formed on a I3-glucosidase". J. Am. Chem. Soc.,

num. 110, pag. 8551-8553.