Un supuesto frecuente en la literatura científica es el
de que los dominios de las proteínas pueden recombinarse fácilmente para formar
nuevos pliegues. En Darwin’s Doubt,
Stephen Meyer se ocupa de este tema en detalle (véase el capítulo 11). En el
transcurso de este y el próximo artículo, ampliaré brevemente lo que se dijo
allí.
Definiendo
términos.
Antes de continuar, puede que sea util definir ciertos
términos y conceptos clave. Me referiré con frecuencia a los "exones"
y los "intrones". Los exones son secciones de los genes que codifican
para las proteínas; mientras que los intrones son aquellas secciones de los
genes que no codifican para proteínas.
Otro concepto es el intercambio de dominios (domain
shuffling). Esta es la hipótesis de que nuevos pliegues de proteínas pueden ser
creados por recombinación de dominios ya existentes. Se cree que esto se
consigue moviendo los exones de un lado del genoma a otro (intercambio de
exones o “exon shuffling”). Hay varias formas en las que se puede realizar el exon
shuffling, y es a este tema al que ahora me dirijo.
Mecanismos de Exon
Shuffling.
Existen diferentes maneras en las que se puede dar el
exon shuffling. Puede ser mediado por transposones, o puede ocurrir como
resultado del entrecruzamiento durante la meiosis y la recombinación entre
secuencias no-homólogas o (menos frecuente) secuencias poco homologas de ADN. El
splicing alternativo (empalme alternativo) también se cree que desempeña un rol
en facilitar el exon shuffling.
Cuando el domain shuffling se produce como resultado del entrecruzamiento
durante la recombinación sexual, se hipotetiza de que se lleva a cabo en tres
etapas (denominada "hipótesis de modularización"). En primer lugar,
los intrones se encuentran en las posiciones que corresponden a los límites de
dominio, formando una "protomodulo." Los intrones son típicamente más
largos que los exones, y por lo tanto la mayoría de los eventos de entrecruzamiento
tienen lugar en las regiones no codificantes. En segundo lugar, el protomodulo
recién formado se somete a duplicación en tándem. En tercer lugar, la
recombinación intrónica facilita el movimiento del protomodulo a un gen
diferente y no-homologo.
Otro mecanismo hipotético de exon shuffling involucra elementos
de transposición como retroelementos LINE-1 y transposones Helitron, así como retroelementos
LTR. Los elementos LINE-1 se transcriben en un mRNA que especificaa a un par de
proteínas denominadas ORF1 y ORF2, las cuales son esenciales para el proceso de
transposición. LINE-1 se asocia frecuentemente con el ADN adyacente a 3’, transportando
la secuencia adyacente a un nuevo locus en otro lugar del genoma (Ejima y Yang,2003;. Moran et al, 1999; Eickbush, 1999). Esta asociación puede ocurrir si la
señal de poliadenilación del elemento LINE-1 es pasada por alto durante la
transcripción, haciendo que los exones de aguas abajo se incluyan en la
transcripción de ARN. Como los LINE-1 son elementos de "copiado y
pegado" (es decir, se transponen mediante un intermediario de ARN), la
secuencia donante permanece inalterada.
Los retrotransposones LTR también han sido planteados
como facilitadores del exon shuffling, especialmente en el arroz (por ejemplo,
Zhang et al, 2013;. Wang et al, 2006.). Los retrotransposones LTR poseen un gen
gag y un gen pol. El gen pol se
traduce en una poliproteína compuesta de una proteasa aspártica (que escinde la
poliproteína), y varias otras enzimas, incluyendo la transcriptasa inversa (que
transcribe el ARN en ADN), una integrasa (utilizada para integrar el elemento
en el genoma huésped), y RNasa H (que sirve para degradar la cadena de ARN del
híbrido ADN-ARN, que resulta en un ADN de cadena sencilla). Al igual que los
elementos LINE-1, los retrotransposones LTR transponen en forma de
"copiado y pegado" a través de un intermediario de ARN. Hay un buen
número de subfamilias de retrotransposones LTR, incluyendo retrovirus
endógenos, Bel/Pao, Ty1/copia , y el Ty3/gypsy.’
El splicing alternativo por omisión de exones (exon
skipping) también se cree que participa en el exon shuffling (Keren et al.,2010). El splicing alternativo permite a los exones de un transcripto pre-ARNm empalmarse
en un cierto numero de isoformas diferentes para producir múltiples proteínas a
partir de la misma transcripción. Esto se facilita por la unión del sitio
donante 5’ de un intrón al sitio 3’ de otro intrón aguas abajo, produciendose
como resultado el "salteo" de los exones que se encuentran en el
medio. Este proceso puede resultar en intrones que flanquean los exones. Si
esta estructura genómica se vuelve a insertar en otro lugar en el genoma, el
resultado es un exon shuffling.
Por supuesto, hay otros mecanismos que se cree que participan
en el exon shuffling. Pero esto será suficiente para nuestra explicación
presente. A continuación, vamos a ver la evidencia a favor y en contra del exon
shuffling como hipótesis para el origen de nuevos pliegues en las proteínas.
Intrones tempranos
vs. intrones tardíos.
Se planteó primero la hipótesis —después del
descubrimiento de los intrones en los genes de los vertebrados— de que los
intrones podrían haber contribuido a la evolución de las proteínas. En un
artículo de 1978 en Nature, Walter
Gilbert propuso por primera vez que los exones podrían mezclarse de forma
independiente por recombinación que ocurría dentro de los intrones (Gilbert,1978). Gilbert también propuso la hipótesis de que los intrones son reliquias
de datos del mundo del ARN (Gilbert, 1986). De acuerdo con la hipótesis de los
"exones tempranos", todos los genes codificadores de proteínas se crearon
a partir de módulos de exones —codificantes de elementos estructurales
secundarios (tales como α-hélices, β-hojas, péptidos señal, o hélices transmembrana)
o dominios plegables— por un proceso de recombinación mediado por intrones
(Gilbert y Glynias, 1993;. Dorit et al, 1990).
El escenario alternativo de "intrones tardíos"
consiste en la hipótesis de que los intrones aparecieron mucho más tarde, en
los genes eucariotas (Hickey y Benkel, 1986; Sharp, 1985; Cavalier-Smith, 1985;
Orgel y Crick, 1980). Este escenario vuelve discutible al exon shuffling como
explicación del orígen de las proteínas más antiguas.
La hipótesis de los "intrones tempranos" fue la
visión dominante de la década de 1980. La evidencia frecuentemente citada para
ello fue la creencia generalizada de que existe una correlación entre la
estructura exón-intrón y la estructura secundaria de la proteína.
Sin embargo, desde mediados de la década de 1980, este
punto de vista se hizo cada vez más insostenible cuando información nueva salió
a la luz (por ejemplo, véase Palmer y Logsdon, 1991, y Patthy, 1996; 1994;
1991; 1987) que levantó dudas sobre la existencia de una correlación general
entre la estructura de las proteínas y la estructura exón-intrón. Tal
correlación no se respeta en muchos genes codificadores de proteínas antiguas. Además,
los ejemplos más claros de exon shuffling todos tuvieron lugar tardíamente en
la evolución de los eucariotas, volviendose significativos sólo en el tiempo de
la aparición de los primeros animales multicelulares (Patthy, 1996; 1994). Incluso,
el análisis de las uniones del splicing de intrones muestra un patrón que
sugiere exons shuflings tardíos. La ubicación en la que se insertan los
intrones e interrumpen marco de lectura de la proteína determina si los exones
pueden ser recombinados, duplicados o suprimidos por recombinación intrónica
sin alterar el marco de lectura aguas abajo de la proteína modificada (Patthy, 1987). Los intrones pueden agruparse de acuerdo a tres "fases": los
intrones de fase 0 se insertan entre dos codones consecutivos; los intrones de
fase 1 se insertan entre el primer y segundo nucleótido de un codón; y los
intrones de fase 2 se insertan entre el segundo y tercer nucleótido.
Por lo tanto, si el exon shuffling jugó un papel
importante en la evolución de proteínas, deberíamos esperar que exista una
distribución de las distintas fases que sea característica. Pero los módulos
hipotéticos de las proteínas antiguas no se ajustan a tales expectativas
(Patthy, 1991; 1987).
Está claro, entonces, que el exon shuffling es, por lo menos,
poco probable en el origen de las
proteínas más antiguas que han surgido en la historia de la vida. Pero, ¿es
este mecanismo adecuado para explicar el origen de las proteínas más recientes,
como las que surgen en la evolución de los eucariotas?
La evidencia del
Exon Shuffling.
Entonces, ¿cuales son los mejores argumentos del exon
shuffling? Si la tesis es correcta, se podría predecir que los limites de un
exón deberían estar fuertemente correlacionados con los dominios de las
proteínas. En otras palabras, un exón debe codificar para un único dominio de
una proteína. Existe evidencia que apunta al hecho de que hay una correlación
estadísticamente significativa entre los límites de un exon y los dominios de
una proteína (por ejemplo, ver Liu et al., 2005 y Liu y Grigoriev, 2004).
Sin embargo, hay muchos, muchos ejemplos en los que esta
correspondencia no se sostiene. En muchos casos, es un solo exon codificando
para varios dominios. Por ejemplo, los genes protocadhedrin implican típicamente exones largos codificando para
múltiples dominios (Wu y Maniatis, 2000). En otros casos, se requieren
múltiples exones para especificar un único dominio (por ejemplo, véase
Ramasarma et al, 2012;. O Buljan et al, 2010.).
Otro argumento que aporta al papel del exon shuffling en
la evolución de las proteínas es la distribución de fases de intrones que se
encuentran en los exones que codifican para los dominios de proteínas en los
seres humanos. En 2002, Henrik Kaessmann y sus colegas informaron que
"intrones en los límites de los dominios muestran un notable simetría de
combinaciones de fase (es decir, 0-0, 1-1 y 2-2), mientras que los intrones que
no se encuentran en los limites de un dominio, no muestran un nivel elevado de
simetría" (Kaessmann , 2002). Su conclusión fue que "el exon
shuffling esta involucrado
principalmente en el reordenamiento de dominios estructurales y funcionales
como un conjunto." También realizaron un análisis similar en el gusano
nematodo Caenorhabditis elegans,
encontrando que "Aunque los datos de C.
elegans generalmente coinciden con los patrones humanos, hemos identificado
un menor número de dominios delimitados por intrones en este organismo, lo cual
es congruente con el hecho de que los genes de C. elegans tienen una complejidad menor. "
Otra línea de evidencia se refiere a genes que parecen ser
quimeras de los genes parentales. Estos son típicamente asociados con los
signos indicativos de su modo de origen. Un ejemplo famoso es el gen jingwei en
Drosophila, el cual pudo haber surgido cuando "la secuencia del ARN
mensajero ya procesado de la Adh [alcohol deshidrogenasa]pasó a formar parte de
un nuevo gen funcional mediante la captura de varios exones e intrones aguas
arriba de un gen no relacionado" (Long y Langley, 1993).
Sin embargo, debemos tener cuidado de no confundir el
patrón observado de distribución de fases de intron, o asignación de exón/dominio,
con una prueba de que el exon shuffling es en realidad el proceso por el cual
surgió este patrón. Quizás la ascendencia común sea la causa, pero esto debe
ser demostrado antes de asumirse. Es deber del biólogo determinar si los
mecanismos de azar no-inteligentes en realidad pueden producir nuevos genes de
esa manera. Es a esta cuestión a la que ahora me dirijo.
Dificultades del
modelo a la hora de explicar el origen de los pliegues de las proteínas.
A pesar de que la hipótesis del exon shuffling tiene
algunos elementos atractivos, la verdad es que presenta una serie de problemas.
Por un lado, el modelo en su núcleo presupone
la existencia previa de dominios de proteínas. La estructura secundaria de una
proteína (hélices α y hojas β) existen en forma estable sólo en el contexto de las
estructuras terciarias en las que se encuentran. En otras palabras, el nivel de
dominio es el nivel mas elemental en el que existen módulos estructurales
estables e independientes. Esto deja en un aura de misterio la cuestión sobre
el origen de los dominios en sí mismos. Incluso, se ha demostrado que los
dominios proteína estables y funcionales son raros en el espacio total de
secuencias posibles de aminoácidos (por ejemplo, Axe, 2010; Axe, 2004;. Tayloret al, 2001; Keefe y Szostak, 2001; Reidhaar-Olson y Sauer, 1990; Salisbury,1969) .
Un estudio relativamente reciente examinó numerosas combinaciones
diferentes de elementos estructurales secundarios en E. coli (hélices α y hojas β
y bucles), ensamblándose entre sí "de forma semi aleatoria; secuencias
compuestas de hasta 800 residuos de aminoácidos" (Graziano et al., 2008 ).
Los investigadores analizaron 108 variantes en búsqueda de rasgos
que pudieran sugerir una estructura plegada. No encontraron estructuras de
plegado de proteína. Al informar sobre este estudio, Axe (2010) escribe:
“Luego de la comprobación definitiva de que los candidatos más prometedores no estaban plegados adecuadamente, los autores concluyeron que "los clones seleccionados no deben, por lo tanto, ser considerados como similares a proteínas 'nativas', sino más bien a un tipo de forma de ‘globulo fundido’”, con lo cual quieren decir que la estructura secundaria está presente sólo transitoriamente, menos de un parpadeo, para luego desaparecer de la cadena, la cual es compacta pero móvil. Esto contrasta con la estructura nativa, en donde la estructura secundaria está programada para formar un pliegue terciario estable y bien definido. Esta investigación concuerda bien con lo que debieramos esperar en vista de las consideraciones hechas arriba. De hecho, sería muy desconcertante si la estructura secundaria hubiese llegado a ser modular”.
"Para que aquellos elementos puedan trabajar como
robustos módulos," explica Axe, "su estructura tendría que ser
efectivamente independiente del contexto, lo que les permitiría ser combinados
en cualquier número de formas para formar nuevos pliegues." Sin embargo, en
el caso de la estructura secundaria de la proteína este requisito no se cumple.
El modelo también parece exigir que la diversidad y
disparidad de las funciones desempeñadas por las proteínas en la célula puedan
tener su origen, en principio, mezclando y combinando los dominios
pre-existentes. Pero esto presupone la capacidad de los procesos evolutivos
ciegos de ser una especie de "caja de herramientas" específica de
dominios que se pueden recombinar de diversas maneras para producir nuevas funciones.
Esto parece poco probable, especialmente a la luz de la estimación de que
"se necesitan 1.000 a 7.000 exones para construir todas las
proteínas" (Dorit et al., 1990). En otras palabras, un conjunto de
herramientas primordial de miles de diversos dominios de proteína debe ser
construido antes de que la hipótesis del exon shuffling se convierta en una
posibilidad. Y aun así hay otros serios problemas.
Otra cuestión se refiere a la compatibilidad de interfaz
[o superficie de contacto]. La hipótesis del domain shuffling, en muchos casos,
requiere la formación de nuevas interfaces de unión. Dado que los aminoácidos
que componen las cadenas de polipéptidos se distinguen entre sí por la
especificidad de sus cadenas laterales, las interfaces de union que permiten a
las unidades de estructura secundaria (hélices α y hojas β) unirse para formar
elementos de estructura terciaria depende de una secuencia específica de
aminoácidos. Los dominios que deben unirse e interactuar unos con otros no
pueden simplemente combinarse entre ellos como los ladrillos del LEGO.
En su artículo de 2010 en la revista BIO-Complexity, Douglas Axe informa sobre un experimento realizado
utilizando enzimas β-lactamasas, el cual ilustra esta dificultad (Axe, 2010).
Echa un vistazo a la siguiente figura, tomada del paper:
La mitad superior de la figura (con la etiqueta
"A") revela la estructura de la TEM-1 β-lactamasa (izquierda) y el
PER-1 β-lactamasa (derecha). La mitad inferior de la figura (con la etiqueta
"B") revela las alineaciones que forman la “columna vertebral” de los
dos dominios correspondientes de ambas proteínas. Note el nivel elevado de
similitud estructural entre las dos enzimas. Axe intentó recombinar secciones
de los dos genes para producir una proteína quimérica a partir de los dominios
de color verde y rojo. Dado que las dos enzimas parientes exhiben niveles extremadamente
altos de similitud estructural y funcional, debería esperse que el hibrido
funcione. No obstante, ninguna función detectable fue identificada en la construcción
quimérica, presumiblemente como consecuencia de la disimilitud sustancial entre
las respectivas secuencias de aminoácidos y la incompatibilidad interfaz entre
los dos dominios.
Este no es de ninguna manera el único estudio que
demuestra la dificultad del exon shuffling para formar nuevas proteínas
funcionales. Otro estudio realizado por Axe (2000) describe "un conjunto
de secuencias híbridas" teniendo en cuenta que existe un "50% de
identidad entre la β-lactamasa TEM-1 y la β-lactamasa de Proteus mirabilis", las cuales fueron creadas de tal manera
que el "los híbridos acertaron la secuencia de TEM-1 excepto en una región en el extremo C-terminal, que
estaba compuesta por componentes al azar de las dos secuencias parentales".
¿Los resultados? "Todos estos híbridos son biológicamente inactivos."
De hecho, en los pocos casos en que las quimeras de
proteínas sí poseen un función detectable, solo funciona por la precisa razón de
que los investigadores utilizaron un algoritmo (desarrollado por Meyer et al., 2006) para seleccionar
cuidadosamente en una proteína las secciones que poseen el menor número de
interacciones de cadena lateral con el resto del pliegue, y eligieron proteínas
parentales con relativamente alta similitud de secuencia (Voigt et al., 2002).
Esto sólo sirve para subrayar el problema. Incluso en el estudio Voigt, la tasa
de éxito fue bastante baja, incluso bajo circunstancias muy favorables, con
sólo uno de cada cinco quimeras presentando funcionalidad discernible.
Conclusión
Para concluir, si bien hay algunas pruebas de inferencia
indirecta a favor del exon shuffling en la evolución de proteínas, una
consideración acerca de cómo este proceso podría ocurrir en realidad revela que
la hipótesis en sí está repleta de serias dificultades.
Autor: Jonathan McLatchie – Tiene un MRes en biología evolutiva y sistematica de la Universidad de Glasgow. Actualmente estudia Medical and Molecular Biosciences en Newcastle University y es redactor de Evolution News and Views.
Traductor: Daniel Alonso - Estudia Licenciatura en Ciencias Biológicas en UNT, Argentina.
Fuente: http://www.evolutionnews.org/2013/07/exon_shuffling074401.htmll (Parte I) y http://www.evolutionnews.org/2013/07/an_evaluation_o074441.html (Parte II)
No hay comentarios :
Publicar un comentario