2014-06-14

Exon Shuffling en la Evolución de los Genes —Jonathan McLatchie



Un supuesto frecuente en la literatura científica es el de que los dominios de las proteínas pueden recombinarse fácilmente para formar nuevos pliegues. En Darwin’s Doubt, Stephen Meyer se ocupa de este tema en detalle (véase el capítulo 11). En el transcurso de este y el próximo artículo, ampliaré brevemente lo que se dijo allí.

Definiendo términos.

Antes de continuar, puede que sea util definir ciertos términos y conceptos clave. Me referiré con frecuencia a los "exones" y los "intrones". Los exones son secciones de los genes que codifican para las proteínas; mientras que los intrones son aquellas secciones de los genes que no codifican para proteínas.




Las proteínas tienen múltiples niveles estructurales. La estructura primaria se refiere a la secuencia lineal de aminoácidos que comprenden la cadena de proteína. Cuando segmentos dentro de esta cadena se pliegan en estructuras como hélices y bucles, esto se conoce como estructura secundaria. Las unidades de estructura secundaria incluyen hélices α y hoja β. La estructura terciaria es la forma biológicamente activa de la proteína, y se refiere al embalaje de elementos estructurales secundarios en dominios. Puesto que la estructura terciaria de una proteína optimiza las fuerzas de atracción entre los aminoácidos, es la forma más estable de la proteína. Cuando múltiples dominios plegados están dispuestos en un complejo de múltiples subunidades, eso se conoce como una estructura cuaternaria.

Otro concepto es el intercambio de dominios (domain shuffling). Esta es la hipótesis de que nuevos pliegues de proteínas pueden ser creados por recombinación de dominios ya existentes. Se cree que esto se consigue moviendo los exones de un lado del genoma a otro (intercambio de exones o “exon shuffling”). Hay varias formas en las que se puede realizar el exon shuffling, y es a este tema al que ahora me dirijo.

Mecanismos de Exon Shuffling.

Existen diferentes maneras en las que se puede dar el exon shuffling. Puede ser mediado por transposones, o puede ocurrir como resultado del entrecruzamiento durante la meiosis y la recombinación entre secuencias no-homólogas o (menos frecuente) secuencias poco homologas de ADN. El splicing alternativo (empalme alternativo) también se cree que desempeña un rol en facilitar el exon shuffling.

Cuando el domain shuffling se produce como resultado del entrecruzamiento durante la recombinación sexual, se hipotetiza de que se lleva a cabo en tres etapas (denominada "hipótesis de modularización"). En primer lugar, los intrones se encuentran en las posiciones que corresponden a los límites de dominio, formando una "protomodulo." Los intrones son típicamente más largos que los exones, y por lo tanto la mayoría de los eventos de entrecruzamiento tienen lugar en las regiones no codificantes. En segundo lugar, el protomodulo recién formado se somete a duplicación en tándem. En tercer lugar, la recombinación intrónica facilita el movimiento del protomodulo a un gen diferente y no-homologo.

Otro mecanismo hipotético de exon shuffling involucra elementos de transposición como retroelementos LINE-1 y transposones Helitron, así como retroelementos LTR. Los elementos LINE-1 se transcriben en un mRNA que especificaa a un par de proteínas denominadas ORF1 y ORF2, las cuales son esenciales para el proceso de transposición. LINE-1 se asocia frecuentemente con el ADN adyacente a 3’, transportando la secuencia adyacente a un nuevo locus en otro lugar del genoma (Ejima y Yang,2003;. Moran et al, 1999; Eickbush, 1999). Esta asociación puede ocurrir si la señal de poliadenilación del elemento LINE-1 es pasada por alto durante la transcripción, haciendo que los exones de aguas abajo se incluyan en la transcripción de ARN. Como los LINE-1 son elementos de "copiado y pegado" (es decir, se transponen mediante un intermediario de ARN), la secuencia donante permanece inalterada.

Los retrotransposones LTR también han sido planteados como facilitadores del exon shuffling, especialmente en el arroz (por ejemplo, Zhang et al, 2013;. Wang et al, 2006.). Los retrotransposones LTR poseen un gen gag y un gen pol. El gen pol se traduce en una poliproteína compuesta de una proteasa aspártica (que escinde la poliproteína), y varias otras enzimas, incluyendo la transcriptasa inversa (que transcribe el ARN en ADN), una integrasa (utilizada para integrar el elemento en el genoma huésped), y RNasa H (que sirve para degradar la cadena de ARN del híbrido ADN-ARN, que resulta en un ADN de cadena sencilla). Al igual que los elementos LINE-1, los retrotransposones LTR transponen en forma de "copiado y pegado" a través de un intermediario de ARN. Hay un buen número de subfamilias de retrotransposones LTR, incluyendo retrovirus endógenos, Bel/Pao, Ty1/copia , y el Ty3/gypsy.’

El splicing alternativo por omisión de exones (exon skipping) también se cree que participa en el exon shuffling (Keren et al.,2010). El splicing alternativo permite a los exones de un transcripto pre-ARNm empalmarse en un cierto numero de isoformas diferentes para producir múltiples proteínas a partir de la misma transcripción. Esto se facilita por la unión del sitio donante 5’ de un intrón al sitio 3’ de otro intrón aguas abajo, produciendose como resultado el "salteo" de los exones que se encuentran en el medio. Este proceso puede resultar en intrones que flanquean los exones. Si esta estructura genómica se vuelve a insertar en otro lugar en el genoma, el resultado es un exon shuffling.

Por supuesto, hay otros mecanismos que se cree que participan en el exon shuffling. Pero esto será suficiente para nuestra explicación presente. A continuación, vamos a ver la evidencia a favor y en contra del exon shuffling como hipótesis para el origen de nuevos pliegues en las proteínas.

Intrones tempranos vs. intrones tardíos.

Se planteó primero la hipótesis —después del descubrimiento de los intrones en los genes de los vertebrados— de que los intrones podrían haber contribuido a la evolución de las proteínas. En un artículo de 1978 en Nature, Walter Gilbert propuso por primera vez que los exones podrían mezclarse de forma independiente por recombinación que ocurría dentro de los intrones (Gilbert,1978). Gilbert también propuso la hipótesis de que los intrones son reliquias de datos del mundo del ARN (Gilbert, 1986). De acuerdo con la hipótesis de los "exones tempranos", todos los genes codificadores de proteínas se crearon a partir de módulos de exones —codificantes de elementos estructurales secundarios (tales como α-hélices, β-hojas, péptidos señal, o hélices transmembrana) o dominios plegables— por un proceso de recombinación mediado por intrones (Gilbert y Glynias, 1993;. Dorit et al, 1990).

El escenario alternativo de "intrones tardíos" consiste en la hipótesis de que los intrones aparecieron mucho más tarde, en los genes eucariotas (Hickey y Benkel, 1986; Sharp, 1985; Cavalier-Smith, 1985; Orgel y Crick, 1980). Este escenario vuelve discutible al exon shuffling como explicación del orígen de las proteínas más antiguas.

La hipótesis de los "intrones tempranos" fue la visión dominante de la década de 1980. La evidencia frecuentemente citada para ello fue la creencia generalizada de que existe una correlación entre la estructura exón-intrón y la estructura secundaria de la proteína.

Sin embargo, desde mediados de la década de 1980, este punto de vista se hizo cada vez más insostenible cuando información nueva salió a la luz (por ejemplo, véase Palmer y Logsdon, 1991, y Patthy, 1996; 1994; 1991; 1987) que levantó dudas sobre la existencia de una correlación general entre la estructura de las proteínas y la estructura exón-intrón. Tal correlación no se respeta en muchos genes codificadores de proteínas antiguas. Además, los ejemplos más claros de exon shuffling todos tuvieron lugar tardíamente en la evolución de los eucariotas, volviendose significativos sólo en el tiempo de la aparición de los primeros animales multicelulares (Patthy, 19961994). Incluso, el análisis de las uniones del splicing de intrones muestra un patrón que sugiere exons shuflings tardíos. La ubicación en la que se insertan los intrones e interrumpen marco de lectura de la proteína determina si los exones pueden ser recombinados, duplicados o suprimidos por recombinación intrónica sin alterar el marco de lectura aguas abajo de la proteína modificada (Patthy, 1987). Los intrones pueden agruparse de acuerdo a tres "fases": los intrones de fase 0 se insertan entre dos codones consecutivos; los intrones de fase 1 se insertan entre el primer y segundo nucleótido de un codón; y los intrones de fase 2 se insertan entre el segundo y tercer nucleótido.

Por lo tanto, si el exon shuffling jugó un papel importante en la evolución de proteínas, deberíamos esperar que exista una distribución de las distintas fases que sea característica. Pero los módulos hipotéticos de las proteínas antiguas no se ajustan a tales expectativas (Patthy, 19911987).

Está claro, entonces, que el exon shuffling es, por lo menos, poco probable en  el origen de las proteínas más antiguas que han surgido en la historia de la vida. Pero, ¿es este mecanismo adecuado para explicar el origen de las proteínas más recientes, como las que surgen en la evolución de los eucariotas?

La evidencia del Exon Shuffling.

Entonces, ¿cuales son los mejores argumentos del exon shuffling? Si la tesis es correcta, se podría predecir que los limites de un exón deberían estar fuertemente correlacionados con los dominios de las proteínas. En otras palabras, un exón debe codificar para un único dominio de una proteína. Existe evidencia que apunta al hecho de que hay una correlación estadísticamente significativa entre los límites de un exon y los dominios de una proteína (por ejemplo, ver Liu et al., 2005 y Liu y Grigoriev, 2004).

Sin embargo, hay muchos, muchos ejemplos en los que esta correspondencia no se sostiene. En muchos casos, es un solo exon codificando para varios dominios. Por ejemplo, los genes protocadhedrin implican típicamente exones largos codificando para múltiples dominios (Wu y Maniatis, 2000). En otros casos, se requieren múltiples exones para especificar un único dominio (por ejemplo, véase Ramasarma et al, 2012;. O Buljan et al, 2010.).

Otro argumento que aporta al papel del exon shuffling en la evolución de las proteínas es la distribución de fases de intrones que se encuentran en los exones que codifican para los dominios de proteínas en los seres humanos. En 2002, Henrik Kaessmann y sus colegas informaron que "intrones en los límites de los dominios muestran un notable simetría de combinaciones de fase (es decir, 0-0, 1-1 y 2-2), mientras que los intrones que no se encuentran en los limites de un dominio, no muestran un nivel elevado de simetría" (Kaessmann , 2002). Su conclusión fue que "el exon shuffling  esta involucrado principalmente en el reordenamiento de dominios estructurales y funcionales como un conjunto." También realizaron un análisis similar en el gusano nematodo Caenorhabditis elegans, encontrando que "Aunque los datos de C. elegans generalmente coinciden con los patrones humanos, hemos identificado un menor número de dominios delimitados por intrones en este organismo, lo cual es congruente con el hecho de que los genes de C. elegans tienen una complejidad menor. "

Otra línea de evidencia se refiere a genes que parecen ser quimeras de los genes parentales. Estos son típicamente asociados con los signos indicativos de su modo de origen. Un ejemplo famoso es el gen jingwei en Drosophila, el cual pudo haber surgido cuando "la secuencia del ARN mensajero ya procesado de la Adh [alcohol deshidrogenasa]pasó a formar parte de un nuevo gen funcional mediante la captura de varios exones e intrones aguas arriba de un gen no relacionado" (Long y Langley, 1993).

Sin embargo, debemos tener cuidado de no confundir el patrón observado de distribución de fases de intron, o asignación de exón/dominio, con una prueba de que el exon shuffling es en realidad el proceso por el cual surgió este patrón. Quizás la ascendencia común sea la causa, pero esto debe ser demostrado antes de asumirse. Es deber del biólogo determinar si los mecanismos de azar no-inteligentes en realidad pueden producir nuevos genes de esa manera. Es a esta cuestión a la que ahora me dirijo.

Dificultades del modelo a la hora de explicar el origen de los pliegues de las proteínas.

A pesar de que la hipótesis del exon shuffling tiene algunos elementos atractivos, la verdad es que presenta una serie de problemas. Por un lado, el modelo en su núcleo presupone la existencia previa de dominios de proteínas. La estructura secundaria de una proteína (hélices α y hojas β) existen en forma estable sólo en el contexto de las estructuras terciarias en las que se encuentran. En otras palabras, el nivel de dominio es el nivel mas elemental en el que existen módulos estructurales estables e independientes. Esto deja en un aura de misterio la cuestión sobre el origen de los dominios en sí mismos. Incluso, se ha demostrado que los dominios proteína estables y funcionales son raros en el espacio total de secuencias posibles de aminoácidos (por ejemplo, Axe, 2010; Axe, 2004;. Tayloret al, 2001; Keefe y Szostak, 2001; Reidhaar-Olson y Sauer, 1990; Salisbury,1969) .

Un estudio relativamente reciente examinó numerosas combinaciones diferentes de elementos estructurales secundarios en E. coli  (hélices α y hojas β y bucles), ensamblándose entre sí "de forma semi aleatoria; secuencias compuestas de hasta 800 residuos de aminoácidos" (Graziano et al., 2008 ). Los investigadores analizaron 108 variantes en búsqueda de rasgos que pudieran sugerir una estructura plegada. No encontraron estructuras de plegado de proteína. Al informar sobre este estudio, Axe (2010) escribe:

“Luego de la comprobación definitiva de que los candidatos más prometedores no estaban plegados adecuadamente, los autores concluyeron que "los clones seleccionados no deben, por lo tanto, ser considerados como similares a proteínas 'nativas', sino más bien a un tipo de forma de ‘globulo fundido’”, con lo cual quieren decir que la estructura secundaria está presente sólo transitoriamente, menos de un parpadeo, para luego desaparecer de la cadena, la cual es compacta pero móvil. Esto contrasta con la estructura nativa, en donde la estructura secundaria está programada para formar un pliegue terciario estable y bien definido. Esta investigación concuerda bien con lo que debieramos esperar en vista de las consideraciones hechas arriba. De hecho, sería muy desconcertante si la estructura secundaria hubiese llegado a ser modular”.

"Para que aquellos elementos puedan trabajar como robustos módulos," explica Axe, "su estructura tendría que ser efectivamente independiente del contexto, lo que les permitiría ser combinados en cualquier número de formas para formar nuevos pliegues." Sin embargo, en el caso de la estructura secundaria de la proteína este requisito no se cumple.

El modelo también parece exigir que la diversidad y disparidad de las funciones desempeñadas por las proteínas en la célula puedan tener su origen, en principio, mezclando y combinando los dominios pre-existentes. Pero esto presupone la capacidad de los procesos evolutivos ciegos de ser una especie de "caja de herramientas" específica de dominios que se pueden recombinar de diversas maneras para producir nuevas funciones. Esto parece poco probable, especialmente a la luz de la estimación de que "se necesitan 1.000 a 7.000 exones para construir todas las proteínas" (Dorit et al., 1990). En otras palabras, un conjunto de herramientas primordial de miles de diversos dominios de proteína debe ser construido antes de que la hipótesis del exon shuffling se convierta en una posibilidad. Y aun así hay otros serios problemas.

Otra cuestión se refiere a la compatibilidad de interfaz [o superficie de contacto]. La hipótesis del domain shuffling, en muchos casos, requiere la formación de nuevas interfaces de unión. Dado que los aminoácidos que componen las cadenas de polipéptidos se distinguen entre sí por la especificidad de sus cadenas laterales, las interfaces de union que permiten a las unidades de estructura secundaria (hélices α y hojas β) unirse para formar elementos de estructura terciaria depende de una secuencia específica de aminoácidos. Los dominios que deben unirse e interactuar unos con otros no pueden simplemente combinarse entre ellos como los ladrillos del LEGO.

En su artículo de 2010 en la revista BIO-Complexity, Douglas Axe informa sobre un experimento realizado utilizando enzimas β-lactamasas, el cual ilustra esta dificultad (Axe, 2010). Echa un vistazo a la siguiente figura, tomada del paper:



La mitad superior de la figura (con la etiqueta "A") revela la estructura de la TEM-1 β-lactamasa (izquierda) y el PER-1 β-lactamasa (derecha). La mitad inferior de la figura (con la etiqueta "B") revela las alineaciones que forman la “columna vertebral” de los dos dominios correspondientes de ambas proteínas. Note el nivel elevado de similitud estructural entre las dos enzimas. Axe intentó recombinar secciones de los dos genes para producir una proteína quimérica a partir de los dominios de color verde y rojo. Dado que las dos enzimas parientes exhiben niveles extremadamente altos de similitud estructural y funcional, debería esperse que el hibrido funcione. No obstante, ninguna función detectable fue identificada en la construcción quimérica, presumiblemente como consecuencia de la disimilitud sustancial entre las respectivas secuencias de aminoácidos y la incompatibilidad interfaz entre los dos dominios.

Este no es de ninguna manera el único estudio que demuestra la dificultad del exon shuffling para formar nuevas proteínas funcionales. Otro estudio realizado por Axe (2000) describe "un conjunto de secuencias híbridas" teniendo en cuenta que existe un "50% de identidad entre la β-lactamasa TEM-1 y la β-lactamasa de Proteus mirabilis", las cuales fueron creadas de tal manera que el "los híbridos acertaron la secuencia de TEM-1 excepto  en una región en el extremo C-terminal, que estaba compuesta por componentes al azar de las dos secuencias parentales". ¿Los resultados? "Todos estos híbridos son biológicamente inactivos."

De hecho, en los pocos casos en que las quimeras de proteínas sí poseen un función detectable, solo funciona por la precisa razón de que los investigadores utilizaron un algoritmo (desarrollado por Meyer et al., 2006) para seleccionar cuidadosamente en una proteína las secciones que poseen el menor número de interacciones de cadena lateral con el resto del pliegue, y eligieron proteínas parentales con relativamente alta similitud de secuencia (Voigt et al., 2002). Esto sólo sirve para subrayar el problema. Incluso en el estudio Voigt, la tasa de éxito fue bastante baja, incluso bajo circunstancias muy favorables, con sólo uno de cada cinco quimeras presentando funcionalidad discernible.

Conclusión

Para concluir, si bien hay algunas pruebas de inferencia indirecta a favor del exon shuffling en la evolución de proteínas, una consideración acerca de cómo este proceso podría ocurrir en realidad revela que la hipótesis en sí está repleta de serias dificultades.

Autor: Jonathan McLatchie – Tiene un  MRes en biología evolutiva y sistematica de la Universidad de Glasgow. Actualmente estudia  Medical and Molecular Biosciences en Newcastle University y es redactor de Evolution News and Views.

Traductor: Daniel Alonso - Estudia Licenciatura en Ciencias Biológicas en UNT, Argentina.


Fuente:  http://www.evolutionnews.org/2013/07/exon_shuffling074401.htmll (Parte I) y http://www.evolutionnews.org/2013/07/an_evaluation_o074441.html (Parte II) 


No hay comentarios :