La resolución estructural de proteínas y complejos macromoleculares es una herramienta muy útil a la hora de caracterizar los mecanismos moleculares que llevan a cabo las proteínas y los complejos en los que participan. A menudo la determinación de la estructura completa o alguno de sus dominios permite aclarar aspectos poco dilucidados o cuestiones planteadas con anterioridad, además de posibilitar la formulación de hipótesis nuevas de trabajo. Se entiende por dominio la parte conservada de una secuencia de proteína que puede evolucionar, funcionar y existir de forma independiente al resto de la cadena proteica. La evolución molecular utiliza los dominios como bloques de construcción que pueden combinarse para crear proteínas con funciones diferentes (1).
Una vez resuelta la estructura de una nueva proteína se puede realizar una búsqueda de similitud estructural con estructuras previamente determinadas que puede arrojar pistas sobre la funcionalidad de dominios o regiones desconocidas, aunque el grado de homología de secuencia sea bajo. Esto es posible gracias a que la estructura en proteínas está mucho más conservada que la secuencia de aminoácidos; en concreto se ha cuantificado que entre tres y diez veces (2). De modo que una primera utilidad de la resolución estructural es la identificación de dominios funcionales gracias al mayor grado de conservación que la estructura presenta respecto a la secuencia.
Otro aspecto importante derivado de la resolución de estructuras es la correcta definición de los límites que abarcan los mencionados dominios. A menudo se realizan mutantes de supresión para estudiar las relaciones de estructura función existentes en un dominio, o bien el efecto de los mismos en el contexto de sus proteínas completas. Para ello resulta de mucha utilidad recurrir a las estructuras tridimensionales depositadas en las bases datos (www.rcsb.org) donde se pueden realizar búsquedas de homología de secuencia con estructuras ya resueltas y poder así definir con mayor precisión los límites de los dominios objeto de estudio. Así pues la estructura permite el diseño de construcciones mejor definidas que facilitan el estudio de los dominios aislados o el efecto de su eliminación en el contexto de las proteínas completas. En ausencia de información estructural, se cometen a menudo errores en la definición de los límites de cada dominio cuando las homologías de secuencia no son muy claras, con las consecuencias posteriores en las conclusiones obtenidas a partir de experimentos realizados con dichas construcciones (3).
Un tercer aspecto importante y ampliamente extendido en la bibliografía es la definición de superficies de interacción entre componentes de un complejo. La determinación estructural de complejos a nivel atómico permite caracterizar los dominios o las regiones de interacción que participan en la formación de dicho complejo.
Estos tres aspectos se ponen de manifiesto por ejemplo en la resolución de la estructura del complejo entre la proteína Rbg1, de la familia DRG, y su compañera Tma46 (4). Las proteínas DRG (Developmentally Regulated GTP-binding) constituyen una familia de GTPasas muy conservada que se asocian con proteínas DFRP (DRG Family Regulatory Proteins) para participar en procesos de traducción eucariota (5). La estructura de Rbg1 en complejo con la región C-terminal de su ligando celular DFRP, Tma46 revela que las proteínas DRG son multimodulares con 3 dominios hélice-giro-hélice (HTH), un nuevo dominio denominado S5D2L y otro dominio TGS C-terminal que empaquetan contra la plataforma que representa el dominio GTPasa. El dominio S5D2L no había sido descrito en la familia y se encuentra como un dominio independiente que emerge a modo de inserción en medio de la secuencia GTPasa. La comparación estructural con proteínas depositadas en las bases de datos demostró que, a pesar de no haber homología de secuencia, el dominio presenta una topología similar a la superfamilia «Ribosomal protein D5 domain 2-like» y de ahí su nomenclatura. La similitud estructural con proteínas ribosomales permite establecer interesantes correlaciones con la funcionalidad del complejo Rbg1/Tma46 en traducción de la expresión génica. Así mismo la estructura del dominio TGS C-terminal permite definir sus límites de forma precisa, corrigiendo algunas conclusiones previamente establecidas respecto a la participación de este dominio en la familia DRG y estableciendo nuevas funcionalidades no caracterizadas (4). La resolución estructural ha permitido abordar estudios funcionales y dilucidar por ejemplo que el dominio TGS de Rbg1 es esencial para el reclutamiento del factor Rbg1 a los polisomas, apoyando la idea de que los factores DRG desempeñan un papel en regulación de la expresión génica y concretamente en la traducción.
La estructura permite definir la zona de interacción en el heterodímero y muestra además que la región de Tma46 que interacciona con Rbg1 adopta una conformación no globular extendida típica de las proteínas intrínsecamente desestructuradas. También clarifica que Tma46 contacta con Rbg1 únicamente a través de los dominios GTPasa y TGS.
Referencias:
- Wetlaufer DB. Proc Natl Acad Sci U S A. 1973;70:697-701
- Illergård K, Ardell DH, Elofsson A. Proteins. 2009 Nov 15;77(3):499-508.
- Holland TA, Veretnik S, Shindyalov IN, Bourne PE. J Mol Biol. 2006;361:562-590
- Francis SM, Gas ME, Daugeron MC, Bravo J, Séraphin B. Nucleic Acids Res. 2012 Nov;40(21):11100-14
- Leipe DD, Wolf YI, Koonin EV, Aravind L. J Mol Biol. 2002 Mar 15;317(1):41-72.