Experimentando con el coronavirus SARS-CoV-2 en la clase de bioquímica estructural

La lucha mundial contra el coronavirus SARS-CoV-2 ha desencadenado un esfuerzo científico sin precedentes que aún está en curso, generando una gran cantidad de datos estructurales, disponibles en el Protein Data Bank (PDB). Este conocimiento detallado ofrece una oportunidad única para integrar el SARS-CoV-2 en seminarios y proyectos estudiantiles de bioquímica estructural, permitiendo a los estudiantes aplicar conceptos clave y comprender su relevancia en la realidad biológica. Para ello, hemos desarrollado un proyecto de estudio del SARS-CoV-2, accesible para estudiantes de bioquímica general y estructural, que resulta atractivo, al ser un tema de gran importancia social, y con potencial de profundización en diversos sentidos. La disponibilidad de recursos abiertos sobre coronavirus y COVID permite una amplia variedad de enfoques didácticos, limitados solo por la imaginación y la disponibilidad de tiempo en los planes de estudio.

En el enfoque que hemos desarrollado para el semestre de bioquímica estructural en nuestro programa de Biología Sanitaria, aplicamos los siguientes conceptos:

  • Comprender los principios básicos de la estructura proteica, incluyendo estructuras secundarias, dominios estructurales y estructura cuaternaria.
  • Explorar las bases estructurales del reconocimiento y unión entre proteínas, abordando diferentes tipos de interacciones entre aminoácidos y estructuras, como enlaces de hidrógeno, interacciones hidrófobas, interacciones electrostáticas y el papel del agua.
  • Analizar las mutaciones y sus efectos, comprendiendo cómo los cambios puntuales en la secuencia de aminoácidos afectan a la estructura y la evolución.
  • Entender los fundamentos de la interacción entre ligandos no proteicos y proteínas, con una introducción al diseño racional de fármacos.

Además de aplicar estos conceptos, el seminario tiene como objetivo familiarizar a los estudiantes con diversas herramientas y habilidades, tales como:

  • Manejo y extracción de datos del Protein Data Bank y la bibliografía científica relevante.
  • Formulación y prueba de hipótesis, explorando cuestiones como las interacciones por enlaces de hidrógeno e hidrófobas en la infectividad y evolución viral, así como la predicción de zoonosis basada en estructuras e interacciones proteicas.
  • Uso de herramientas de visualización y análisis de datos estructurales, como UCSF ChimeraX y Protein-Imager, con aplicaciones en línea para estudiar la interacción entre ligando y proteína.

El proyecto se estructura en actividades interconectadas donde los estudiantes exploran las estructuras, aprenden a crear figuras e ilustraciones, y abordan diversas hipótesis y preguntas mediante experimentos virtuales.

Actividad 1. Contextualización: estructura general y biología del coronavirus

En una etapa inicial, exploramos la estructura general, el ciclo de infección y la biosíntesis de los coronavirus y el SARS-CoV-2, adaptando el nivel de profundidad según el conocimiento previo en biología molecular de los estudiantes. Durante esta actividad, los estudiantes también distinguen entre COVID, neumonías virales y sus agentes causales, discuten su relación con otros virus respiratorios y pandemias pasadas, como el SARS-CoV-1 en 2003 y el MERS-CoV en 2012, y plantean hipótesis sobre las notables diferencias en la letalidad y la facilidad de contagio del SARS-CoV-2 en comparación con pandemias anteriores.

Actividad 2. Estructura del complejo proteico de la espícula

La estructura de la espícula viral, característica de los coronavirus, se analiza a partir de datos del PDB. Se utiliza herramientas como Protein-Imager y ChimeraX para visualizar la proteína y crear figuras descriptivas (figura 1). En esta actividad se exploran cuestiones como:

  • ¿Se trata de una proteína multimérica? ¿Cuántas subunidades tiene?
  • Identificación de dominios estructurales y análisis de diferencias entre ellos, incluyendo las estructuras secundarias predominantes.
  • Relación entre estructura y función, destacando el dominio de reconocimiento del receptor (RBD), el sitio de corte por furinas y el cambio de conformación en la unión al receptor que activa la fusión (figura 2).
  • Exploración del concepto de glicoproteína y su importancia en la espícula viral, que contiene múltiples moléculas de azúcares, explicando su relevancia.

Figura 1. Complejo de la espícula de la variante ómicron del SARS-CoV-2 en estado abierto, mostrando en diferente color las tres subunidades proteicas que la componen. Vista longitudinal (izquierda) y transversal (derecha). Trazada a partir de PDB 6VYB con Protein-Imager.

Figura 2. Subunidad de la espícula viral, mostrando sus conformaciones abierta y cerrada, dominios y componentes fundamentales. Creada a partir de los PDB 6VYB y 6VXX con ChimeraX.
Actividad 3. La unión del SARS-CoV-2 al receptor

En el siguiente paso, exploramos la interacción del virus con su receptor celular, la carboxipeptidasa ACE2, y su función y distribución tisular. En el modelado analizamos la estructura de ACE2, identificamos su centro activo y la región de unión al RBD de la espícula viral. Al considerar las interacciones fundamentales entre la proteína viral y su receptor, y al utilizar el software para identificarlas, surgió una hipótesis: ¿contribuyó una interacción más favorable energéticamente entre el RBD y el receptor a la mayor infectividad del SARS-CoV-2 en comparación con el SARS-CoV-1? Al observar los enlaces de hidrógeno entre RBD y receptor mediante el software ChimeraX (figura 3), los estudiantes encontraron que con el RBD del coronavirus de 2019 había más enlaces, y más cortos, lo que resultaba en uniones más estables. Utilizando la regla de Jeffrey como referencia aproximada para relacionar la longitud de los enlaces con su energía promedio, obtuvimos un esquema visual que sugiere las diferencias de afinidad entre el receptor y los virus de 2003 y 2019 (figura 4).

Figura 3. Representación de algunos de los enlaces de hidrógeno observados entre el RBD viral (azul, derecha) y el receptor ACE2. A partir de PDB 7U0N con ChimeraX.

Figura 4. Mapa de las interacciones por enlaces de hidrógeno entre el receptor hACE2 y la región de unión al receptor del virus SARS-CoV-1 de 2003 y el SARS-CoV-2 de 2019, observado por los estudiantes durante su investigación. El virus de 2019 establecía más enlaces y de menor distancia, lo que puede relacionarse con una mayor afinidad por el receptor y, por tanto, mayor probabilidad de contagio.
Actividad 4. Mutaciones y evolución viral

Los cambios puntuales en aminoácidos de una proteína pueden tener consecuencias relevantes en la estructura y las interacciones entre proteínas. La pandemia de SARS-CoV-2 nos ha mostrado, en un lapso corto, un aspecto clave de la evolución: la selección de variantes con mutaciones que pueden dar lugar a una mejora de adecuación (fitness) en la relación entre virus y hospedador (mejor infectividad, enfermedad menos severa, menor mortalidad) y extinción de las variantes con menor fitness.

Esta idea se puede ilustrar con un evento concreto: en diciembre de 2020 se identificó la ‘variante británica’ B.1.1.7, que portaba 8 mutaciones puntuales en la espícula. El experimento realizado por los alumnos sobre las estructuras muestra que la variante B.1.1.7, a través de una mutación clave, la E501Y, introduce nuevas interacciones por puentes de hidrógeno e hidrófobas con el receptor, lo que pudo mejorar la infectividad viral y ser clave en la extensión de la nueva variante.

Actividad 5. Interacciones hidrófobas y la base estructural de las zoonosis

En el estudio de la bioquímica estructural es común encontrar una idea simplificada pero parcialmente incorrecta sobre la fuerza de las interacciones no covalentes. Se tiende a sobrevalorar el enlace de hidrógeno frente a las interacciones hidrófobas, sin considerar el papel crucial del agua en procesos como el plegamiento proteico. Un enfoque termodinámico, basado en el balance de energía libre y la influencia del agua en la entropía, resalta la importancia de las interacciones hidrófobas, incluso en la unión entre virus y receptor.

En un experimento se observan las interacciones hidrófobas junto con los enlaces de hidrógeno, para entender cómo el coronavirus puede transmitirse entre especies. Al comparar las interacciones entre el RBD de la variante ómicron y ACE2 humana con las de ACE2 de diferentes animales (figuras 5 y 6), se revela que las transmisiones humano-animal pueden predecirse según las estructuras proteicas. Aunque las interacciones con ACE2 animal son menos favorables, en algunos casos, como en la civeta o el perro, la probabilidad de contagio es similar. Este análisis ayuda a comprender las bases moleculares de las zoonosis, especialmente en el caso de los murciélagos.

Figura 5. Comparación de los contactos de naturaleza hidrófoba (superficies rojas y azules) entre la variante ómicron del SARS-CoV-2 y el receptor ACE2 de ratón y humano. El número e intensidad de la interacción es mayor en humanos. Calculado a partir de los PDB 7WRI y 7N0N con ChimeraX.

Figura 6. Enlaces de hidrógeno observados entre los receptores hACE2 (humano) y mACE2 (murino) y la región RBD de la variante ómicron del SARS-CoV-2. Calculado a partir de los PDB 7WRI y 7N0N con ChimeraX.
Actividad 6. Diseño de fármacos

Esta actividad avanzada explora el diseño de fármacos basado en las estructuras de proteínas y su interacción con ligandos. Se presenta el concepto de diana terapéutica y el papel de las proteínas no estructurales del virus, como la nsp14 del SARS-CoV-2, que son objetivos potenciales para tratamientos. Los estudiantes realizan varios pasos:

  • Contextualización: Se analiza la importancia del proofreading de la nsp14 en la replicación del genoma viral.
  • Reconocimiento estructural: Se estudian los dominios de la nsp14 y su función en la replicación viral.
  • Identificación de dianas terapéuticas: Se investiga el sitio de unión y el centro activo de la nsp14, utilizando herramientas de modelado molecular.
  • Introducción al docking: Se introduce y practica el docking molecular con la nsp14 y se exploran posibles ligandos de la base de datos ZINC20. Este experimento proporciona a los estudiantes una visión del diseño de fármacos y su importancia en el ámbito profesional, así como una comprensión básica de cómo funcionan muchos fármacos en el mercado.

Desde la perspectiva de los estudiantes, se resalta la capacidad del software libre y fácil de usar para realizar experimentos virtuales y obtener resultados interpretables, lo que permite probar hipótesis sobre la relación entre el número y la longitud de los enlaces de hidrógeno y la afinidad de las interacciones. Además, se pueden realizar comparaciones entre variantes virales y receptores de diferentes animales. Esta actividad ha fortalecido conceptos como mutación y su relación con las estructuras, mientras se aprende a obtener y analizar datos de fuentes confiables y accesibles públicamente. A través de este proceso de aprendizaje, se ha descubierto la importancia de las interacciones hidrófobas en la estructura tridimensional de las proteínas y se han adquirido habilidades para estudiarlas. Las principales dificultades encontradas han sido de índole informática, especialmente con la instalación y el manejo del software. Sin embargo, al finalizar estos ejercicios, los estudiantes han logrado explicar y comprender de manera más técnica y profesional fenómenos tan importantes como la pandemia que ha impactado significativamente en nuestro mundo.

Figura 7. Unión del inhibidor SS148, análogo de S-adenosil-metionina, a la proteína viral nsp14. Trazado con ChimeraX a partir de PDB 8BWU.

Figura 8. Mapa de las interacciones del inhibidor SS148 con la proteína nsp14, obtenido con la aplicación en línea ProteinsPlus. Se observan enlaces de hidrógeno, interacciones hidrófobas y apilamiento aromático.
Recursos web
  • https://3dproteinimaging.com/ – Aplicación en línea para la visualización y representación de modelos proteicos.
  • https://www.cgl.ucsf.edu/chimerax/Software libre para la visualización y análisis de estructuras moleculares.
  • https://insidecorona.net/ – Base de datos e información estructural sobre coronavirus.
  • https://www.rcsb.org/Protein Data Bank.
  • http://www.swissdock.ch/docking – Aplicación en línea del Swiss Institute for Bioinformatics para realizar docking a partir de modelos en PDB y cualquier ligando o fármaco.
  • https://proteins.plus/ – Aplicación en línea ProteinsPlus de la Universidad de Hamburgo.
  • https://pdb101.rcsb.org/browse/coronavirus – Sección educativa del Protein Data Bank, con recursos esenciales sobre coronavirus.
Referencias
  • Liu K, Tan S, Niu S, Wang J, Wu L, Sun H, Zhang Y, Pan X, Qu X, Du P, Meng Y, Jia Y, Chen Q, Deng C, Yan J, Wang H-W, Wang Q, Qi J & Gao GF (2021). ‘Cross-species recognition of SARS-CoV-2 to bat ACE2’, Proc. Natl. Acad. Sci. 118:1–9. doi: 10.1073/pnas.2020216118.
  • Nigam A, Hurley MFD, Li F, Konkoˇlová E, Konkoˇlová K, Klíma M, Trylčová J, Pollice R, Selim S, Inaroˇglu C, Levin-Konigsberg R, Handjaya J, Schapira M, Chau I, Perveen S, Ng H-L, Umit Kaniskan H, Han Y, Singh S, Gorgulla C, Kundaje A, Jin J, Voelz VA and Weber J (2023). ‘Drug discovery in low data regimes: leveraging a computational pipeline for the discovery of novel SARS-CoV-2 Nsp14-MTase inhibitors’, bioRxiv 18:23. doi: 10.1101/2023.10.03.560722
  • Tomasello G, Armenia I and Molla G (2020). ‘The Protein Imager: a full-featured online molecular viewer interface with server-side HQ-rendering capabilities’, Bioinformatics 36:2909–2911. doi: 10.1093/bioinformatics/btaa009
  • Shang J, Ye G, Shi K, Wan Y, Luo C, Aihara H, Geng, Q, Auerbach A and Li F (2020). ‘Structural basis of receptor recognition by SARS-CoV-2.’, Nature 581:1–8. doi: 10.1038/s41586-020-2179-y
  • Singh I, Li F, Fink EA, Chau I, Li A, Rodríguez-Hernández A, Glenn I, Zapatero-Belinchón FJ, Rodríguez ML, Devkota K, Deng Z, White K, Wan X, Tolmachova NA, Moroz YS, Kaniskan HÜ, Ott M, García-Sastre A, Jin J, Fujimori DG, Irwin JJ, Vedadi M and Shoichet BK (2023). ‘Structure-Based Discovery of Inhibitors of the SARS-CoV-2 Nsp14 N7-Methyltransferase’, J Med Chem. 66:7785–803. doi: 10.1021/acs.jmedchem.2c02120.