El genoma regulador

El 98% del genoma es no-codificante y hasta hace poco se consideraba ADN basura. Los recientes avances en genómica han demostrado su función esencial en la regulación de la expresión génica, y su papel clave en la construcción de los organismos, la evolución de las especies y en las enfermedades humanas.

En los genomas de vertebrados sólo una pequeña fracción de ADN se corresponde con secuencias codificantes. Además, la gran mayoría de las proteínas codificadas por estos genes están altamente conservadas en todas las especies. ¿Cómo ha surgido entonces la diversidad morfológica durante la evolución? Actualmente, la teoría genética de la evolución morfológica propone que las variaciones morfológicas entre especies se deben, en gran medida, a la alteración en la expresión de genes durante el desarrollo embrionario (Carroll 2008). La expresión de los genes está controlada por secuencias reguladoras localizadas en el ADN no-codificante que rodea dichos genes. Así, son las variaciones en estas regiones reguladoras las principales fuentes de variación morfológica.

La regulación de los genes no sólo es crucial para el desarrollo, sino también es esencial para el desarrollo embrionario y la fisiología de las células en los organismos adultos. Por lo tanto, no es sorprendente que la gran mayoría de las lesiones asociadas a enfermedades genéticas humanas se localicen en el ADN regulador (Zhang 2015). A pesar de la evidencia cada vez mayor de la función fundamental del ADN regulador en el desarrollo, la evolución y las enfermedades humanas, hasta hace poco teníamos un gran problema: mientras que el código de las secuencias codificantes de las proteínas se conoce, el lenguaje del ADN regulador es en gran medida desconocido, lo que impedía la identificación de las regiones reguladoras en los genomas secuenciados. El desarrollo de técnicas basadas en la secuenciación masiva ha cambiado completamente este panorama y hoy no sólo podemos identificarlas, sino que además hemos descubierto la importancia de su organización tridimensional en el núcleo para su correcto funcionamiento.

Varias han sido las iniciativas para identificar todos los elementos funcionales en la secuencia del genoma humano. Así, el proyecto ENCODE (Enciclopedia de Elementos de ADN), liderado por el National Human Genome Research Institute (NHGRI), pretende identificar toda la actividad funcional del genoma humano, utilizando como material multitud de líneas celulares humanas. Otro proyecto con objetivos similares, pero usando diferentes tejidos humanos tanto de embriones como de adultos es el Roadmap Epigenomics, también liderado por el gobierno de EE.UU. a través del Instituto Nacional de Salud (NIH). Estos proyectos se han complementado con otros financiados por el mismo organismo para estudiar también los genomas de modelos animales como el gusano (Caenorhabditis elegans), la mosca del vinagre (Drosophila melanogaster) y ratones (Mode Encode y Mouse Encode). En todos estos proyectos se han combinado diferentes experimentos de secuenciación masiva para identificar a nivel de todo el genoma la cromatina abierta, las regiones donde se localizan diferentes modificaciones de histonas, los sitios de unión en el genoma de diferentes factores de transcripción y los estados de metilación del DNA.

Todos estos trabajos, junto con otros realizados en otras especies de vertebrados e invertebrados en numerosos grupos de investigación de multitud de países, han permitido identificar marcas epigenómicas universales asociadas a estados específicos de la cromatina. Por ejemplo, la trimetilación de la lisina 4 de la Histona 3 (H3K4me3), es una marca epigenómica característica de promotores activos, mientras que la acetilación de la lisina 27 de la misma histona (H3K27ac), se asocia a elementos reguladores activos. Además, se ha visto que tanto promotores como elementos reguladores activos se localizan en regiones abiertas del genoma (Shlyueva 2014; Figura 1).

A través de estos estudios se ha revelado la enorme cantidad de información reguladora en los genomas de los animales, así como su gran dinámica tanto en el tiempo como en el espacio. Es de hecho ese dinamismo espacial y temporal lo que permite expresar de forma diferencial los diferentes genes del genoma y generar así diferentes tipos celulares y órganos. Con estos principios universales se abre ahora la posibilidad de estudiar la información reguladora de cualquier genoma. Esto permitirá descifrar cómo los cambios en dicha información contribuyen a los cambios morfológicos durante la evolución.

¿Cómo se organiza esta gran cantidad de información reguladora en el genoma para que las diferentes regiones actúen sobre su gen diana y no sobre otro promotor no relacionado?

El desarrollo de técnicas basadas también en secuenciación masiva que permiten detectar contactos ADN-ADN en todo el genoma, denominadas técnicas de captura de conformación cromosómica, ha revolucionado nuestra visión sobre la organización 3D del genoma. Así, se ha demostrado que la cromatina está formando compartimentos denominados dominios topológicamente asociados (TAD). Estas son regiones genómicas del orden de una megabase en las cuales las secuencias de ADN interaccionan preferentemente entre sí. Los TAD actúan como unidades organizativas básicas del genoma, compartimentando la información reguladora en el espacio tridimensional del núcleo, generando fronteras que separan funcionalmente las regiones genómicas que están muy cerca de una perspectiva lineal y que unen las secuencias de interacción funcional que están separadas por cientos de kilobases. De esta forma elementos reguladores y sus genes dianas se localizan dentro del mismo TAD y se separan del siguiente que contiene otros genes y sus correspondientes secuencias reguladoras (Rowley 2016, Figura 1).

La combinación de los análisis de la estructura 3D de la cromatina con la detección de regiones reguladoras nos permite un conocimiento sin precedentes de la complejidad del aparato regulador que controla la expresión espacio-temporal de cualquier gen y de cómo alteraciones en este aparato pueden causar enfermedades o pueden contribuir a la evolución de las especies. Así, estudios recientes han podido demostrar cómo los reordenamientos cromosómicos que alteran la estructura 3D de la cromatina causan la expresión génica ectópica en diferentes tejidos humanos, generando malformaciones o causando patologías como cáncer (Lupiañez 2016). Esta sobreexpresión se debe a que el reordenamiento genera un nuevo TAD y determinados genes se activan por elementos reguladores que en condiciones normales estarían en otro compartimento del genoma. Es de esperar que este mismo tipo de reordenamientos también contribuyan a importantes cambios de expresión a lo largo de la evolución que favorezcan modificaciones morfológicas, como de hecho hemos podido demostrar en estudios recientes en nuestro laboratorio (Acemel 2017).

Tal es la importancia de la organización 3D del genoma en la regulación de la expresión génica, que el NIH ha arrancado un nuevo proyecto, denominado 4D Nucleome, para estudiar este tema en profundidad.

Cabe esperar que en próximos años podamos determinar con mucha mayor precisión el impacto de las mutaciones regulatorias en la expresión génica y en el desarrollo de enfermedades genéticas humanas, así como su papel en la evolución de las especies. En gran medida, gracias al apoyo determinante de gobiernos con visión de futuro. El desarrollo económico derivado de este conocimiento será inmenso. En España, estaremos en la retaguardia, y nos va a salir caro, sobre todo para las arcas públicas. Eso nos pasa por dejar que investiguen otros.

Región del genoma de pez cebra mostrando los genes six2a y six3a. De abajo a arriba se muestran los genes de la zona, los sitios donde se localizan las marcas epigenómicas H3K3me3 (promotores activos) y H3K27ac (elementos reguladores activos), las zonas de cromatina abierta (ATAC-seq) y los contactos de los promotores six2a (azul) y six3a (rojo), determinados por técnicas de captura de conformación cromosómica. Los asteriscos azules y naranjas muestran elementos reguladores activos en momentos diferentes del desarrollo embrionario. Nótese que los promotores de los genes six2a y six3a contactan zonas opuestas del genoma, donde se encuentran sus correspondientes elementos reguladores. Estas dos zonas definen dos TADs diferentes.
Referencias:
  1. Carroll SB. Evo-devo and an expanding evolutionary synthesis: a genetic theory of morphological evolution. Cell, 34:25-36, 2008.
  2. Zhang F, Lupski JR. Non-coding genetic variants in human disease. Hum Mol Genet. 24:R102-10, 2015.
  3. Shlyueva D, Stampfel G, Stark A. Transcriptional enhancers: from properties to genome-wide predictions. Nat Rev Genet.15:272-8, 2014.
  4. Rowley MJ, Corces VG. The three-dimensional genome: principles and roles of long-distance interactions. Curr Opin Cell Biol.40:8-14, 2016.
  5. Lupiáñez DG, Spielmann M, Mundlos S. Breaking TADs: How Alterations of Chromatin Domains Result in Disease. Trends Genet, 32:225-237,2016.
  6. Acemel RD, Maeso I, Gómez-Skarmeta JL. Topologically associated domains: a successful scaffold for the evolution of gene regulation in animals. Wiley Interdiscip Rev Dev Biol. 2017 May;6(3). doi: 10.1002/wdev.265.
  7. Proyecto Encode: https://www.genome.gov/10005107/the-encode-project-encyclopedia-of-dna-elements/
  8. Proyecto Roadmap Epigenomics: http://www.roadmapepigenomics.org/
  9. Proyecto ModeEncode: http://www.modencode.org/
  10. Proyecto Mouse Encode: http://www.mouseencode.org/
  11. Proyecto 4D nucleome: https://commonfund.nih.gov/4dnucleome

Entrevista a José Luis Gómez Skarmeta

P.- ¿Cuándo surgió su vocación científica?

R.- Curiosamente tengo en mis recuerdos un momento muy particular donde se despertó en mí el interés por la ciencia, y en particular por la genética. Estando en el instituto en Sevilla, en primero de BUP, lo que hoy sería tercero de la ESO, estábamos dando en Biología los experimentos de Mendel, que fueron las bases de la genética. En un paseo de la clase por un parque en los alrededores del instituto, estábamos mirando los distintos tipos de hojas de las diferentes plantas y árboles que nos cruzábamos mientras la profesora nos comentaba que los distintos rasgos que veíamos eran heredados a través de los genes. Es en ese momento cuando decido que quiero estudiar genética. Después, la vida me llevó por un camino indirecto hasta esta disciplina. Descubrí la bioquímica durante el último año del instituto que cursé en Murcia, que me encantó, y siguiendo las recomendaciones de un excelente profesor de Química y Física en COU, estudié Químicas haciendo posteriormente la especialidad Bioquímica. Finalmente, logré mi objetivo durante la tesis doctoral, que hice en Genética Molecular en Drosophila.

P.- ¿Podría resumirnos brevemente su trayectoria profesional?

R.- Durante la especialidad de Bioquímica, en los dos últimos años de carrera, entré como alumno interno en el Departamento de Bioquímica y Biología Molecular de la Universidad de Murcia. Allí trabajé con el profesor Rafal Peñafiel estudiando la ruta de las poliaminas. El ambiente del departamento fue clave para estimular mi interés por la carrera científica. Al final de la carrera, surgió la oportunidad de irme a trabajar a Baltimore (EEUU) con el Dr. Guiseppe Inesi, en bioquímica de canales de calcio. La verdad es que Baltimore era un sitio horrible por aquella época y por suerte mi jefe decidió hacer una sabático en la Universidad de Stanford y me ofreció que me fuese con él. El cambio fue impresionante, tanto que después no me apetecía volver a Baltimore. Curiosamente, en Stanford conocí a un profesor de Genética de la Universidad de Murcia, Paco Murillo, al que no conocía previamente porque daba clases en Biología y no en Químicas. Hablando con él de mi interés en la genética y la biología molecular, y mi deseo de volverme a España, me recomendó diversos grupos del Centro de Biología Molecular “Severo Ochoa” (CBM). A mi vuelta a España acabé en el laboratorio de uno de esos investigadores, el Dr. Juan Modolell. Esto fue una gran suerte ya que no solo el ambiente de trabajo en su laboratorio y en el CBM era muy estimulante y de gran nivel científico, sino que además conocí allí a mi mujer Elisa de la Calle Mustienes, la que ha sido desde entonces mi compañera sentimental y mi mejor colaboradora científica. Durante esos años Juan Modolell fue un magnífico tutor y acabó convirtiéndose en un gran amigo y mentor. Durante la tesis aislé múltiples elementos cis-reguladores de los genes proneurales achaete-scute de Drosophila e identifiqué molecularmente genes que los regulaban, los primeros genes conocidos del prepatón, los genes iroquois. Posteriormente, decidí volver a Chile, mi país de origen, a intentar identificar en vertebrados genes de la familia iroquois utilizando como modelo las ranas Xenopus laevis. Después de dos años me di cuenta de que ya no encajaba bien en Chile y prefería volver a España, donde conseguí un contrato Ramón y Cajal en la primera convocatoria. En España me incorporé de nuevo al laboratorio de Juan Modolell en el CBM, que amablemente me dejó un espacio para que trabajara en mi línea de investigación. Durante estos años estudiamos la regulación de los genes iroquois en vertebrados. Muy pronto conseguí mi plaza de científico titular y en 2003 surgió la oportunidad de iniciar un nuevo centro de investigación especializado en biología del desarrollo en Sevilla entre un grupo de científicos jóvenes, muchos de nosotros compañeros en el CBM. Este centro se denominó el Centro Andaluz de Biología del Desarrollo. Juntos, con el esfuerzo conjunto de todos los estamentos del instituto, científicos, técnicos y administrativos, hemos conseguido que el CABD se haya convertido en un referente internacional en el campo y uno de los centros de excelencia de España. Ha sido en el CABD donde mi grupo ha desarrollado todo su potencial trabajando con múltiples modelos animales en una línea de investigación multidisciplinar que abarca el desarrollo embrionario, la genómica, la evolución, la genética y las enfermedades humanas.

P.- ¿Qué consejo daría a los que ahora inician su carrera científica?

R.- Aquellas personas que se quieren dedicar a la ciencia deben de saber que ser científico no es un trabajo como otro cualquiera. Hay que dedicarle mucho tiempo y mucho esfuerzo para lograr alcanzar unos objetivos que ninguna otra persona ha alcanzado antes, que son aquellos que nos que llevan a nuevos descubrimientos. Esto supone al día de hoy mucha competencia y mucho trabajo, y hay que saber vivir con ello. Es importante además cuestionar lo que se sabe, tener la mente abierta e intentar ser original, no dejarse llevar por lo que todos los demás hacen o dicen. Para ello hay que mantenerse muy bien informado de lo que está ocurriendo en el campo y de los desarrollos tecnológicos que ocurren constantemente. Puesto que la carrera científica es muy vocacional, y el que la sigue suele tener mucha motivación personal, estos inconvenientes no suelen ser un problema mayor. Es más, la experiencia de poder descubrir algo nuevo compensa con creces el duro trabajo diario necesario para llegar a ese punto.

P.- ¿Podría describirnos brevemente en qué consiste su línea de investigación actual y cuál es su trascendencia?

R.- Los genomas de los animales se pueden dividir en dos grandes bloques. Por un lado, está el genoma codificante, en el que se encuentran todos los genes, los cuales son necesarios para producir las proteínas del organismo. Esta es una porción pequeña, que en mamíferos ronda el 2% del genoma. El resto del genoma es no-codificante y durante muchos años fue en gran medida desconocido. En los últimos años se ha podido comprobar que esta porción del genoma tiene una importancia muy grande ya que contiene todas las regiones reguladoras necesarias para controlar de forma muy precisa cuándo, cómo y dónde se activan o reprimen los distintos genes. De hecho, todas las células del organismo tienen los mismos genes, pero el hecho de que unos u otros estén expresados, lo que permite la formación de diferentes tejidos, depende de la información reguladora activa en cada tipo celular. La cantidad de información reguladora del genoma es inmensa, mucho mayor que el número de genes. Esta gran cantidad de información debe de estar perfectamente organizada en el núcleo de la célula para que controle de forma precisa la expresión de unos genes y no otros.
La línea de investigación del grupo se centra en determinar el papel de la información reguladora y la organización tridimensional de la cromatina en el desarrollo embrionario, en la evolución y en las enfermedades humanas. Pretendemos determinar cómo variaciones en la información reguladora y en la organización tridimensional de la cromatina han generado variaciones morfológicas durante la evolución y cómo fallos en esta información u organización causan enfermedades humanas.

P.- ¿Cuál es el avance científico que más le ha impresionado?

R.- En el campo de la biología, hay dos desarrollos tecnológicos que han causado enormes avances científicos en los últimos años, el desarrollo de la tecnología de secuenciación masiva y el desarrollo de tecnología CRISPR. El primero ha permitido abordar el estudio de multitud de genomas, epigenomas y transcriptomas de diferentes especies, tipos celulares e individuos que han causado un salto inimaginable en nuestro conocimiento sobre las características de los genomas, los cambios asociados a la evolución y las alteraciones genéticas que causan enfermedades en humanos. Así mismo, a través de esta tecnología, se ha podido determinar la importancia de la estructura tridimensional del genoma en la regulación de la expresión génica y cómo alteraciones de ésta causan enfermedades o contribuyen a la evolución de las especies. Todos estos estudios en su conjunto evidencian la inmensa cantidad de información que contienen los genomas y nos han revelado el gran trabajo que aún nos queda para identificar en su totalidad toda la información contenida en ellos. En este punto, el desarrollo de tecnología CRISPR está jugando y jugará un papel esencial. Esta tecnología permite editar genomas de una forma accesible a todos los laboratorios, democratizando este tipo de estudios a toda la comunidad científica. La posibilidad de realizar ensayos de edición genómica en muchos laboratorios, y el desarrollo de técnicas masivas basadas en CRISPR se traducirá en una comprensión cada vez mayor de los genomas. Esto es un aspecto crítico para poder en el futuro leer un genoma y a partir de ahí predecir, prevenir y curar todas las enfermedades genéticas. Hoy estamos en los inicios de una era que dará paso a la medicina personalizada en la cual la lectura de nuestros genomas permitirá definir procedimientos preventivos que nos permitan una mejor calidad de vida y posiblemente más extensa.

P.- ¿Qué camino queda por recorrer en ciencia e innovación en nuestro país?

R.- Por desgracia, queda un largo camino por recorrer en Ciencia e Innovación en nuestro país. La crisis, y sobre todo la ceguera de nuestros políticos, ha hecho un daño enorme en la ciencia en España. Solo hay que ver las estadísticas que se publican (no sé si se leen) día a día en los distintos medios. Mientras que en otros países de Europa la inversión en ciencia ha aumentado durante la crisis, en España se ha reducido un 30%. Hoy la inversión del gobierno en ciencia ha retrocedido a la que había a principios de siglo y no vemos que la recuperación económica que los que nos gobiernan predican se traslade a la ciencia, todo lo contrario, siguen recortando. Cada día nos alejamos más de nuestro entorno en inversión en ciencia. Nosotros formamos científicos que cuando ya están altamente preparados emigran al extranjero, de donde tienen muy pocas posibilidades de volver. Allí generan riqueza para esos países y contribuyen a su desarrollo. Aquí los perdemos, en la mayoría de los casos, para siempre. En consecuencia, han desaparecido 90.000 empleos en el sistema científico, las plantillas de los organismos públicos de investigación están altamente envejecidas y la investigación científica en la Universidad está desapareciendo. Con ello nos volvemos cada vez menos competitivos en ciencia y tecnología, generando menos publicaciones, menos patentes y menos capacidad de traslación a la sociedad. En un sistema cada vez más competitivo por unos recursos cada vez más escasos, los profesores universitarios, con una gran carga docente, cada vez tienen más dificultades para obtener financiación para investigar. Al alejarse de la ciencia en activo la calidad de la enseñanza universitaria también se ve afectada. El resultado final es un país con un tejido investigador cada vez más escaso y débil y una sociedad cada vez más dependiente del desarrollo tecnológico externo. Sin ciencia no solo no generamos conocimiento que se transforme en riqueza, sino que tenemos que pagar por dicho conocimiento, encareciendo el gasto público (pensad en lo que gastamos en sanidad) y empobreciendo aún más el país. Nuestros políticos y la sociedad, que es la que los elige, se tienen que dar cuenta que destruyendo la ciencia estamos condenados a ser un país de servicios, pobre y cada vez más sensible a los vaivenes económicos. Tenemos que cambiar esta situación antes de que el daño a la ciencia sea irreversible, para ello es la sociedad la que tiene que hacer ver a sus políticos que Sin Ciencia No Hay Futuro.

Perfil de José Luis Gómez Skarmeta

José Luis Gómez Skarmeta, Profesor de Investigación del CSIC en el Centro Andaluz de Biología del Desarrollo (Sevilla), es licenciado en Químicas por la Universidad de Murcia (1984) y doctorado en Ciencias por la Universidad Autónoma de Madrid (1995). Sus áreas de especialidad son la Biología del Desarrollo y la Evolución, la Biología Molecular, la Genética, la Genómica Funcional y la Epigenómica. Durante su carrera investigadora ha publicado más de 100 artículos en prestigiosas revistas de investigación. El Dr. Gómez Skarmeta ha sido pionero en combinar novedosas técnicas de epigenómica y de biología del desarrollo para estudiar la contribución de la información reguladora y la estructura de la cromatina al desarrollo, la evolución y las enfermedades humanas. Entre sus principales aportaciones recientes están la identificación del gen Irx3 como gen diana de las principales mutaciones asociadas a obesidad (Smemo y cols., Nature 2014), los estudios que demuestran la reorganización tridimensional del complejo Hox en la transición invertebrado-vertebrado (Acemel y cols. Nature Genetics 2016) y el reciente descubrimiento sobre la aleta dorsal de peces como origen evolutivo de las extremidades de vertebrados (Letelier y cols. Nature Genetics 2018).