Hasta hace relativamente poco tiempo, se estimaba que tan solo entre un 15 o 20 % del genoma era funcional y todo lo demás se denominaba, con cierta polémica, como “ADN basura”. En 2012, se publicaron los resultados del proyecto ENCODE (del inglés Encyclopedia of DNA Elements) y se pueden considerar como una de las mayores revoluciones en la biología molecular contemporánea. El proyecto ENCODE (1,2) demostró que al menos un 80% del genoma humano tiene algún tipo de actividad biológica e hicieron público al mismo tiempo más de 15 terabytes de datos de libre disposición para utilizarlo en investigación.
Recordemos brevemente que el ADN se enrolla sobre unas proteínas, o histonas, formando nucleosomas que representan la unidad estructural de la cromatina que es como se encuentra el material genético en el núcleo celular. La organización de la cromatina se caracteriza por unos grandes dominios espaciales -o territorios- que abarcan gran parte de los cromosomas (Figura 1A). Estos territorios se conocen como dominios de la cromatina (“chromatin domains” en inglés)y son parecidos en todas las células del organismo, pero estos contienen a su vez unos sub-dominios que son muy variables y pueden presentar distinto grado de compactación (Figura 1A).
La compactación de la cromatina es clave para que los elementos reguladores (como los denominados enhancers o los promotores) estén accesibles e interaccionen con unas proteínas con capacidad de unión al ADN que se conocen como factores de transcripción. Estos factores de transcripción son en esencia los “conductores” básicos de la regulación de los genes al poner en marcha los distintos “programas” funcionales de las células. Para ello, primero deben poder unirse a unas secuencias específicas en el ADN para activar o desactivar la expresión de sus genes diana. De alguna forma, podemos decir que hay compartimentalización del genoma que varía entre las distintas células de nuestro organismo, algo fundamental para organizar la cromatina y que funcionen los mecanismos que la regulan.
La epigenética es el área encargada de estudiar la arquitectura de la cromatina y se centra en caracterizar las modificaciones químicas que se producen de forma natural en las histonas (ej. acetilaciones y metilaciones) o directamente en el ADN (ej. metilaciones). Estos cambios químicos en la cromatina hacen que algunas regiones del genoma estén accesibles (abiertas) y otras inaccesibles (cerradas) a los factores de transcripción.
Un dato interesante, a partir de los estudios genéticos, es que de los miles de variaciones genéticas (3) asociadas a enfermedades tan solo un 5% de ellas se localizan en regiones que codifican para proteínas. Esto nos indica que la gran mayoría de la variabilidad genética, conocida y asociada a problemas de salud, se localiza principalmente en regiones no codificantes y, gracias al proyecto ENCODE, sabemos que éstas afectan sobre todo a regiones reguladoras. Si tenemos en cuenta que cualquier célula humana expresará varios miles de genes, podemos fácilmente imaginar la complejidad del circuito de conexiones que se forma en el núcleo celular entre factores de transcripción y sus respectivos genes dianas. Estas conexiones se conocen como redes de regulación génica y se encargan de programar aquellos genes que mantienen la fisiología celular y las funciones específicas de cada tipo celular (Figura 1B). Hoy en día, es posible estudiar estas redes de regulación mediante técnicas de alto rendimiento que permiten valorar el grado de accesibilidad en la cromatina (ej. ATAC-Seq (3)), qué factores de transcripción se unen a los elementos reguladores del ADN (ej. ChIP-Seq (4)) y qué interacciones se producen entre distintas regiones de la cromatina (ej. Hi-C (5)). Gracias a esta información podemos conocer, por ejemplo, si entre las células de tu cerebro y tus músculos hay diferencias de accesibilidad en los elementos reguladores de algunos genes, cuantificar qué factores de transcripción tienen más relevancia para cada tipo celular o examinar el conjunto de genes que están activos o inactivos. Uno de los retos más prometedores de la epigenética consiste en descifrar dichas redes de regulación y entender cómo operan en las células.
Las conexiones de las redes de regulación génica evolucionan y se adaptan con el tiempo y, por este motivo, caracterizarlas es imprescindible para entender procesos dinámicos como la diferenciación celular, el desarrollo embrionario o los cambios progresivos en células afectadas por enfermedad. Sin embargo, dichas redes también son sensibles a perturbaciones inducidas por agentes externos (ej. tratamientos farmacológicos, estrés o la exposición a ciertos hábitos de vida) e internos (ej. variaciones genéticas) que pueden alterar las interacciones reguladoras. Así, por ejemplo, una variación genética puede afectar al funcionamiento de un factor de transcripción, pero también puede alterar la estructura de los sub-dominios de la cromatina perjudicando a la regulación de ciertos genes diana.
Por último, hay que resaltar que la mayoría de estos avances se desencadenan por los progresos en las técnicas de secuenciación, así como las estrechas alianzas entre científicos de diversas áreas de la biología molecular como la epigenética, la genómica funcional y la bioinformática. El éxito de este ambicioso reto gravita alrededor de una sofisticada integración de datos sobre la variabilidad genética de los individuos, la expresión de genes y epigenética; para definir con precisión la arquitectura funcional de los genomas.