Secuencias de DNA repetidas: ¿Quién dijo DNA basura?

Las secuencias de DNA repetidas abundan tanto en genomas eucariotas como procariotas. Estas secuencias son sitios de inestabilidad genómica y se caracterizan por experimentar cambios reversibles en la longitud de la secuencia repetida. Por esto, dichos cambios son conocidos como "mutaciones dinámicas". La inestabilidad de las repeticiones afecta tanto a la regulación de la expresión génica como a la función de las proteínas. El descubrimiento de que las secuencias repetidas actúan a modo de interruptores moleculares les confiere un papel clave en la evolución de los organismos.

Pocas técnicas de análisis molecular se han hecho tan populares que lleguen a aparecer en conocidas series de televisión. Porque detrás del análisis de una muestra de DNA recogida en el escenario de un crimen se encuentran las secuencias de DNA repetidas (1). La determinación de la huella genética de un individuo se basa precisamente en el análisis de diferentes regiones del genoma que contienen estas secuencias repetidas: las diferencias en la longitud de la repetición de un individuo a otro, las convierte en marcadores moleculares exclusivos dado su polimorfismo en poblaciones humanas.

En cuanto a su organización física, estas repeticiones pueden consistir desde múltiples copias de secuencias sencillas de pocos nucleótidos repetidas en tándem (microsatélites) a secuencias largas dispersas por el genoma. Es sorprendente que dichas repeticiones constituyan una elevada proporción del genoma de los organismos. De hecho durante mucho tiempo se le denominó DNA basura al no atribuírseles un papel funcional*. Este término, sin embargo, ha quedado obsoleto al descubrirse numerosos efectos fenotípicos dependientes del número de repeticiones. En efecto, independientemente de que la secuencia repetida se encuentre en una región codificante o no codificante, o en secuencias reguladoras, el cambio reversible en el número de repeticiones puede modular la función génica. Además, la tasa de mutación de estas secuencias es de 100 a 100.000 veces más alta que la de sustituciones de base. Dadas sus características mutacionales, hoy día se plantea la hipótesis de que las secuencias repetidas han desempeñado un papel fundamental en la evolución adaptativa.

Así, en numerosas bacterias patógenas se han identificado genes que se activan o inactivan por cambios en el número de microsatélites (2). Estos cambios pueden, desde variar los niveles de expresión a incluso interrumpir la pauta de lectura, produciendo una proteína truncada. Como estos cambios son reversibles, las secuencias repetidas actuarían como potenciómetros de regulación génica, generando un gran número de fenotipos que permitan una rápida adaptación a cambios del entorno como, por ejemplo, para evadir la respuesta inmune. Dada la reversibilidad de estas mutaciones, se podrían seleccionar de nuevo las variantes génicas de partida al revertir a las condiciones ambientales previas.

La regulación génica mediada por inestabilidad de repeticiones no sólo ocurre en procariotas: sorprendentemente, se ha descubierto que en el genoma de la levadura Sacharomyces cerevisiae hasta un 25% de todos los promotores génicos contienen secuencias repetidas. La variación de su longitud afecta incluso al posicionamiento de los nucleosomas y, consecuentemente, puede modificar la actividad transcripcional.

En eucariotas superiores se han descrito efectos sobre el ritmo circadiano en Drosophila, el comportamiento social en ratas de agua o a la morfología del esqueleto en perros domésticos como consecuencia de las alteraciones en el número de secuencias repetidas (3).

En humanos las diferencias alélicas en el número de repeticiones pueden causar una amplia variedad de enfermedades, siendo el grupo de las enfermedades asociadas a la expansión de repeticiones de trinucleótidos las más conocidas (enfermedad de Huntington, Ataxia de Friedreich, etc). A partir de un valor umbral en el número de repeticiones, éstas se vuelven más inestables, llevando a la acumulación de docenas a miles de repeticiones en pocas generaciones. Este grupo de enfermedades se caracteriza por el fenómeno de la anticipación génica, consistente en una manifestación a edades más tempranas y un aumento en la severidad de la enfermedad conforme se hereda de una generación a la siguiente.

¿Cuál es el mecanismo molecular que genera cambios en el número de repeticiones? Se sabe que fallos en el sistema de reparación o recombinación celular afectan a la inestabilidad de repeticiones. Así, en determinados tipos de cáncer, la alteración de una enzima de reparación de DNA dispara la expansión o contracción de repeticiones, hasta tal punto que la inestabilidad de microsatélites ofrece una posibilidad para su detección precoz (4). Además, los errores producidos durante la replicación del DNA tienen un papel relevante en la inestabilidad de repeticiones. La gran mayoría de secuencias repetidas tienen la capacidad de formar estructuras secundarias que bloquean la DNA polimerasa replicativa (5). En esta situación, el complejo de replicación se disocia, favoreciendo el desapareamiento de las hebras líder y retrasada. En esta situación, el DNA naciente correspondiente a la región repetida puede anillarse fuera de fase con cualquier otra repetición, generando una deleción o una expansión. Este tipo de errores de replicación es conocido como errores de deslizamiento de hebra o de tipo «replication slippage».

A modo de corolario, dada la inestabilidad de las secuencias de DNA repetidas en el genoma, éstas podrían actuar como un arma de doble filo: posiblemente la aparición de enfermedades asociadas a la expansión de repeticiones sea el tributo a pagar por disponer de un mecanismo que permite generar variantes génicas que posibilitan una rápida adaptación al entorno.

(*) Recientemente (6) se han publicado los resultados del proyecto ENCODE, un proyecto internacional para el análisis exhaustivo de la función de la secuencia del genoma humano. Sin entrar en la polémica suscitada por dicho estudio (7), aquí me limito a presentar la funcionalidad de las mencionadas secuencias repetidas que afectan a la expresión génica.

Deleción de secuencias de DNA repetidas por deslizamiento de hebra. Las secuencias repetidas de DNA pueden formar estructuras secundarias en la horquilla de replicación durante la apertura de la doble hélice que se produce cuando la molécula de DNA está replicando. Esta estructura produce un bloqueo de la DNA polimerasa, lo que posibilita que el DNA recién sintetizado se relocalice en otra posición dentro de la región repetida, generando una deleción en la cadena naciente. Las flechas rojas representan las unidades repetidas, el DNA flanqueante se muestra en naranja. El círculo naranja representa la DNA polimerasa. Modificado de Viguera et al. 2001b.
REFERENCIAS
  1. Lorente, JA. Genética forense: de la escena del crimen al laboratorio. 2010. En Encuentros con la Ciencia II: del macrocosmos al microcosmos. Capítulo 10. pp 115-126. Viguera E, Grande, A. y Lozano, J. (coordinadores). Servicio de Publicaciones de la Universidad de Málaga. www.encuentrosconlaciencia.es
  2. Moxon ER, Wills C. Microsatélites de ADN. Investigación y Ciencia. Temas 38: 14-19
  3. Ellegren, H. Microsatellites: simple sequences with complex evolution. Nat Rev. Genet. 2004; 5: 435- 445
  4. Perucho M. Cáncer del fenotipo mutador de microsatélites. Investigación y Ciencia. 1998; 261: 46-55
  5. Viguera E, Canceill D, Ehrlich SD. Replication slippage involves DNA polymerase pausing and dissociation. EMBO Journal (2001). 20: 2587 -2595
  6. ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome. Nature. 2012; 489: 57-74
  7. Maher, B. Fighting about ENCODE and junk. http://blogs.nature.com/news/2012/09/fighting-about-encode-and-junk.html