De todos es sabido que las proteínas constituyen la maquinaria fundamental de la célula y que prácticamente todas las funciones biológicas están llevadas a cabo por estas moléculas. La capacidad de analizarlas en su totalidad, en su entorno natural, a gran escala y de forma sistemática abriría, pues, el camino al estudio generalizado de los mecanismos moleculares de cualquier proceso fisiológico o patológico, y a la detección de bio-marcadores de diagnóstico o pronóstico de cualquier enfermedad. Pero, ¿hasta qué punto tiene la proteómica actual esta capacidad? Esta pregunta no es trivial, y hace sólo unos pocos años se consideraba un objetivo imposible de conseguir.
Muchos investigadores asocian la proteómica con la electroforesis bidimensional, que todavía constituye la técnica más poderosa para separar las proteínas de una muestra biológica y que permite obtener un «mapa» donde es posible situar gráficamente cada una de ellas. Las proteínas así separadas pueden identificarse mediante digestión tríptica y posterior análisis de los péptidos obtenidos por espectrometría de masas del tipo MALDI-TOF/TOF. Pero esta estrategia, que despertó en su momento mucho entusiasmo en la comunidad científica, no permite visualizar mucho más allá del millar de proteínas, y su capacidad de identificación efectiva no supera algunos centenares. Por ello la visión que se obtiene del proteoma es muy limitada. Para hacernos una idea, se calcula que una célula humana expresa alrededor de 10.000 productos génicos diferentes, de los cuales los más relevantes suelen ser precisamente los menos abundantes.
Afortunadamente, las técnicas de proteómica de segunda generación han revolucionado este panorama. Estas técnicas sortean el escollo de trabajar con proteínas aisladas y en su lugar se concentran en el análisis masivo de los péptidos trípticos producidos a partir del proteoma completo, que son considerablemente más fáciles de manejar. De ahí su calificativo de «shotgun» o «peptide-centric proteomics». Dichos péptidos se identifican mediante cromatografía líquida acoplada a espectrometría de masas en tándem, con o sin fraccionamiento previo mediante otras técnicas ortogonales, como el intercambio iónico o el isoelectroenfoque. Estas técnicas hacen un uso intensivo de la espectrometría de masas, y el desarrollo de instrumentos híbridos de nueva generación (que combinan equipos convencionales muy robustos como cuadrupolos o trampas lineales con analizadores del tipo TOF u orbitrap de alta resolución) ha multiplicado espectacularmente el número de proteínas que se pueden identificar en un único análisis. Los equipos actuales son capaces de fragmentar cerca de 100.000 especies peptídicas en una única carrera cromatográfica, de las cuales, con un poco de habilidad, es posible identificar varias decenas de miles de péptidos, que suponen varios miles de proteínas. En el 2011 se publicó la identificación del proteoma completo de levadura (unas 4.000 proteínas) en una única carrera cromatográfica(1). Y poco después se ha conseguido la cobertura completa de dos líneas celulares humanas (>10.000 proteínas)(2,3). Estos resultados demuestran, por primera vez, que el proteoma entero de células humanas está al alcance de la tecnología actual. Además, la combinación de estas técnicas con estrategias de marcaje con isótopos estables, ya sea metabólicas, químicas o enzimáticas(4-6), permiten una cuantificación relativa extremadamente precisa de la concentración de las proteínas, abriendo el camino al estudio a gran escala de las alteraciones dinámicas que tienen lugar en el proteoma en respuesta a procesos fisiopatológicos.
Es cierto que hablamos de una tecnología sofisticada y que pocos grupos consiguen acercarse a estos récords de identificación. Pero la estrategia masiva no es el único camino. De hecho, los resultados proteómicos más relevantes de los últimos años se han conseguido concentrando los estudios en sistemas menos complejos, los llamados «proteomas ricos en información», donde sin necesidad de alcanzar tamaña excelencia tecnológica se pueden conseguir coberturas muy completas. Estos subproteomas pueden obtenerse mediante una interminable lista de estrategias, que incluyen el fraccionamiento subcelular (proteoma mitocondrial, exosoma, secretoma7, «sheddoma») y la cromatografía de afinidad (fosfoproteoma), o utilizando las propiedades de unión específica de proteínas o anticuerpos (interactomas, quinomas). Otras aproximaciones ingeniosas combinan modificaciones químicas o enzimáticas con estrategias de marcaje y purificación selectivos que permiten enriquecer subpoblaciones de péptidos modifi-cados o procesados de forma muy específica (nitrosiloma, degradoma, proteoma posicional, proteoma redox)(8).
Y las ideas no acaban ahí. Los modernos equipos son tan rápidos y tienen tanta resolución que comienza a resultar factible hacerlos funcionar de forma «ciega», programándolos para que fragmenten todas las especies peptídicas imaginables. Se obtiene así un compendio completo de todos los fragmentos, de donde, en teoría, sería posible reconstruir la traza de cualquier péptido y por tanto cuantificar cualquier proteína. La idea no es realmente tan descabellada y ya se han conseguido resultados prometedores (9). Y el ritmo actual con el que están evolucionando los espectrómetros de masas nos hace pensar que en un futuro más próximo de lo que parece será posible cuantificar y caracterizar absolutamente todos los componentes del proteoma humano, en cuestión de minutos. Claro que determinar la función biológica de estos componentes y de sus modificaciones es otra historia. Que merece un capítulo aparte.
Referencias:
- Nagaraj, N. et al. Systems-wide perturbation analysis with near complete coverage of the yeast proteome by single-shot UHPLC runs on a bench-top Orbitrap. Mol Cell Proteomics, (2012) 11, M111.013722.
- Beck, M. et al. The quantitative proteome of a human cell line. Mol Syst Biol 7, 549, doi:10.1038/msb.2011.82 (2011).
- Nagaraj, N. et al. Deep proteome and transcriptome mapping of a human cancer cell line. Mol Syst Biol (2011) 7, 548, doi:10.1038/msb.2011.81.
- Bonzon-Kulichenko, E. et al. A robust method for quantitative high-throughput analysis of proteomes by 18O labeling. Mol. Cell Proteomics (2011) 10, M110 003335.
- Jorge, I. et al. Statistical model to analyze quantitative proteo-mics data obtained by 18O/16O labeling and linear ion trap mass spectrometry: application to the study of vascular endo-thelial growth factor-induced angiogenesis in endothelial cells. Mol. Cell Proteomics (2009) 8, 1130-1149.
- Ramos-Fernandez, A., et al. Improved method for differential expression proteomics using trypsin-catalyzed 18O labeling with a correction for labeling efficiency. Mol Cell Proteomics (2007) 6, 1274-1286.
- Bonzon-Kulichenko, E. et al. Quantitative in-depth analysis of the dynamic secretome of activated Jurkat T-cells. J. Proteomics (2011) 75, 561-571.
- Martinez-Acedo, P. et al. A novel strategy for global analysis of the dynamic thiol redox proteome. Mol. Cell. Proteomics (2012) 11, 800-813.
- Gillet, L. C. et al. Targeted data extraction of the MS/MS spec-tra generated by data-independent acquisition: a new concept for consistent and accurate proteome ana-lysis. Mol Cell Proteomics (2012) 11, O111.016717.