Genoma humano

Embed Size (px)

Citation preview

El genoma humano

Alberto Bermudez Polo

Para situar el estudio sobre el genoma humano hay que remontarse a los primeros estudios sobre la gentica y la herencia.

La historia de la gentica se considera que comienza con el trabajo del monje agustino Gregor Mendel. Su investigacin sobre hibridacin en guisantes, publicada en 1866, describe lo que ms tarde se conocera como las leyes de Mendel.En experimentos de cruza realizados entre 1856 y 1863, Gregor Mendel traz por primera vez los patrones hereditarios de ciertos rasgos en plantas de guisante y mostr que obedecan a reglas estadsticas sencillas. A pesar de que no todas las caractersticas muestran los patrones de la herencia mendeliana, su trabajo sirvi como prueba de que la aplicacin de estadstica a la herencia poda ser sumamente til. A partir de esa poca muchas formas ms complejas de herencia han sido demostradas.

A partir de su anlisis estadstico, Mendel defini un concepto al que llam alelo, al cual concibi como la unidad fundamental de la herencia. Esta utilizacin del trmino alelo es casi un sinnimo del contemporneo trmino gen. Sin embargo, en la actualidad alelo indica a una variante especfica de un gen en particular.

El trabajo de Mendel se public en 1866 bajo el ttulo Experimentos sobre hibridacin de plantas (en alemn: "Versuche ber Pflanzenhybriden") en las Actas de la Sociedad de Historia Natural de Brno (en alemn: Verhandlungen des Naturforschenden zu Brnn), despus de haberlo dado a conocer en dos conferencias de la misma sociedad a principios de 1865.

El trabajo de Mendel fue publicado en una revista acadmica relativamente desconocida, y no se le dio ninguna atencin en la comunidad cientfica. En cambio, las discusiones sobre modalidades de la herencia fueron galvanizadas por la teora de Charles Darwin de la evolucin por seleccin natural, en la cual parecan requerirse mecanismos no lamarquianos de la herencia. La propia teora de la herencia de Darwin, pangnesis, no encontr mucho nivel de aceptacin. Una versin ms matemtica de la pangnesis, la cual descartaba mucho de los remanentes lamarquistas de Darwin, fue desarrollada como la escuela de la herencia "biomtrica" por el primo de Darwin, Francis Galton. Bajo Galton, y su sucesor Karl Pearson, la escuela biomtrica intent construir modelos estadsticos para la herencia y la evolucin, con xito limitado pero autntico, aunque los mtodos exactos de la herencia eran desconocidos y se cuestionaban ampliamente.

El ao 1900 marc el redescubrimiento de Mendel por parte de Hugo de Vries, Carl Correns y Erich von Tschermak, y para 1915 los principios bsicos de la gentica mendeliana haban sido aplicados a una amplia variedad de organismos, donde destaca notablemente el caso de la mosca de la fruta (Drosophila melanogaster). Bajo el liderazgo de Thomas Hunt Morgan y sus compaeros drosofilistas, los especialistas en gentica desarrollaron la teora mendeliana-cromosmica de la herencia, la cual fue ampliamente aceptada para 1925. Paralelamente al trabajo experimental, los matemticos desarrollaron el marco estadstico de la gentica de poblaciones, y llevaron la interpretacin gentica al estudio de la evolucin.

Con los patrones bsicos de la herencia gentica establecidos, muchos bilogos se volvieron hacia investigaciones sobre la naturaleza fsica de los genes. En los aos cuarenta y a principios de los cincuenta, los experimentos sealaron al ADN como la parte de los cromosomas (y quizs otras nucleprotenas) que contena genes.

El enfoque sobre nuevos organismos modelo tales como virus y bacterias, junto con el descubrimiento en 1953 de la estructura en doble hlice del ADN, marcaron la transicin a la era de la gentica molecular. En los aos siguientes, algunos qumicos desarrollaron tcnicas para secuenciar tanto a cidos nucleicos como a protenas, mientras otros solventaban la relacin entre estos dos tipos de biomolculas: el cdigo gentico. La regulacin de la expresin gnica se volvi un tema central en los aos sesenta, y para los aos setenta dicha expresin gnica poda ser controlada y manipulada utilizando ingeniera gentica. Durante ls ltimas dcadas del siglo XX muchos bilogos se enfocaron a proyectos genticos a gran escala, secuenciando genomas enteros.

A continuacin se nombran algunos de los acontecimientos ms destacables en el campo de la gentica:

1865: Publicacin del artculo de Gregor Mendel Experimentos sobre hibridacin de plantas 1869: Friedrich Miescher descubre lo que hoy se conoce como ADN. 1880-1890: Walther Flemming, Eduard Strasburger, y Edouard Van Beneden describen la distribucin cromosmica durante la divisin celular. 1903: Walter Sutton establece la hiptesis segn la cual los cromosomas, segregados de modo mendeliano, son unidades hereditarias.1 1905: William Bateson acua el trmino gentica en una carta dirigida a Adam Sedgwick.2 1906: William Bateson propone el trmino gentica.3 1908: Ley de Hardy-Weinberg 1910: Thomas Hunt Morgan demuestra que los genes residen en los cromosomas. 1913: Alfred Sturtevant realiza el primer mapa gentico de un cromosoma. 1913: Los mapas genticos muestran cromosomas con genes organizados linealmente. 1918: Ronald Fisher publica "The Correlation Between Relatives on the Supposition of Mendelian Inheritance" (en espaol "La correlacin entre parientes con base en la suposicin de la herencia mendeliana"). Comienza la llamada sntesis evolutiva moderna. 1928: Frederick Griffith descubre que el material hereditario de bacterias muertas puede ser incorporado en bacterias vivas. 1931: El entrecruzamiento cromosmico se identifica como la causa de la recombinacin gentica. 1933: Jean Brachet demuestra que el ADN se encuentra en los cromosomas y que el ARN est presente en el citoplasma de todas las clulas. 1941: Edward Lawrie Tatum y George Wells Beadle muestran que los genes codifican las protenas. 1944: Oswald Theodore Avery, Colin MacLeod y Maclyn McCarty aslan ADN como material gentico4 1950: Erwin Chargaff muestra que los cuatro nucletidos no estn presentes en los cidos nucleicos en proporciones estables, pero que parecen existir algunas leyes generales. La cantidad de adenina (A), por ejemplo, tiende a ser igual a la de timina (T). Barbara McClintock descubre los transposones en el maz. 1952: El experimento Hershey-Chase prueba que la informacin gentica de los fagos (y de todos los organismos) es ADN. Rosalind Franklin obtiene la llamada Fotografa 51, la primera imagen del ADN realizada mediante difraccin de rayos X. 1953: James D. Watson y Francis Crick demuestran la estructura de doble hlice del ADN5 1956: Joe Hin Tjio y Albert Levan determinan que es 46 el nmero de cromosomas en los seres humanos. 1958: El experimento Meselson-Stahl demuestra que el ADN se replica de modo semiconservador. 1961: El cdigo gentico se ordena en tripletes. 1964: Howard Temin muestra, utilizando virus de ARN, que la direccin de transcripcin ADN-ARN puede revertirse. 1970: Se descubren las enzimas de restriccin, lo que permite a los cientficos cortar y pegar fragmentos de ADN. 1972: Walter Fiers y su equipo, en el Laboratorio de biologa molecular de la Universidad de Gante (Gante, Blgica), fueron los primeros en determinar la secuencia de un gen: el gen para la protena del pelo del bacterifago MS2.6 1976: Walter Fiers y su equipo determinan la secuencia completa del ARN del bacterifago MS27 1977: Primera secuenciacin del ADN por Fred Sanger, Walter Gilbert y Allan Maxam.8 1983: Kary Banks Mullis descubre la reaccin en cadena de la polimerasa. 1989: Francis Collins y Lap-Chee Tsui secuencian el gen humano codificador de la protena CFTR. 1995: Se secuencia por primera vez el genoma de un organismo vivo (Haemophilus influenzae). 1996: Primera secuenciacin de un genoma eucariota: Saccharomyces cerevisiae. 1998: Primera secuenciacin del genoma de un eucariota multicelular:Caenorhabditis elegans. 2001: Primeras secuencias del genoma humano por parte del Proyecto Genoma Humano y Celera Genomics 2003: El Proyecto Genoma Humano publica la primera secuenciacin completa del genoma humano con un 99.99% de fidelidad.

De todos estos proyectos el ms actual e importante es el proyecto del genoma humano:

El Proyecto Genoma Humano (PGH) fue un proyecto de investigacin cientfica con el objetivo fundamental de determinar la secuencia de pares de bases qumicas que componen el ADN e identificar y cartografiar los aproximadamente 20.000-25.000 genes del genoma humano desde un punto de vista fsico y funcional.

El proyecto, dotado con 3000 millones de dlares, fue fundado en 1990 en el Departamento de Energa y los Institutos Nacionales de la Salud de los Estados Unidos, bajo la direccin del doctor Francis Collins, quien lideraba el grupo de investigacin pblico , conformado por mltiples cientficos de diferentes pases, con un plazo de realizacin de 15 aos. Debido a la amplia colaboracin internacional, a los avances en el campo de la genmica, as como los avances en la tecnologa computacional, un borrador inicial del genoma fue terminado en el ao 2000 (anunciado conjuntamente por el expresidente Bill Clinton y el ex-primer ministro britnico Tony Blair el 26 de junio de 2000), finalmente el genoma completo fue presentado en abril del 2003, dos aos antes de lo esperado. Un proyecto paralelo se realiz fuera del gobierno por parte de la Corporacin Celera. La mayora de la secuenciacin se realiz en las universidades y centros de investigacin de los Estados Unidos, Canad, Nueva Zelanda, Gran Bretaa y Espaa.

El genoma humano es la secuencia de ADN de un ser humano. Est dividido en fragmentos que conforman los 23 pares de cromosomas distintos de la especie humana (22 pares de autosomas y 1 par de cromosomas sexuales). El genoma humano est compuesto por aproximadamente entre 22500 y 25000 genes distintos. Cada uno de estos genes contiene codificada la informacin necesaria para la sntesis de una o varias protenas (o ARN funcionales, en el caso de los genes ARN). El "genoma" de cualquier persona (a excepcin de los gemelos idnticos y los organismos clonados) es nico.La secuencia de ADN que conforma el genoma humano contiene codificada la informacin necesaria para la expresin, altamente coordinada y adaptable al ambiente, del proteoma humano, es decir, del conjunto de las protenas del ser humano. Las protenas, y no el ADN, son las principales biomolculas efectoras; poseen funciones estructurales, enzimticas, metablicas, reguladoras, sealizadoras..., organizndose en enormes redes funcionales de interacciones. En definitiva, el proteoma fundamenta la particular morfologa y funcionalidad de cada clula. Asimismo, la organizacin estructural y funcional de las distintas clulas conforma cada tejido y cada rgano, y, finalmente, el organismo vivo en su conjunto. As, el genoma humano contiene la informacin bsica necesaria para el desarrollo fsico de un ser humano completo. Conocer la secuencia completa del genoma humano puede tener mucha relevancia cuanto a los estudios de biomedicina y gentica clnica, desarrollando el conocimiento de enfermedades poco estudiadas, nuevas medicinas y diagnsticos ms fiables y rpidos. Sin embargo descubrir toda la secuencia gnica de un organismo no nos permite conocer su fenotipo. Como consecuencia, la ciencia de la genmica no podra hacerse cargo en la actualidad de todos los problemas ticos y sociales que ya estn empezando a ser debatidos. Por eso el PGH necesita una regulacin legislativa relativa al uso del conocimiento de la secuencia genmica, pero no tendra por qu ser un impedimento en su desarrollo, ya que el saber en s, es inofensivo.

Antes de los ochenta ya se conoca la secuencia de genes sueltos de algunos organismos, como tambin se conocan los genomas de entidades subcelulares, tales como virus y plsmidos. As pues, no fue hasta 1986 cuando el Ministerio de Energa (DOE), concret institucionalmente el Proyecto Genoma Humano (PGH) durante un congreso en Santa Fe. El PGH contaba con una buena suma econmica y sera utilizado para estudiar los posibles efectos de las radiaciones sobre el ADN. Al siguiente ao, en el congreso de bilogos en el Laboratorio de Cold Spring Harbor, el Instituto Nacional de la Salud (NIH) quiso participar del proyecto al ser otro organismo pblico con mucha ms experiencia biolgica, si bien no tanta en la organizacin de proyectos de esta magnitud.

El debate pblico que suscit la idea capt la atencin de los responsables polticos, no solo porque el Proyecto Genoma Humano era un gran reto tecnocientfico, sino por las tecnologas de vanguardia que surgiran, as como porque el conocimiento obtenido asegurara la superioridad tecnolgica y comercial del pas. Antes de dar luz verde a la iniciativa del PGH se necesit por un lado el informe de 1988 de la Oficina de Evaluacin Tecnolgica del Congreso (OTA) y el del Consejo Nacional de Investigacin (NRC). Ese ao se inaugur HUGO (Organizacin del Genoma Humano) y James D. Watson fue nombrado alto cargo del proyecto. Sera reemplazado por Francis Collins en abril de 1993, en gran parte por su enemistad con Bernadine Healy que era su jefe por aquel entonces. Tras esto el nombre del Centro cambi a Instituto Nacional de Investigaciones del Genoma Humano (NHGRI).

En 1990 se inaugur definitivamente el Proyecto Genoma Humano calculndose quince aos de trabajo. Sus objetivos principales en una primera etapa eran la elaboracin de mapas genticos y fsicos de gran resolucin, mientras se ponan a punto nuevas tcnicas de secuenciacin, para poder abordar todo el genoma. Se calcul que el PGH americano necesitara unos 3000 millones de dlares y terminara en 2005. En 1993 los fondos pblicos aportaron 170 millones de dlares, mientras que la industria gast aproximadamente 80 millones. Con el paso de los aos, la inversin privada cobr relevancia y amenaz con adelantar a las financiaciones pblicas.

En 1984 comenzaron las actividades propias del PGH, coincidiendo con la idea de fundar un instituto para la secuenciacin del genoma humano por parte de Robert Sanshheimerm, en ese momento Rector de la Universidad de California. De forma independiente el Departamento de Energa de Estados Unidos (DOE) se interes por el proyecto, al haber estudiado los efectos que las actividades de sus programas nucleares producan en la gentica y en las mutaciones. Entonces se conoca como "Proyecto HUGO".

En su comienzo, el Proyecto Genoma Humano, enfrent a dos clases de cientficos: de un lado, los bilogos moleculares universitarios y del otro, bilogos de institutos de investigacin del Instituto Nacional de Salud, organismo estatal que perciba grandes sumas econmicas federales destinadas a la investigacin. Si bien el enfrentamiento se bas en la preocupacin de ambos cientficos por la magnitud y los costos de la empresa a llevar a cabo, existan sobre todo discrepancias para definir las vas ms adecuadas a la hora de lograr los objetivos fijados. Solo debemos observar los 28.2 millones de dlares destinados al periodo 88-89 para ubicarnos materialmente. Por su parte, los Estados Unidos se comprometieron a destinar parte de los fondos econmicos del proyecto al estudio de los aspectos ticos y sociales del PGH.

James Watson asumi en 1988 la direccin ejecutiva de la Investigacin del Genoma Humano en el NIH (Instituto Nacional de Salud). Al asumir el cargo, firm un acuerdo de cooperacin con el DOE mediante el cual ambas instituciones se ayudaran mutuamente. De esta forma el PGH comenz con el liderazgo del NIH en lugar del DOE. El inters internacional por el proyecto creci de forma notable, motivado fundamentalmente por no quedar por detrs de Estados Unidos en un tema de tanta importancia. Para evitar repeticiones y solapamientos en los logros, se cre HUGO (Organizacin del Genoma Humano) para coordinar los trabajos de investigacin.

En 1994 Craig Venter funda, con un financiamiento mixto, el Instituto para la Investigacin Gentica (TIGR) que se dio a conocer pblicamente en 1995 con el descubrimiento de la secuencia nucleotdica del primer organismo completo publicado, la bacteria Haemophilus influenzae con cerca de 1740 genes (1.8 Mb). En mayo de 1998 surgi la primera empresa relacionada con el PGH llamada Celera Genomics. La investigacin del proyecto se convirti en una carrera frentica en todos los laboratorios relacionados con el tema, ya que se intentaba secuenciar trozos de cromosomas para rpidamente incorporar sus secuencias a las bases de datos y atribuirse la prioridad de patentarlas.

El 6 de abril de 2000 se anunci pblicamente la terminacin del primer borrador del genoma humano secuenciado que localizaba a los genes dentro de los cromosomas. Los das 15 y 16 de febrero de 2001, las dos prestigiosas publicaciones cientficas americanas, Nature y Science, publicaron la secuenciacin definitiva del Genoma Humano, con un 99.9% de fiabilidad y con un ao de antelacin a la fecha presupuesta. Sucesivas secuenciaciones condujeron finalmente al anuncio del genoma esencialmente completo en abril de 2003, dos aos antes de lo previsto.1 En mayo de 2006 se alcanz otro hito en la culminacin del proyecto al publicarse la secuencia del ltimo cromosoma humano en la revista Nature.

Objetivos

Desde el principio de la investigacin, se propuso desarrollar el PGH a travs de dos vas independientes, pero relacionadas y ambas esenciales:Secuenciacin: se trataba de averiguar la posicin de todos los nucletidos del genoma (cada una de las cuatro posibles bases nitrogenadas tpicas del ADN).

Cartografa o mapeo gentico: consista en localizar los genes en cada uno de los 23 pares de cromosomas del ser humano.

-Identificacin de los genes en el genoma humano:El Genoma humano est compuesto por aproximadamente 30.000 genes, cifra bastante prxima a la mencionada en el borrador del proyecto, publicado en el ao 2000, ocasin en la que las genes oscilaban entre 26.000 y 38.000. Otra peculiaridad del PGH es que la cifra de genes humanos es solo dos o tres veces mayor que la encontrada en el genoma de Drosophila, y cualitativamente hablando, existen genes comunes a los de bacterias y que no han sido hallados en nuestros ancestros.-Determinacin de la secuencia de las bases nitrogenadas que forman el ADN humano:Los humanos poseen poco ms de 3 mil millones de bases nitrogenadas, similar al tamao de genomas de otros vertebrados.-Mantenimiento a resguardo de la informacin anterior creando bases de datos de acceso pblico:En estos momentos son una realidad las bases de datos donde se almacena toda la informacin surgida del Proyecto Genoma Humano. Si accedemos a Internet podremos conocer libremente aspectos de alto inters en la comparacin entre genomas de distintas especies de animales y plantas. Gracias al uso libre de este conocimiento es posible determinar la funcin de los genes, as como averiguar cmo las mutaciones influyen en la sntesis de protenas.-Aprovisionamiento de herramientas multimedia para el anlisis de datos:Se ha inducido un gran desarrollo tecnolgico a partir de la creacin de herramientas de anlisis de datos generadas en el Proyecto Genoma Humano. Este desarrollo facilitar y har posible definir los temas de estudio futuros con vistas a las tareas pendientes. Entre las tecnologas beneficiadas gracias al PGH figuran las de manejo computacional de datos, las que permiten la generacin de las anteriores, tcnicas de biologa molecular relacionadas con la secuenciacin de trozos de ADN automticamente y aquellas que permiten ampliar la cantidad de material gentico disponible como la PCR.-Transferencia de tecnologa relacionada con el tema al sector privado:Se ha producido una importante corriente de liberacin de derechos que anteriormente estaban en manos del Estado, en relacin a la transferencia de tecnologas al sector privado. Esta medida ha suscitado aplausos y crticas. Por un lado se ampla el acceso libre a los datos del Proyecto con lo que muchas ms personas pueden seguir estudiando este campo, pero por otro esto puede suponer el incremento de poder de ciertos sectores que a su vez, aumentaran su influencia en la sociedad.-Supervisin de los temas ticos, legales y sociales derivados del Proyecto:Para terminar, se puede afirmar que el objetivo relacionado con el estudio de la tica del PGH es un tema de gran controversia actual, y ha necesitado de grandes sumas de dinero estatales as como de un importante trabajo de laboratorios e investigadores. Todo esto ha provocado un deterioro del apoyo a otros proyectos de investigacin no menos importantes, que se han visto muy afectados o incluso cancelados.

Mtodos de estudio

Existen dos tcnicas de cartografa gentica principales: el ligamiento, que intenta averiguar el orden de los genes; y la cartografa fsica, que se encarga de estudiar la distancia de los genes en el interior del cromosoma. Las dos tcnicas utilizan marcadores genticos, que son caractersticas moleculares o fsicas que se heredan, y son detectables y distintas para cada individuo.Thomas Hunt Morgan desarroll en la dcada de 1900 la cartografa mediante ligamiento al estudiar la frecuencia con la que ciertas caractersticas se heredaban unidas en moscas de la fruta. As lleg a la conclusin de que algunos genes deban estar ligados en los cromosomas. Los mapas de ligamiento humano se han creado estudiando pautas de herencia de familias muy extensas y con varias generaciones conocidas. Aunque al principio se limitaban a los rasgos fsicos heredables, fcilmente reconocibles, actualmente hay tcnicas ms elaboradas que permiten crear mapas de ligamiento comparando la posicin de genes diana en comparacin con el orden de los marcadores genticos o de partes conocidas del ADN.La cartografa fsica es capaz de medir la distancia real entre puntos de los cromosomas. Las tcnicas ms avanzadas combinan robtica, informtica y uso de lser para calcular la distancia entre marcadores genticos conocidos. Para conseguirlo, se fragmenta el ADN de los cromosomas humanos aleatoriamente. A continuacin se duplican muchas veces para estudiar en los clones, que son las secuencias duplicadas, la ausencia o presencia de marcas genticas identificables. Los clones que comparten varias marcas provienen de segmentos solapados normalmente. Estas regiones pueden utilizarse despus para determinar el orden de las marcas en los cromosomas y su secuencia. Para obtener la secuencia real de nucletidos hacen falta mapas fsicos altamente detallados que recogen el orden de las piezas clonadas con exactitud.En el Proyecto Genoma Humano se utiliz un mtodo de secuenciacin desarrollado por Frederick Sanger, bioqumico britnico y dos veces premio Nobel. Este mtodo replica piezas especficas de ADN y las modifica de modo que acaben en una forma fluorescente.Actualmente se detecta el nucletido modificado del extremo de las cadenas con modernos secuenciadores de ADN automticos. Estos determinan los nucletidos que hay exactamente en la cadena. A continuacin se combina esta informacin de manera informatizada, y as se reconstruye la secuencia de pares de bases del ADN original. Un aspecto muy importante es duplicar rpidamente y con exactitud el ADN, tanto para despus cartografiarlo como para secuenciarlo. Al comienzo de la investigacin en este campo se clonaba el material gentico introducindolo en organismos unicelulares de rpida divisin, pero en la dcada de los ochenta se generaliz el uso de la PCR (reaccin en cadena de polimerasa). Esta tcnica se puede automatizar fcilmente y es capaz de copiar una sola molcula de ADN muchos millones de veces en poco tiempo. Kary Mullis obtuvo el Premio Nobel de Qumica por idearla, en 1993.

Ventajas

El trabajo sobre la interpretacin de los datos del genoma se encuentra todava en sus etapas iniciales. Se prev que un conocimiento detallado del genoma humano ofrecer nuevas vas para los avances de la medicina y la biotecnologa. Por ejemplo, un nmero de empresas, como Myriad Genetics ha empezado a ofrecer formas sencillas de administrar las pruebas genticas que pueden mostrar la predisposicin a una variedad de enfermedades, incluyendo cncer de mama, los trastornos de la hemostasia, la fibrosis qustica, enfermedades hepticas y muchas otras. Adems, la etiologa de los cnceres, la enfermedad de Alzheimer y otras reas de inters clnico se consideran susceptibles de beneficiarse de la informacin sobre el genoma y, posiblemente, pueda a largo plazo conducir a avances significativos en su gestin.Hay tambin muchos beneficios tangibles para los bilogos. Por ejemplo, un investigador de la investigacin de un determinado tipo de cncer puede haber reducido su bsqueda a un determinado gen. Al visitar la base de datos del genoma humano en la World Wide Web, este investigador puede examinar lo que otros cientficos han escrito sobre este gen, incluyendo (potencialmente) la estructura tridimensional de su producto; su/s funcin/es; sus relaciones evolutivas con otros genes humanos, o genes de ratones, levaduras, moscas de la fruta; las posibles mutaciones perjudiciales; las interacciones con otros genes; los tejidos del cuerpo en el que este gen es activado; las enfermedades asociadas con este gen u otro tipo de datos. Adems, la comprensin ms profunda de los procesos de la enfermedad en el mbito de la biologa molecular puede determinar nuevos procedimientos teraputicos. Dada la importancia del ADN en biologa molecular y su papel central en la determinacin de la operacin fundamental de los procesos celulares, es probable que la ampliacin de los conocimientos en este mbito facilite los avances mdicos en numerosas reas de inters clnico que puede no haber sido posible por otros mtodos.El anlisis de las similitudes entre las secuencias de ADN de diferentes organismos es tambin la apertura de nuevas vas en el estudio de la evolucin. En muchos casos, las cuestiones de evolucin ahora se pueden enmarcar en trminos de biologa molecular y, de hecho, muchos de los grandes hitos evolutivos (la aparicin de los ribosomas y orgnulos, el desarrollo de planes de embriones con el cuerpo, el sistema inmune de vertebrados) pueden estar relacionados a nivel molecular. Muchas de las preguntas acerca de las similitudes y diferencias entre los seres humanos y nuestros parientes ms cercanos (los primates, y de hecho los otros mamferos) se espera que sean iluminados por los datos de este proyecto.El Proyecto Diversidad del Genoma Humano (PDGH), derivado de investigaciones dirigidas a la asignacin del ADN humano - que vara entre los grupos tnicos - que se rumorea que ha sido detenido, realmente contina y hasta la fecha ha arrojado nuevas conclusiones. En el futuro, el PGH podra exponer nuevos datos en la vigilancia de las enfermedades, el desarrollo humano y la antropologa. El PGH podra desbloquear secretos y crear nuevas estrategias para combatir la vulnerabilidad de los grupos tnicos a ciertas enfermedades. Tambin podra mostrar cmo las poblaciones humanas se han adaptado a estas vulnerabilidades.Adems, el PGH tiene una consecuencia muy importante, y es que se pueden conocer la base molecular de ciertas enfermedades hereditarias y que se puede realizar un diagnstico de las mismas.-Conocer las bases moleculares de las enfermedades hereditarias:Una de las aplicaciones ms directas de conocer la secuencia de genes que componen el genoma humano es que se puede conocer la base molecular de muchas enfermedades genticas y se puede realizar un diagnstico adecuado. Algunas de estas enfermedades son las siguientes:-Enfermedad de Gaucher: esta enfermedad es producida por una mutacin recesiva en el gen que codifica la protena glucocerebrosidasa, que se localiza en el cromosoma 1. Esta enzima se encarga de metabolizar los glucocerebrsidos (un tipo de lpidos). En los enfermos de Gaucher, estos lpidos no pueden ser descompuestos y se acumulan principalmente en el hgado, en el bazo y en la mdula sea. Los sntomas de la enfermedad de Gaucher incluyen fuertes dolores, fatiga, ictericia, daos seos, anemia y muerte. Gracias al PGH se pudo realizar la primera terapia efectiva contra esta enfermedad, inyectndose la enzima sintetizada en escherichia coli en el torrente sanguneo de los enfermos. Esto detiene el avance de los sntomas y en muchos casos los revierte. -Enfermedad de Alzheimer: Esta enfermedad es una enfermedad degenerativa que destruye el cerebro, haciendo que los enfermos pierdan la memoria y el juicio, y que finalmente impide que se puedan valer por s solos. El nico mtodo seguro para diagnosticar la enfermedad de Alzheimer se encuentra en la autopsia, pero se ha sabido que puede ser de origen gentico en un 20% de los casos. Gracias al PGH se han localizado marcadores para el Alzheimer de origen gentico en los cromosomas 1, 14, 19 y 21. -Enfermedad de Huntington: Esta enfermedad es tambin una enfermedad degenerativa y conduce a un deterioro mental que termina en demencia. Normalmente comienza a aparecer entre los 30 y los 50 aos y presenta sntomas tales como cambios en la personalidad y en el estado de nimo, depresin y prdida gradual del control sobre los movimientos voluntarios, causando espasmos primero y grandes movimientos al azar posteriormente. Esta enfermedad presenta una herencia autosmica dominante, es decir, si uno de los padres la posee, sus hijos tienen el 50% de probabilidad de padecerla tambin. La Enfermedad de Huntington no se salta generaciones. Si no se hereda el gen, no se puede transmitir a la descendencia. Del mismo, modo, si se hereda el gen, inevitablemente se padecer la enfermedad, ms tarde o ms temprano. En 1993 se consigui aislar el gen que provoca esta enfermedad, localizado en el cromosoma 4, y en lo que se han ido desarrollando las investigaciones posteriores, ha sido fundamentalmente en conocer las razones que hacen que la Enfermedad de Huntingnton se manifieste de forma tarda, y muchas lneas de investigacin estn dirigidas a encontrar un tratamiento y una cura. -Sndrome de Marfan: Es una enfermedad congnita del tejido conectivo que afecta a numerosos rganos y sistemas, incluyendo el esqueleto, los pulmones, los ojos, el corazn y los vasos sanguneos. Esta enfermedad se caracteriza por un crecimiento anormal de las extremidades (especialmente de los dedos), una dislocacin parcial del cristalino (en el 50% de los pacientes), anormalidades cardiovasculares (la arteria aorta suele ser ms ancha y ms frgil que en las personas normales) y otras deformaciones. El sndrome de Marfan es tambin una enfermedad autosmica dominante, por lo que los descendientes de personas afectadas poseen el 50% de posibilidades de padecerla. La enfermedad est asociada al gen FBN1, localizado en el cromosoma 15. El FBN1 codifica una protena llamada fibrilina, que es esencial para la formacin de fibras elsticas del tejido conectivo. Sin el soporte estructural de las fibras elsticas, muchos tejidos presentan una debilidad que puede conducir los sntomas comentados anteriormente.

-Diagnsticos de enfermedades posibles al PGH:Estos son algunos ejemplos de enfermedades que se han podido diagnosticar gracias, de una u otra manera, al conocimiento de las secuencias genticas tras la secuenciacin del genoma por el Proyecto Genoma Humano. El diagnstico de cierta enfermedad, gracias al PGH se puede realizar de manera presintomtica y prenatal.El conocimiento de la base molecular de las enfermedades permite realizar el diagnstico presintomtico y gracias a l tomar medidas preventivas, como alteraciones en el estilo de vida, evitar la exposicin a factores de riesgo, realizar un seguimiento continuo del individuo o realizar intervenciones puntuales, para poder tratar la enfermedad aunque todava no haya aparecido.En cuanto al diagnstico prenatal, ste consiste en un conjunto de tcnicas que sirven para conocer la adecuada formacin y el correcto desarrollo del feto antes de su nacimiento, para poder conocer posibles malformaciones desde los primeros estadios de desarrollo del embrin. La tcnica ms comn de diagnstico prenatal es la amniocentesis, que consiste en el anlisis del lquido amnitico que rodea al feto durante el embarazo. Las clulas desprendidas del feto y que flotan en dicho lquido sirven para obtener un recuento exacto de cromosomas y para detectar cualquier estructura cromosmica anormal. El diagnstico prenatal conlleva una importante polmica. Las mujeres cuyo hijo se observe que presentan caractersticas de padecer cierta enfermedad o que presentan malformaciones en sus cromosomas, decidirn abortar, lo que para los detractores del aborto es una aberracin. La polmica est tambin alimentada por el hecho de que se pueden conocer tanto enfermedades que se desarrollen desde el primer da de vida del individuo como enfermedades que pueden aparecer a su edad avanzada, como el Alzheimer, por ejemplo. En ese caso, abortaramos a un feto que puede presentar la Enfermedad de Alzheimer casi al final de su vida, privndole de una vida previa normal? Esto conlleva tambin a realizar un baremo de qu enfermedades podran considerarse suficientes para realizar el aborto, ponindose por ejemplo, el daltonismo.Por otra parte, y como consecuencia del desarrollo de las tcnicas de la fecundacin in vitro, hoy en da se puede realizar el conocido como diagnstico gentico preimplantacional (DGPI). ste permite testar los embriones desde un punto de vista gentico y cromosmico para as elegir el que se encuentre sano e implantarlo en el tero de la madre. El DGPI evita la gestacin de un nio afectado gentica o cromosmicamente, y conlleva la decisin de los padres de realizar, en su caso, un aborto teraputico.

-Terapia gnica, terapia farmacolgica y medicina predictiva:Una vez que se conocen qu genes producen qu enfermedades, y las caractersticas para diagnosticar una enfermedad conociendo la secuencia de bases, es necesario realizar una terapia para acabar con esa enfermedad, ya que de ser de otra manera, el diagnstico de una enfermedad no es ms que una carga emocional que el paciente tiene que soportar de la mejor manera posible, conviviendo con la impotencia y la ansiedad que le puede suponer a un paciente el saber que en un determinado lapso de tiempo es posible que padezca una enfermedad. Una consecuencia, por tanto, del PGH es desarrollar terapias contra las enfermedades que ha diagnosticado. Se conocen la terapia gnica, la terapia farmacolgica y la medicina predictiva:

-La terapia gnica es una consecuencia directa del PGH y supone la probabilidad de curar las enfermedades hereditarias cartografiadas por ste, insertando copias funcionales de genes defectivos o ausentes en el genoma de un individuo para tratar dicha enfermedad. Las tcnicas actuales de terapia gnica no pueden asegurar que el gen se inserte en un lugar apropiado del genoma, existe la posibilidad de que interfiera con el funcionamiento de un gen importante o incluso que active un oncogn, provocando as un cncer en el paciente. Sin embargo, estas tcnicas slo se utilizan con pacientes que ya corren peligro inminente de muerte, por lo que la posibilidad de contraer un cncer en un futuro incierto no constituye un impedimento muy grave para aceptar el tratamiento. El primer caso que se conoce de terapia gnica tuvo lugar en los NIH (National Institutes of Health. En espaol: Institutos Nacionales de la Salud), en Bethesda, Maryland. Consisti en la inoculacin de glbulos blancos genticamente modificados a una nia que padeca inmunodeficiencia severa combinada (deficiencia de adenosina-desaminasa o ADA). Esta enfermedad es una enfermedad rara, y la carencia de ADA se puede tratar con trasplantes de mdula sea. Sin embargo, el trasplante slo es posible si el paciente tiene un hermano que no est afectado por la enfermedad y que sea compatible. Otra posibilidad es inyectar la protena directamente, pero las inyecciones no llegan inmediatamente al lugar necesario y constituyen un mal sucedneo de los sutiles mecanismos que controlan y dirigen la produccin de ADA en circunstancias normales. La operacin consisti en la extraccin de linfocitos T de la paciente, su modificacin gentica y su reimplantacin. Con esto las clulas comenzaron a producir la ADA. Cuando se realiz esta primera intervencin, los doctores de los NIH estudiaron las implicaciones ticas que poda tener esta operacin y llegaron a la conclusin de que no exista diferencia moral con respecto a cualquier tipo de trasplante de tejidos o de rganos. Esta comparacin resida en que los genes trasplantados slo afetaban a las clulas somticas del individuo, de modo que slo afectaban a la nia misma y que no lo haran por tanto a su descendencia. Podemos diferenciar entonces dos tipos de terapia gnica, en lnea somtica y en lnea germinal. Esta ltima consiste en introducir genes nuevos, biolgicamente funcionales, en clulas germinales (vulos y/o espermatozoides) antes de que se produzca la fecundacin. El embrin que surge tras la fecundacin partir de una nica clula modificada genticamente, por lo que todas sus clulas posteriores presentarn la misma modificacin, incluyendo las futuras clulas germinales que producir, pudiendo transmitir sus caractersticas a las generaciones futuras. Todos los estudios nacionales han rechazado la terapia en lnea germinal, de momento, ya que opinan que todava no se dispone de los suficientes conocimientos para evaluar los riesgos que supone este tipo de terapia y que es necesario realizar un estricto examen tico antes de comenzar a aplicarla, si esto se acabara produciendo.

-La terapia farmacolgica se ve tambin facilitada por el PGH ya que ste permite encontrar alteraciones en la secuencia del ADN de genes especficos y esto conlleva a que se realice el tratamiento con medicamentos de una manera dirigida, neutralizando las alteraciones y modificando favorablemente el curso de la enfermedad de forma ms efectiva que los tratamientos de la medicina actual, que estn generalmente dirigidos a aliviar los sntomas. El PGH permite adems, en relacin con la farmacologa, modificar los medicamentos para que se ajusten a las caractersticas genticas del paciente y as poder metabolizar el frmaco de la mejor manera posible, lo que en consecuencia, elimina o minimiza los efectos secundarios indeseables del mismo. Gracias al PGH el mdico tendr un perfil gentico del paciente antes de iniciar el tratamiento.

-La medicina predictiva permite diagnosticar enfermedades, gracias a los conocimientos del genoma, que an no se han desarrollado en el paciente. Se distinguen dos tipos de enfermedades que se pueden diagnosticar mediante la medicina predictiva. Las monognicas, que se pueden identificar fcilmente ya que se conocen perfectamente las leyes deterministas que las regulan; y las polignicas, para cuyo buen estudio es necesario realizar sondeos poblacionales. Por ejemplo se pueden encontrar los genes que regulan el nivel de colesterol en la sangre (unos veinte). Determinadas combinaciones de variedades de estos genes sitan al sujeto en un grupo de riesgo de padecer enfermedades tempranas de las arterias coronarias y ataques cardacos. Si adems el sujeto lleva una dieta rica en grasas animales y una vida sedentaria (tambin influyen por tanto agentes externos como puede ser el modo de vida y la alimentacin), es muy posible que muera de infarto antes de los cincuenta aos. La meta es conocer exactamente qu combinaciones de genes son especialmente peligrosas y en esto tiene un papel muy importante el Proyecto Genoma Humano. La medicina predictiva tambin causa una importante controversia en la sociedad ya que los estudios poblaciones que se realizan para estudiar las enfermedades polignicas se pueden utilizar para discriminar a ciertas personas o grupos, lo que se llamara discriminacin gentica

Aspectos ticos:Aunque la medicina proporciona la base para la evolucin de la biotica, actualmente somos testigos de su aplicacin a la investigacin cientfica relacionada. As pues, el PGH ha dado lugar a una de las reas de conocimiento biolgico con mayor crecimiento. Los conocimientos genmicos derivados del Proyecto Genoma Humano, se utilizan para mejores y ms rpidos diagnsticos basados en el anlisis directo del ADN, e incluso para el diagnstico prenatal en aquellos casos en los que se sospecha que el beb tenga alteraciones morfolgicas, funcionales o ponga en peligro la vida de su madre. Tambin es posible aplicar este conocimiento a personas asintomticas para averiguar si han heredado de algn progenitor una mutacin causal de una enfermedad gentica que pueda desarrollarse en el futuro.As planteado el tema, se percibe entonces una importante brecha entre la capacidad diagnstica y predictiva del conocimiento genmico por un lado, y la falta de intervenciones preventivas y teraputicas por otro, lo que lleva a conflictos ticos surgidos del Proyecto Genoma Humano. Adems hay determinadas reas como el asesoramiento a parejas en riesgo de transmitir enfermedades genticas a su descendencia, que han suscitado mucho inters y para las que se han dictado una serie de principios ticos:Respeto a la dignidad individual y a la inteligencia bsica de las personas, as como a sus decisiones mdicas y reproductivas (libre eleccin de interrumpir o continuar un embarazo con riesgo).

Informar objetivamente al paciente sin tener en cuenta los valores subjetivos del profesional mdico.

Proteccin a la privacidad de la informacin gentica.

Desmitificacin del Proyecto Genoma Humano, aclarando verdaderamente su alcance con acciones especficas en educacin.

Otro problema de gran importancia es la obtencin de patentes de genes por parte de compaas biotecnolgicas, gobiernos y centros de investigacin universitarios, para una posterior venta o explotacin comercial, sin tener en cuenta que parte de los fondos empleados en el PGH era de los contribuyentes. Tambin debemos observar el PGH contextualizado social e histricamente, atendiendo a la desigualdad social y econmica entre pases, que va a producir una inequidad en el acceso a los beneficios que se extraigan de la investigacin.Una solucin a todas estas tensiones podra ser la formacin de profesores de ciencias o la enseanza directa a estudiantes como una forma de abrir las mentes y aclarar definitivamente el alcance del Proyecto Genoma Humano en la sociedad. Pero es imprescindible incorporar temas de biotica a los programas de enseanza.Tanto en Estados Unidos como en la Unin Europea se han desarrollado programas para contemplar las consecuencias ticas y sociales de la investigacin cientfica y que no se produzcan conflictos. En Estados Unidos se encuentra el ELSI y fuera de ellos se encuentra la Declaracin Universal sobre el Genoma Humano y los Derechos Humanos, promovida por la UNESCO.

A continuacin y para terminar se expondrn los descubrimientos y conclusiones sacados del Proyecto Genoma Humano:

Componentes

Cromosomas:El genoma humano (como el de cualquier organismo eucariota) est formado por cromosomas, que son largas secuencias continuas de ADN altamente organizadas espacialmente (con ayuda de protenas histnicas y no histnicas) para adoptar una forma ultracondensada en metafase. Son observables con microscopa ptica convencional o de fluorescencia mediante tcnicas de citogentica y se ordenan formando un cariotipo.El cariotipo humano normal contiene un total de 23 pares de cromosomas distintos: 22 pares de autosomas ms 1 par de cromosomas sexuales que determinan el sexo del individuo. Los cromosomas 1-22 fueron numerados en orden decreciente de tamao en base al cariotipo. Sin embargo, posteriormente pudo comprobarse que el cromosoma 22 es en realidad mayor que el 21.Las clulas somticas de un organismo poseen en su ncleo un total de 46 cromosomas (23 pares): una dotacin de 22 autosomas procedentes de cada progenitor y un par de cromosomas sexuales, un cromosoma X de la madre y un X o un Y del padre. Los gametos -vulos y espermatozoides- poseen una dotacin haploide de 23 cromosomas.

Representacin grfica del cariotipo humano normalADN intragnico-Genes:Un gen es la unidad bsica de la herencia, y porta la informacin gentica necesaria para la sntesis de una protena (genes codificantes) o de un ARN no codificante (genes de ARN). Est formado por una secuencia promotora, que regula su expresin, y una secuencia que se transcribe, compuesta a su vez por: secuencias UTR (regiones flanqueantes no traducidas), necesarias para la traduccin y la estabilidad del ARNm, exones (codificantes) e intrones, que son secuencias de ADN no traducidas situadas entre dos exones que sern eliminadas en el procesamiento del ARNm (ayuste).Actualmente se estima que el genoma humano contiene entre 20.000 y 25.000 genes codificantes de protenas, estimacin muy inferior a las predicciones iniciales que hablaban de unos 100.000 genes o ms. Esto implica que el genoma humano tiene menos del doble de genes que organismos eucariotas mucho ms simples, como la mosca de la fruta o el nematodo Caenorhabditis elegans. Sin embargo, las clulas humanas recurren ampliamente al splicing (ayuste) alternativo para producir varias protenas distintas a partir de un mismo gen, como consecuencia de lo cual el proteoma humano es ms amplio que el de otros organismos mucho ms simples. En la prctica, el genoma tan slo porta la informacin necesaria para una expresin perfectamente coordinada y regulada del conjunto de protenas que conforman el proteoma, siendo ste el encargado de ejecutar la mayor parte de las funciones celulares.Con base en los resultados iniciales arrojados por el proyecto ENCODE (acrnimo de ENCyclopedia Of DNA Elements), algunos autores han propuesto redefinir el concepto actual de gen. Las observaciones ms recientes hacen difcilmente sostenible la visin tradicional de un gen, como una secuencia formada por las regiones UTRs, los exones y los intrones. Estudios detallados han hallado un nmero de secuencias de inicio de transcripcin por gen muy superior a las estimaciones iniciales, y algunas de estas secuencias se sitan en regiones muy alejadas de la traducida, por lo que los UTR 5' pueden abarcar secuencias largas dificultando la delimitacin del gen. Por otro lado, un mismo transcrito puede dar lugar a ARN maduros totalmente diferentes (ausencia total de solapamiento), debido a una gran utilizacin del splicing alternativo. De este modo, un mismo transcrito primario puede dar lugar a protenas de secuencia y funcionalidad muy dispar. En consecuencia, algunos autores han propuesto una nueva definicin de gen, la unin de secuencias genmicas que codifican un conjunto coherente de productos funcionales, potencialmente solapantes. De este modo, se identifican como genes los genes ARN y los conjuntos de secuencias traducidas parcialmente solapantes (se excluyen, as, las secuencias UTR y los intrones, que pasan a ser considerados como "regiones asociadas a genes", junto con los promotores). De acuerdo con esta definicin, un mismo transcrito primario que da lugar a dos transcritos secundarios (y dos protenas) no solapantes debe considerarse en realidad dos genes diferentes, independientemente de que estos presenten un solapamiento total o parcial de sus transcritos primarios.Las nuevas evidencias aportadas por ENCODE, segn las cuales las regiones UTR no son fcilmente delimitables y se extienden largas distancias, obligaran a reidentificar nuevamente los genes que en realidad componen el genoma humano. De acuerdo con la definicin tradicional (actualmente vigente), sera necesario identificar como un mismo gen a todos aquellos que muestren un solapamiento parcial (incluyendo las regiones UTR y los intrones), con lo que a la luz de las nuevas observaciones, los genes incluiran mltiples protenas de secuencia y funcionalidad muy diversa. Colateralmente se reducira el nmero de genes que componen el genoma humano. La definicin propuesta, en cambio, se fundamenta en el producto funcional del gen, por lo que se mantiene una relacin ms coherente entre un gen y una funcin biolgica. Como consecuencia, con la adopcin de esta nueva definicin, el nmero de genes del genoma humano aumentar significativamente.-Genes de ARN:Adems de los genes codificantes de protenas, el genoma humano contiene varios miles de genes ARN, cuya transcripcin reproduce ARN de transferencia (ARNt), ARN ribosmico (ARNr), microARN (miARN), u otros genes ARN no codificantes. Los ARN ribosmico y de transferencia son esenciales en la constitucin de los ribosomas y en la traduccin de las protenas. Por su parte, los microARN tienen gran importancia en la regulacin de la expresin gnica, estimndose que hasta un 20-30% de los genes del genoma humano puede estar regulado por el mecanismo de interferencia por miARN. Hasta el momento se han identificado ms de 300 genes de miARN y se estima que pueden existir unos 500.-Distribucin de genes:A continuacin se muestran algunos valores promedio del genoma humano. Cabe advertir, sin embargo, que la enorme heterogeneidad que presentan estas variables hace poco representativos a los valores promedio, aunque tienen valor orientativo.La densidad media de genes es de 1 gen cada 100 kb, con un tamao medio de 20-30 kb, y un nmero de exones promedio de 7-8 por cada gen, con un tamao medio de 150 nucletidos. El tamao medio de un ARNm es de 1,8-2,2 kb, incluyendo las regiones UTR (regiones no traducidas flanqueantes), siendo la longitud media de la regin codificante de 1,4 kb.

El genoma humano se caracteriza por presentar una gran heterogeneidad en su secuencia. En particular, la riqueza en bases de guanina (G) y citosina (C) frente a las de adenina (A) y timina (T) se distribuye heterogneamente, con regiones muy ricas en G+C flanqueadas por regiones muy pobres, siendo el contenido medio de G+C del 41%, menor al tericamente esperado (50%). Dicha heterogeneidad esta correlacionada con la riqueza en genes, de manera que los genes tienden a concentrarse en las regiones ms ricas en G+C. Este hecho era conocido ya desde hace aos gracias a la separacin mediante centrifugacin en gradiente de densidad de regiones ricas en G+C (que recibieron el nombre de iscoros H; del ingls High) y regiones ricas en A+T (iscoros L; del ingls Low).

Iscoros. Riqueza en G+C y genes en el genoma humano

-Secuencias reguladoras:

El genoma tiene diversos sistemas de regulacin de la expresin gnica, basados en la regulacin de la unin de factores de transcripcin a las secuencias promotoras, en mecanismos de modificacin epigentica (metilacin del ADN o metilacin-acetilacin de histonas) o en el control de la accesibilidad a los promotores determinada por el grado de condensacin de la cromatina; todos ellos muy interrelacionados. Adems hay otros sistemas de regulacin a nivel del procesamiento, estabilidad y traduccin del ARNm, entre otros. Por lo tanto, la expresin gnica est intensamente regulada, lo cual permite desarrollar los mltiples fenotipos que caracterizan los distintos tipos celulares de un organismo eucariota multicelular, al mismo tiempo que dota a la clula de la plasticidad necesaria para adaptarse a un medio cambiante. No obstante, toda la informacin necesaria para la regulacin de la expresin gnica, en funcin del ambiente celular, est codificada en la secuencia de ADN al igual que lo estn los genes.Las secuencias reguladoras son tpicamente secuencias cortas presentes en las proximidades o en el interior (frecuentemente en intrones) de los genes. En la actualidad, el conocimiento sistemtico de estas secuencias y de cmo actan en complejas redes de regulacin gnica, sensibles a seales exgenas, es muy escaso y est comenzando a desarrollarse mediante estudios de genmica comparada, bioinformtica y biologa de sistemas. La identificacin de secuencias reguladoras se basa en parte en la bsqueda de regiones no codificantes evolutivamente conservadas. Por ejemplo, la divergencia evolutiva entre el ratn y el ser humano ocurri hace 70-90 millones de aos. Mediante estudios de genmica comparada, alineando secuencias de ambos genomas pueden identificarse regiones con alto grado de coincidencia, muchas correspondientes a genes y otras a secuencias no codificantes de protenas pero de gran importancia funcional, dado que han estado sometidas a presin selectiva.-Elementos ultraconservados:Reciben este nombre regiones que han mostrado una constancia evolutiva casi total, mayor incluso que las secuencias codificantes de protenas, mediante estudios de genmica comparada. Estas secuencias generalmente se solapan con intrones de genes implicados en la regulacin de la transcripcin o en el desarrollo embrionario y con exones de genes relacionados con el procesamiento del ARN. Su funcin es generalmente poco conocida, pero probablemente de extrema importancia dado su nivel de conservacin evolutiva, tal y como se ha expuesto en el punto anterior.En la actualidad se han encontrado unos 500 segmentos de un tamao mayor a 200 pares de bases totalmente conservados (100% de coincidencia) entre los genomas de humano, ratn y rata, y casi totalmente conservados en perro (99%) y pollo (95%).-Pseudogenes:En el genoma humano se han encontrado asimismo unos 19.000 pseudogenes, que son versiones completas o parciales de genes que han acumulado diversas mutaciones y que generalmente no se transcriben. Se clasifican en pseudogenes no procesados (30%) y pseudogenes procesados (70%):-Los pseudogenes no procesados son copias de genes generalmente originadas por duplicacin, que no se transcriben por carecer de una secuencia promotora y haber acumulado mltiples mutaciones, algunas de las cuales sin sentido (lo que origina codones de parada prematuros). Se caracterizan por poseer tanto exones como intrones. -Los pseudogenes procesados, por el contrario, son copias de ARN mensajero retrotranscritas e insertadas en el genoma. En consecuencia carecen de intrones y de secuencia promotora.

ADN intergnico

Las regiones intergnicas o extragnicas comprenden la mayor parte de la secuencia del genoma humano, y su funcin es generalmente desconocida. Buena parte de estas regiones est compuesta por elementos repetitivos, clasificables como repeticiones en tndem o repeticiones dispersas, aunque el resto de la secuencia no responde a un patrn definido y clasificable. Gran parte del ADN intergnico puede ser un artefacto evolutivo sin una funcin determinada en el genoma actual, por lo que tradicionalmente estas regiones han sido denominadas ADN "basura" (Junk DNA), denominacin que incluye tambin las secuencias intrnicas y pseudogenes. No obstante, esta denominacin no es la ms acertada dado el papel regulador conocido de muchas de estas secuencias. Adems el notable grado de conservacin evolutiva de algunas de estas secuencias parece indicar que poseen otras funciones esenciales an desconocidas o poco conocidas. Por lo tanto, algunos prefieren denominarlo "ADN no codificante" (aunque el llamado "ADN basura" incluye tambin transposones codificantes) o "ADN repetitivo". Algunas de estas regiones constituyen en realidad genes precursores para la sntesis de microARN (reguladores de la expresin gnica y del silenciamiento gnico).

Estudios recientes enmarcados en el proyecto ENCODE han obtenido resultados sorprendentes, que exigen la reformulacin de nuestra visin de la organizacin y la dinmica del genoma humano. Segn estos estudios, el 15% de la secuencia del genoma humano se transcribe a ARN maduros, y hasta el 90% se transcribe al menos a transcritos inmaduros en algn tejido.As, una gran parte del genoma humano codifica genes de ARN funcionales. Esto es coherente con la tendencia de la literatura cientfica reciente a asignar una importancia creciente al ARN en la regulacin gnica. Asimismo, estudios detallados han identificado un nmero mucho mayor de secuencias de inicio de transcripcin por gen, algunas muy alejadas de la regin prxima a la traducida. Como consecuencia, actualmente resulta ms complicado definir una regin del genoma como gnica o intergnica, dado que los genes y las secuencias relacionadas con los genes se extienden en las regiones habitualmente consideradas intergnicas.

ADN repetido en tndem

Son repeticiones que se ordenan de manera consecutiva, de modo que secuencias idnticas, o casi, se disponen unas detrs de otras.

-Satlites:El conjunto de repeticiones en tndem de tipo satlite comprende un total de250 Mb del genoma humano. Son secuencias de entre 5 y varios cientos de nucletidos que se repiten en tndem miles de veces generando regiones repetidas con tamaos que oscilan entre 100 kb (100.000 nucletidos) hasta varias megabases.Reciben su nombre de las observaciones iniciales de centrifugaciones en gradiente de densidad del ADN genmico fragmentado, que reportaban una banda principal correspondiente a la mayor parte del genoma y tres bandas satlite de menor densidad. Esto se debe a que las secuencias satlite tienen una riqueza en nucltidos A+T superior a la media del genoma y en consecuencia son menos densas.Hay principalmente 6 tipos de repeticiones de ADN satlite-Satlite 1: secuencia bsica de 42 nucletidos. Situado en los centrmeros de los cromosomas 3 y 4 y el brazo corto de los cromosomas acrocntricos (en posicin distal respecto al cluster codificante de ARNr). -Satlite 2: la secuencia bsica es ATTCCATTCG. Presente en las proximidades de los centrmeros de los cromosomas 2 y 10, y en la constriccin secundaria de 1 y 16. -Satlite 3: la secuencia bsica es ATTCC. Presente en la constriccin secundaria de los cromosomas 9 e Y, y en posicin proximal respecto al cluster de ADNr del brazo corto de los cromosomas acrocntricos. -Satlite alfa: secuencia bsica de 171 nucletidos. Forma parte del ADN de los centrmeros cromosmicos. -Satlite beta: secuencia bsica de 68 nucletidos. Aparece en torno al centrmero en los cromosomas acrocntricos y en la constriccin secundaria del cromosoma 1. -Satlite gamma: secuencia bsica de 220 nucletidos. Prximo al centrmero de los cromosomas 8 y X.

-Minisatlites:Estn compuestas por una unidad bsica de secuencia de 6-25 nucletidos que se repite en tndem generando secuencias de entre 100 y 20.000 pares de bases. Se estima que el genoma humano contiene unos 30.000 minisatlites.Diversos estudios han relacionado los minisatlites con procesos de regulacin de la expresin gnica, como el control del nivel de transcripcin, el ayuste (splicing) alternativo o la impronta (imprinting). Asimismo, se han asociado con puntos de fragilidad cromosmica dado que se sitan prximos a lugares preferentes de rotura cromosmica, translocacin gentica y recombinacin meitica. Por ltimo, algunos minisatlites humanos (~10%) son hipermutables, presentando una tasa media de mutacin entre el 0.5% y el 20% en las clulas de la lnea germinal, siendo as las regiones ms inestables del genoma humano conocidas hasta la fecha.En el genoma humano, aproximadamente el 90% de los minisatlites se sitan en los telmeros de los cromosomas. La secuencia bsica de seis nucletidos TTAGGG se repite miles de veces en tndem, generando regiones de 5-20 kb que conforman los telmeros.Algunos minisatlites por su gran inestabilidad presentan una notable variabilidad entre individuos distintos. Se consideran polimorfismos multiallicos, dado que pueden presentarse en un nmero de repeticiones muy variable, y se denominan VNTR (acrnimo de Variable number tandem repeat). Son marcadores muy utilizados en gentica forense, ya que permiten establecer una huella gentica caracterstica de cada individuo, y son identificables mediante Southern blot e hibridacin.

-Microsatlites:Estn compuestos por secuencias bsicas de 2-4 nucletidos, cuya repeticin en tndem origina frecuentemente secuencias de menos de 150 nucletidos. Algunos ejemplos importantes son el dinucletido CA y el trinucletido CAG.Los microsatlites son tambin polimorfismos multiallicos, denominados STR (acrnimo de Short Tandem Repeats) y pueden identificarse mediante PCR, de modo rpido y sencillo. Se estima que el genoma humano contiene unos 200.000 microsatlites, que se distribuyen ms o menos homogneamente, al contrario que los minisatlites, lo que los hace ms informativos como marcadores.

ADN repetido disperso

Son secuencias de ADN que se repiten de modo disperso por todo el genoma, constituyendo el 45% del genoma humano. Los elementos cuantitativamente ms importantes son los LINEs y SINEs, que se distinguen por el tamao de la unidad repetida.Estas secuencias tienen la potencialidad de autopropagarse al transcribirse a una ARNm intermediario, retrotranscribirse e insertarse en otro punto del genoma. Este fenmeno se produce con una baja frecuencia, estimndose que 1 de cada 100-200 neonatos portan una insercin nueva de un Alu o un L1, que pueden resultar patognicos por mutagnesis insercional, por desregulacin de la expresin de genes prximos (por los propios promotores de los SINE y LINE) o por recombinacin ilegtima entre dos copias idnticas de distinta localizacin cromosmica (recombinacin intra o intercromosmica), especialmente entre elementos Alu.

-SINE:

Acrnimo del ingls Short Interspersed Nuclear Elements (Elementos nucleares dispersos cortos). Son secuencias cortas, generalmente de unos pocos cientos de bases, que aparecen repetidas miles de veces en el genoma humano. Suponen el 13% del genoma humano, un 10% debido exclusivamente a la familia de elementos Alu (caracterstica de primates).Los elementos Alu son secuencias de 250-280 nucletidos presentes en 1.500.000 de copias dispersas por todo el genoma. Estructuralmente son dmeros casi idnticos, excepto que la segunda unidad contiene un inserto de 32 nucletidos, siendo mayor que la primera. En cuanto a su secuencia, tienen una considerable riqueza en G+C (56%), por lo que predominan en las bandas R, y ambos monmeros presentan una cola poliA (secuencia de adeninas) vestigio de su origen de ARNm. Adems poseen un promotor de la ARN polimerasa III para transcribirse. Se consideran retrotransposones no autnomos, ya que dependen para propagarse de la retrotranscripcin de su ARNm por una retrotranscriptasa presente en el medio.

-LINE:Acrnimo del ingls Long Interspersed Nuclear Elements (Elementos nucleares dispersos largos). Constituyen el 20% del genoma humano, contiene unos 100.000-500.000 copias de retrotransposones L1 que es la familia de mayor importancia cuantitativa, es una secuencia de 6 kb repetida unas 800.000 veces de modo disperso por todo el genoma, aunque la gran mayora de las copias es incompleta al presentar el extremo 5' truncado por una retrotranscripcin incompleta. As, se estima que hay unas 5.000 copias completas de L1, slo 90 de las cuales son activas, estando el resto inhibidas por metilacin de su promotor.Su riqueza en G+C es del 42%, prxima a la media del genoma (41%) y se localizan preferentemente en las bandas G de los cromosomas. Poseen adems un promotor de la ARN polimerasa II.Los elementos LINE completos son codificantes. En concreto LINE-1 codifica dos protenas:-Protena de unin a ARN (RNA-binding protein): codificada por el marco de lectura abierto 1 (ORF1, acrnimo del ingls Open reading Frame 1) -Enzima con actividad retrotranscriptasa y endonucleasa: codificada por el ORF2. Ambas protenas son necesarias para la retrotransposicin. Estos elementos mviles estn flanqueados por 2 regiones no codificantes, denominados como 5UTR y 3UTR.Por lo tanto, se consideran retrotransopsones autnomos, ya que codifican las protenas que necesitan para propagarse. La ARN polimerasa II presente en el medio transcribe el LINE, y este ARNm se traduce en ambos marcos de lectura produciendo una retrotranscriptasa que acta sobre el ARNm generando una copia de ADN del LINE, potencialmente capaz de insertarse en el genoma. Asimismo estas protenas pueden ser utilizadas por pseudogenes procesados o elementos SINE para su propagacin.La transcripcin se inicia en un promotor interno del extremo 5UTR. La endonucleasa de L1 genera una mella en una nica cadena del ADN genmico, en una secuencia consenso 5TTTTT/A3.Diversos estudios han mostrado que las secuencias LINE pueden tener importancia en la regulacin de la expresin gnica, habindose comprobado que los genes prximos a LINE presentan un nivel de expresin inferior. Esto es especialmente relevante porque aproximadamente el 80% de los genes del genoma humano contiene algn elemento L1 en sus intrones.Se ha visto que la insercin aleatoria de L1 activos en el genoma humano ha dado lugar a enfermedades genticas, ya que interfiere en la expresin normal. Tambin se observa una predileccin de L1 por regiones ricas en AT.

Variabilidad

Si bien dos seres humanos del mismo sexo comparten un porcentaje elevadsimo (en torno al 99,9%) de su secuencia de ADN, lo que nos permite trabajar con una nica secuencia de referencia, pequeas variaciones genmicas fundamentan buena parte de la variabilidad fenotpica interindividual. Una variacin en el genoma, por sustitucin, delecin o insercin, se denomina polimorfismo o alelo gentico. No todo polimorfismo gentico provoca una alteracin en la secuencia de una protena o de su nivel de expresin, es decir, muchos son silenciosos y carecen de expresin fenotpica.

-SNP's:

La principal fuente de variabilidad en los genomas de dos seres humanos procede de las variaciones en un slo nucletido, conocidas como SNP's (Single nucleotide polimorphisms), en las cuales se han centrado la mayor parte de los estudios. Dada su importancia, en la actualidad existe un proyecto internacional (International HapMap Project) para catalogar a gran escala los SNP's del genoma humano. En este contexto, la denominacin de SNP frecuentemente se restringe a aquellos polimorfismos de un slo nucletido en los que el alelo menos frecuente aparece en al menos el 1% de la poblacin.Los SNP son marcadores tetrallicos, dado que en teora en una posicin puede haber cuatro nucletidos distintos, cada uno de los cuales identificara un alelo; sin embargo, en la prctica suelen presentar slo dos alelos en la poblacin. Se estima que la frecuencia de SNP's en el genoma humano es de un SNP cada 500-100 pares de bases, de los que una parte relevante son polimorfismos codificantes, que causan la sustitucin de un aminocido por otro en una protena.Gracias a su abundancia y a que presentan una distribucin aproximadamente uniforme en el genoma, han tenido gran utilidad como marcadores para los mapas de ligamiento, herramienta fundamental del Proyecto Genoma Humano. Adems son fcilmente detectables a gran escala mediante el empleo de chips de ADN (comnmente conocidos como microarrays).

-Variacin estructural:Este tipo de variaciones se refiere a duplicaciones, inversiones, inserciones o variantes en el nmero de copias de segmentos grandes del genoma (por lo general de 1000 nuclotidos o ms). Estas variantes implican a una gran proporcin del genoma, por lo que se piensa que son, al menos, tan importantes como los SNPs.Variacin estructural es el trmino general para abarcar un grupo de alteraciones genmicas que implican segmentos de ADN mayores de 1Kb. La variacin estructural puede ser cuantitativa (variante en nmero de copia, que comprende: deleciones, inserciones y duplicaciones), posicional (translocaciones) y orientacional (inversiones).A pesar de que este campo de estudio es relativamente nuevo (los primeros estudios a gran escala se publicaron en los aos 2004 y 2005), ha tenido un gran auge, hasta el punto de que se ha creado un nuevo proyecto para estudiar este tipo de variantes en los mismos individuos en los que se bas el Proyecto HapMap.Aunque an quedan dudas acerca de las causas de este tipo de variantes, cada vez existe ms evidencia a favor de que es un fenmeno recurrente que todava continua moldeando y creando nuevas variantes del genoma.Este tipo de variaciones han potenciado la idea de que el genoma humano no es una entidad esttica, sino que se encuentra en constante cambio y evolucin.

ndice-Pag. 2,3,4,5 Historia de la gentica y sucesos destacados.-Pag. 5,6,7 Contexto Proyecto Genoma Humano.-Pag. 7,8,9 Objetivos Proyecto Genoma Humano.-Pag. 9,10,11,12,13 Usos Proyecto Genoma Humano.-Pag. 14 Aspectos ticos.-Pag. 14-22 Componentes, estructura y variabilidad secuencia ADN.

Bibliografahttp://es.wikipedia.org/wiki/Proyecto_Genoma_Humanohttp://es.wikipedia.org/wiki/Genoma_humanohttp://es.wikipedia.org/wiki/Historia_de_la_gen%C3%A9ticahttp://www.news-medical.net/health/History-of-Genetics-%28Spanish%29.aspxhttp://www.ugr.es/~eianez/Biotecnologia/genoma-1.htmlhttp://www.monografias.com/especiales/genoma/