Breve introducción a la genética de poblaciones

Como ya comenté hace unos días, Luis Aldamiz (Maju), autor del blog de Prehistoria, Arqueología y Genética “For what they were we are”, ha tenido la amabilidad de colaborar en este blog en la serie de expansión de Homo sapiens, que tiene el doble objetivo de explicar el proceso de la expansión de nuestra especie desde una perspectiva arqueológica y genética. Maju, como anticipo, de la segunda parte de la expansión de Homo sapiens en África, la cual será abordada desde la perspectiva genética, nos introduce a través de este artículo en el campo de genética de poblaciones, a fin de entender algunos conceptos que serán recurrentes a lo largo de la serie.

 Breve introducción a la genética de poblaciones

Cada una de nuestras células contiene en su núcleo largas cadenas de ADN organizadas en cromosomas, además existen unos orgánulos llamados mitocondrias que también contienen ADN propio. La mayoría del ADN nuclear se recombina de forma aleatoria en cada generación, los cromosomas de este tipo son llamados autosomas y a menudo se utiliza el término “ADN autosómico” para referirse a este segmento, extenso pero de difícil comprensión (necesita de herramientas estadísticas y buen ojo). El cromosoma X (dos en las mujeres, uno en los hombres) se suele considerar en este grupo, aunque hay un segmento no recombinable que se utiliza ocasionalmente para obtener información complementaria.


Por el contrario, el cromosoma Y (exclusivo del género masculino), o al menos la mayor parte él no se recombina, por lo que es utilizado para estudiar los patrilinajes, es decir: aquellos heredados por la línea puramente paterna. Para estudiar los matrilinajes (líneas puramente maternas: de madre a hija en una cadena ininterrumpida desde la noche de los tiempos) se utiliza el ADN mitocondrial (el espermatozoide no contribuye al cuerpo del cigoto o primera célula embrionaria sino sólo al ADN nuclear). El ADN mitocondrial es mucho más corto que el nuclear, lo que tiene ventajas e inconvenientes (pero en general es muy estudiado y se recupera con más facilidad de restos antiguos). 

En resumen en genética de poblaciones se estudian por separado:

  • el ADN mitocondrial (ADNmt): linajes puramente maternos 
  • el cromosoma Y (ADN-Y): linajes puramente paternos 
  • el ADN autosómico, también llamado nuclear (ADNn): amalgama general de la herencia genética por todas las ramas

Además ocasionalmente se estudia la parte no recombinable del cromosoma X (transmitido tanto por hombres como por mujeres, ojo) que sería un linaje en zig-zag por así decirlo. 

Otro término utilizado en genética de poblaciones es ADNa, que indica ADN antiguo, extraído no de personas vivas sino de huesos u otros restos (cabellos p.e.) de personas muertas hace mucho tiempo. El tipo más manejado de ADNa es el mitocondrial, aunque hay de todo. 

Los linajes de tipo uniparental o haploide se estructuran de forma jerárquica similar a un árbol genealógico a partir de un antepasado común dentro de esa categoría específica. En el caso de la especie humana a veces se utilizan metáforas de origen bíblico como “Eva mitocondrial” o “Adán del DNA-Y” que no hacen sino referirse al antepasado último por esas líneas tan específicas en términos de género. Como veremos en el próximo artículo, lo más probable es que “Adán” y “Eva” no vivieran siquiera en la misma época e incluso parece probable ahora que “Adán” no fuera siquiera un Homo sapiens como tal, al menos si hemos de incluir todos los patrilinajes que hoy día existentes en la Humanidad1,2. 

La disciplina que reconstruye estos árboles genealógicos genéticos se conoce como Filogenética y a los árboles como “la filogenia”. 

Los custodios informales, de referencia casi obligatoria, de los árboles genéticos humanos son:

ISOGG para el DNA-Y 

PhyloTree para el DNAmt 


El problemático “reloj molecular”


El llamado “reloj molecular” es un tema muy complejo pero, simplificando, consiste en asumir que ciertas mutaciones se producen estadísticamente con una frecuencia determinada y a partir de ello estimar la edad de cierto nodo en el árbol filogenético. La teoría suena muy bien sobre el papel pero la realidad es que hoy por hoy es una disciplina muy extendida pero de muy baja calidad en sus resultados. 

Cuando el método de datación por radiocarbono o C14 se propuso hace ya muchas décadas, la opinión académica era justamente escéptica y antes de ser aceptado se le exigieron pruebas empíricas de peso, como fue la datación de materiales de los que se sabía la edad aproximada, de época romana o egipcia. Por el contrario los métodos de datación por “reloj molecular” pronto se hicieron muy populares, no sólo entre el público lego sino dentro de los círculos académicos: la teoría se justificaba a si misma de manera casi escolástica y no positiva. Además la intromisión de empresas comerciales cuyo interés era vender por ejemplo un supuesto antepasado “vikingo” (una mercancía popular) y no un casi-desconocido antepasado “gravetense”, por ejemplo, promovió los métodos de estimación que ofrecían dataciones más recientes, llegándose en algunos casos a ofrecer fechas más cortas incluso que lo que el pedigrí puro (sin compensaciones) permitiría, lo que es simplemente ridículo. 

Los problemas intrínsecos que pueden afectar (y mucho) al modelo del “reloj molecular” son muchos y a veces incluso diferentes si trabajamos con ADN-Y, ADNmt, etc. Por un lado las fluctuaciones de la población efectiva (Ne) afectan de manera decisiva al ritmo en que los “tics” se acumulan (lo que lleva a corregir a partir de un ritmo “de pedigrí” máximo medido entre padres e hijos de manera empírica - estas correcciones son variables según el autor y no pasan de ser conjeturas educadas). 

Por otro lado siempre es necesario uno o más puntos de calibración, que a menudo no se conocen con certeza. A menudo este punto de calibración es el antepasado común de humanos (género Homo), chimpancés y bonobos (género Pan). Pero la edad de este antepasado común ha sido casi sistemáticamente subestimada por la academia que, en vez de referirse a los estudios más recientes en la materia (que sugieren una edad de 8-13 millones de años3), ha usado (y sigue usando sin ningún complejo) como calibración 7, 6 e incluso 5 millones de años por mera inercia escolástica. Poco a poco la evidencia se va abriendo paso pero yo personalmente llevo clamando al cielo, como suele decirse, en este tema desde por lo menos 2008

En el caso del DNA-Y se suelen utilizar, no los marcadores conocidos como polimorfismos de nucleótido único (SNP) que describen el árbol filogenético con una gran certidumbre, sino otros menos informativos: las repeticiones de tándem único (STR o microsatélites). Personalmente me creo muy poco o nada de lo que se estima con estos métodos (las estimaciones del método Zhivotovski quizá se aproximen algo a la realidad pero aún así necesitan claramente una corrección hacia una antigüedad aún mayor, en mi opinión al menos). 

Por suerte cada vez es más barato secuenciar el genoma completo y por ende el relativamente corto cromosoma Y. Esto potencialmente permitirá en un futuro no muy lejano tener una filogenia patrilineal muchísimo más completa (y compleja) y utilizar los propios SNPs (que ahora se conocen sólo de forma muy irregular) como “tics” para un “reloj molecular” perfeccionado4,5. 

En el caso del DNAmt, tenemos la ventaja de que, al ser muchísimo más corto, es igualmente más fácil y barato secuenciarlo en su totalidad, con lo que hoy día cualquier aficionado con la suficiente dedicación puede usar el árbol de PhyloTree y proceder a hacer sus propias estimaciones. Tiene dos problemas sin embargo: uno es que las mutaciones se acumulan muchísimo más lentamente que en el DNAn, incluido el DNA-Y, potencialmente distorsionando los resultados de la estimación estadística que es el “reloj molecular”, y el otro es que las ramas son a menudo muy desiguales6. Mi teoría personal respecto a este último fenómeno es que, en poblaciones pequeñas pero lo bastante grandes, la deriva genética tiende a desplazar a las raras ramas mutantes, que ocurren (o al menos parecen acumularse) cada mil años o más, mientras que en poblaciones extremadamente pequeñas las ramas ancestrales y las mutantes tienen parecidas posibilidades de sobrevivir.


 
 
Ejemplo de divergencia extrema de la longitud de las ramas del ADNmt, en este caso R. Tomado de Pierron 20106. El contraste más notable se da entre HV (la mayor parte de R0) y la mayoría de las ramas de U. Esto da lugar, siguiendo los métodos convencionales, a que H, el linaje más numeroso de Europa aparente ser más joven que U (también muy común). Sin embargo, si contamos mutaciones (especialmente las de la región codificante) desde la raíz H parece sólo ligeramente más reciente que U (4 vs 3 mutaciones), siendo R0 notablemente más antiguo. No existe un método certero que pueda aclarar estos problemas tan obvios.

Por ello, al contrario que la mayoría de académicos, yo tiendo a contar (en DNAmt) las mutaciones a partir del origen, lo que suprime la importancia de la desigualdad de las ramas hacia el presente, ya que algunos linajes pueden perfectamente haberse quedado “estancados” en el pasado remoto si se daba la primera condición: población lo bastante pequeña para que la deriva genética sea importante (lo que se aplica a todas las poblaciones paleolíticas) pero lo bastante grande para que las ocasionales ramas mutantes tengan pocas posibilidades de éxito (“poda” de linajes raros). No puedo decir que mi método sea el definitivo pero desde luego sí que ofrece una alternativa a la problemática de las ramas desiguales.

Dos términos importantes de la jerga genética.

Esto me lleva a cerrar esta introducción explicando brevemente dos términos importantes de la genética de poblaciones: deriva genética y efecto fundador

La deriva genética es el proceso estocástico por el que unos linajes (u otros componentes del genoma que sean más o menos neutrales) tienden a convertirse en más o menos comunes. Esto se puede entender fácilmente introduciendo, por ejemplo, diez alubias en un bote: cinco rojas y cinco blancas y procediendo como sigue: sacas al azar cinco de ellas y doblas las restantes de acuerdo con su color (es decir: si quedan tres rojas y dos blancas, añades tres rojas y dos blancas), repite unas cuantas veces. Si haces el experimento desde el principio varias veces, los resultados variarán: en unos casos acabaras con un bote de alubias rojas, en otros de alubias blancas y en otros conservarás algún tipo de mezcla.



Pues bien, los colores de las alubias son los linajes (inicialmente dos en el ejemplo pero pueden ser más, también se puede aumentar o reducir el número total de alubias) y las cinco alubias que quedan en el bote cada vez que procedes son la población efectiva (Ne), es decir aquellos adultos con descendencia que sobrevive hasta la edad de reproducción. Cuanto más pequeña es la población, la deriva es más intensa, y viceversa. En poblaciones aisladas y de tamaño reducido, se tiende hacia la fijación en uno o unos pocos linajes. 

Sin duda en el Paleolítico, y en algunos casos también más tarde, este proceso ocurrió a menudo y el ejemplo más notable es quizá la “Eva mitocondrial”: en un tiempo remoto, hace unos 200,000 años a juzgar por la arqueología, la población de Homo sapiens fue lo bastante pequeña durante el tiempo suficiente para que sólo quedara un linaje. Había sin duda otras mujeres que dejaron también descendencia pero la línea puramente materna se rompió en algún punto. 

El efecto fundador es el proceso por el que unos emigrantes llevan unos linajes específicos a una tierra que colonizan ex-novo o desplazando, total o parcialmente, a los habitantes anteriores. No es totalmente independientemente de la deriva genética pero es distinto en concepto. 

Ambos procesos se llaman a veces “embudo” o “cuello de botella” pero en sentido estricto esto correspondería a una disminución dramática de la población, lo que no ocurre en la mayoría de los casos con la deriva ni el efecto fundador.

___________________________
Notas:



1 Fernando L. Méndez et al., An African American Paternal Lineage Adds an Extremely Ancient Root to the Human Y Chromosome Phylogenetic Tree. AJHG 2013→ LINK [doi:10.1016/j.ajhg.2013.02.002]



2 Michael F. Hammer et al., Genetic evidence for archaic admixture in Africa. PNAS 2011LINK [doi:10.1073/pnas.1109300108]



3 Kevin E. Langergraber et al., Generation times in wild chimpanzees and gorillas suggest earlier divergence times in great ape and human evolution. PNAS 2012 → LINK [doi:10.1073/pnas.1211740109]



4 Anneleen Van Geystelen et al., AMY-tree: an algorithm to use whole genome SNP calling for Y chromosomal phylogenetic applications. BMC Genomics 2013 → LINK [doi:10.1186/1471-2164-14-101]



5 Terry D. Robb. Y-Haplogroup Tree based 18,692 variable sites and 526 people extracted from the 1000 Genomes Project. Publication propia del autor 2012 → LINK (PDF). Ver también su página web y mi recalibración de las estimaciones (ya que las suyas no me convencían en absoluto).



6 Denis Pierron et al., Mutation Rate Switch inside Eurasian Mitochondrial Haplogroups: Impact of Selection and Consequences for Dating Settlement in Europe. PLoS ONE 2010 → LINK [doi:10.1371/journal.pone.0021543] - ver también mi artículo[en] sobre este estudio.

-------------------------------------------------------------------------------------------------------


OTROS POSTS DE LA SERIE DE EXPANSIÓN DE HOMO SAPIENS:

1.El origen de Homo sapiens y su expansión por el continente africano parte 1: El registro fósil y arqueológico (David Sánchez)

2. Breve introducción a la genética de poblaciones (Luis Aldamiz)

3. El origen de Homo Sapiens y su expansión por el continente africano parte 2: La primera expansión del Homo sapiens en África desde el punto de vista de la genética (Luis Aldamiz).

4. Fuera de África parte 1: La llegada a la península de Arabia y Palestina (Luis Aldamiz).

5. La expansión de Homo Sapiens por Asia meridional desde la perspectiva arqueológica (David Sánchez).

6. La primera colonización de Sahul (Australia, Tasmania y Nueva Guinea) según la evidencia arqueológica (David Sánchez).

7. La expansión de Homo sapiens en Asia y Australasia desde el punto de vista de la genética (Luis Aldamiz)

8. La problemática de los conjuntos de transición del Paleolítico medio al superior: los conjuntos asociados a los Neandertales (David Sánchez). 

9. La expansión de Homo sapiens hacia Eurasia occidental según la arqueología (David Sánchez). 

10. La evidencia genética de la paleohistoria occidental (Luis Aldamiz). 



 

Comentarios

  1. Muchas gracias por la aportación al blog Maju; creo que esta introducción es de gran interés para todos los que no estamos familiarizados con los conceptos básicos que se deben conocer en materia de genética de poblaciones; nos va a ayudar mucho a ir adentrándonos en este campo tan interesante y complejo al mismo tiempo.

    Muy interesante la mención a la problemática del reloj molecular y las estimaciones de la antigüedad que debería tener ese antepasado común que tenemos con el género Pan.

    Según lo que comentas, debería existir algún homínido más antiguo que Toumai, el cual tenía si no recuerdo mal 7 millones de años de antigüedad.

    Esperemos aparezca algún día un homínido que confirme esas últimas estimaciones de 8-13 millones de años de antigüedad.

    Un saludo!!

    ResponderEliminar
  2. Es que no es realista estimar la divergencia de las especies sólo en el puñado de fósiles conocidos. Una de las calibraciones decisivas la da la divergencia chimpancé-bonobo que necesariamente debe remontarse a la formación del río Congo hace 1.8 Ma (ninguna de las dos especies nada ni construye canoas y sin la protección del Congo y un afluente, los bonobos no podrían existir, ya que los chimpancés son muy agresivos y más fuertes). Si contamos a partir de Toumai los bonobos tendrían que haber divergido mucho más tarde, lo que no es nada probable.

    La realidad es que no tenemos suficientes evidencias fósiles para que éstas se constituyan en una referencia absoluta, sino que son como poco "terminus ante quem", es decir fechas mínimas a partir de las cuales reina la incertidumbre.

    ResponderEliminar
  3. Por cierto que se ha confirmado estos días que Toumaï es un antepasado nuestro en exclusiva, un homínino, lo que ratifica mi postura respecto a la fecha de la divergencia Pan-Homo.

    ResponderEliminar

Publicar un comentario

Por favor, se pide respeto en los comentarios hacia las opiniones de todos, sin caer en la xenofobia, el racismo o cualquier otra manifestación de intolerancia. Entre todos podemos construir, debatir y aprender desde el respeto mutuo. Gracias!!