360doc文章提取器

人类起源与全球迁徙路径(上)

文章来源:文章来源 抓取时间:2019-06-25 23:07:32 浏览量:18 作者:遥远的雷音 返回文章列表

三角地讲座群/喵群-人类起源与全球迁徙路径(上)

-20160313

Frazer 喵群自由风常识 2016-03-15


讲座概要:人类学在过去10-15年内有了长足进展,过去有关人类起源和迁徙的争论随着分子生物学和基因测序技术的突破已得到解决。例如现代智人是多地起源还是单一非洲起源已经清楚,成为科学常识。然而,这种科学常识在中国并未得到普及,与此相关的许多虚幻的人类起源想象支配着国人的骄傲并往往成为各类非理性民族情绪的基础。为此,有必要进行科普。这就是本讲座希望达到的目的

主讲人简介:77年大学工科,之前知青2年。1986纽约州立大学MBA。做过若干杂事,现退休在亚利桑那州凤凰城陪家人。喜旅游和杂读。

各位晚上好!谢谢参加本讲座。本来计划一次讲完,但在准备过程中发现内容很多,需要分上下两次进行。所以今天只是“上”。

谢谢主持人!谢谢各位。

今天要分享的话题对我自己来说也是新颖的,兴趣大约从半年前开始。 兴趣的动因有三个:

一是长期的“从哪里来”焦虑感;

二是在文明演化的讨论中回溯历史触及到了边界;

三是去年在美国国家地理做了个基因测试,看看俺的祖先到底是如何迁徙到中国来的。

正如人类对物理世界的理解要回溯到大爆炸的原初,人类对自身的理解不可能停留在人类“已知的”文明史内。如果说修家谱是想保持家族血统的轨迹,那么在家谱的尽头,血缘关系还如何延续?轨迹又是什么?如果无论出于什么目的要构造华夏的几千年文明史,那么在这个故事的前面又是什么?如果家族的骄傲是靠家谱的连续性和特色维系的,如果民族的骄傲是靠民族故事的特色和连续性维系的,那么如果把这个故事一直往前延续,特色是否仍在还在? 连续性是否能保持?如果你发现这种特色已经变成普遍规则,如果你发现连续性只是想象的构造,那么民族性究竟是什么?什么叫共同的血缘?血缘能成为民族自豪感的认同符号吗?

为了这个讲座,我有意在各种场合做了一些小调查。调查的问题很简单:中国人是本地起源的,还是非洲起源的?我听到的答复大多是:本地起源。我调查的对象,大多是高知白领人群,不难想象,如果你在大街上随机取样的话,那么认为本地起源的比例将会更高。本群群友呢?

前两天在一个饭桌上谈起印度人和南美人的素质,一位朋友断言这是印度人种的特点造成的,也就是说有某种生物学层面的差异造成了某些民族的低素质。(按此思路,是不是咱汉人人种也有问题呢?低素质可是相当的那!)我完全没有批评这位朋友的意思,但可见偏见和想象的范围极大,也可见人类学知识科普非常必要,也非常紧迫。

一个在世界上作为常识被接受的知识,为何在中国如此还如此不为人所知?今天的目的,就是希望能够通过科普解构想象。

(需要声明的是,本人在这方面也是初涉,所谈内容,属于分享性质,错误在所难免)

先介绍一下人类学的基本概念和研究方法。人类学是门庞大的学科,有两个基本面向:一是研究人的生物性和文化性,二是追溯人类的源头和演变。我们今天只谈后者。

研究人类源头和演变有4种方式,最不靠谱的方式是“历史人类学”,也就是在经典史书中找证据,例如《尚书》中说二帝三王都是夷人,又例如《史记》、《后汉书》、《国语》和《左传》中关于华夏众夷的故事,或四书五经中对饶、舜的描述。

这种方法之所以不靠谱,原因有三:

第一,所有这些经典的依据都是口传历史(或已失传的更早经典),而口传史我们知道是非常容易走样的,不信的话你可以讲个故事给某人听,再让他讲给第二个人听,传到第十个人,我敢说V10版本和V1版会大相径庭;

第二,典籍的作者往往会有倾向性或为某种现实目的筛取或串改故事内容,纯粹的客观历史记述只是我们的想象;

第三,史书经典记载的历史太短,即便是口传史,讲故事的时间尺度也就是几千上万年,但我们人类的演化是上千万年、几百万年的事,即便是现代智人(Homo Sapiens)也有近20万年的历史,这是历史根本不可能够得着的。

第二种方法是“考古人类学”,即通过考古发现古人的遗骨(人类化石标本)遗物(工具、住所、壁画、陶器、青铜器等)来判断人种、年代等等。这个方法比历史人类学方法要靠谱的多,不过它也有很多局限性。比如考古学的年代鉴定方法主要是根据化石/遗物的地质积层分析和碳14鉴定,而这两者都是有问题的。碳14鉴定一是误差大,二是超过5万年就无用了。

第三种方法是语言学方法。世界上大约有7500种语言,前七大语系为:

1.    Niger–Congo 尼日尔-刚果(1,538 languages) (20.6%)

2.    Austronesian 南岛 (1,257 languages) (16.8%)

3.    Trans–New Guinea  跨新几内亚(480 languages) (6.4%)

4.    Sino-Tibetan 汉藏 (457 languages) (6.1%)

5.    Indo-European 印欧(444 languages) (5.9%)

6.    Australian 澳洲(378 languages) (5.1%)

7.    Afro-Asiatic  亚非(375 languages) (5.0%)

语言也是有根的,和人类基因一样,会繁衍遗传。这7500种语言其实也是从根部通过进化变异演化而成的。

以印欧语言为例:


这是一个印欧语系的树形结构,从印欧语系的底分化出两大支,一个是欧洲系,如英语、德语、法语、俄语、西班牙语等等,另一个是印(度)伊(朗)系,如印地语、波斯语、孟加拉语、尼泊尔语等等。

语言人类学虽然是非常强大的方法,但语言进化和人种进化毕竟是两回事,例如一种文化强势会让其语言被其他种族使用和接受,例如中国人移民到美国,第二代第三代基本就讲英语了。所以并不能反映人种变化。

第四种方法是体质人类学方法(自然人类学)。体质人类学分旧体质人类学和新体质人类学,旧体质人类学历史也蛮悠久,从16世纪就开始了,主要研究身体构造、人体骨骼测量和人种划分,以及人种体质特征,一般仅限于对人的发色、发型、眼色、肤色等。老方法虽然有一定用处,但总体说都是研究人的外部差异,比较肤浅,无法反映人种演化的本质。

新体质人类学是上世纪80年代后随着分子生物学和基因科学的发展而发展起来的。其基础是1953年James Watson和 Francis Crick对DNA分子结构的突破性研究。一个地标性的突破,是比利时Ghent大学在1972年和1974年对RNA(核糖核酸)做的全测序。此后人类学进入一个全新的阶段,从模糊定性的分析进入精准定量的分析,从此将人类学,特别是人种起源和迁徙分布的研究建立在坚实的实证基础上。

为了讲清这一理论,需要简单介绍一下细胞、DNA, 染色体和基因的基本概念。


这张图描述了细胞、细胞核、染色体和DNA的关系。

染色体:是细胞内具有遗传性质的遗传物质深度压缩形成的聚合体,由DNA和蛋白质组成的。


DNA:脱氧核糖核酸,是一个生物分子。它携带了所有生物和细菌遗传信息。它由两条反向平行的多核苷酸链相互缠绕形成一个右手的双螺旋结构。


上面的ATCG是四种碱基(嘌呤和嘧啶的衍生物,是核酸、核苷、核苷酸的成分),成对出现,称为碱基对(Base Pairs,或bp),它们是DNA的组成部分,它们的各种组合决定了全部遗传信息。遗传信息的多少是由碱基对的数量来测度的,例如父系单传的Y染色体有6000万个bp,母系的线粒体DNA16000bp.

基因:是具有遗传效应的DNA片段,组成简单生命最少要265到350个基因。人类身上有20500个基因(和白鼠的基因数量类似),有30亿个bp.

1990年美英等国启动了所谓人类基因组计划,就是要揭示这2万多个基因和30亿个碱基对的秘密,破译人类遗传密码。此项目被称为生命科学的登月计划。此计划的第一步是对基因进行测序,到2003年,测序工作基本完成(只是测常染色体部分,占整个基因组的90%)。不过测序完成到揭示遗传密码之间还有巨大距离。

顺便说个有趣的数据:测出的人体身上的所有蛋白家族中,只有7%是脊椎动物特有的。也就是说,93%的蛋白都来自那些非脊椎动物。

明白了DNA,染色体和基因的概念后,进一步的问题是,DNA的遗传密码是如何转化为各种蛋白的呢?这就需要懂得生命科学中的“中心法则”。


简单地说,DNA中含有的遗传密码被“转录”成RNA,然后再由RNA“翻译”成各种蛋白,如骨骼,皮肤,内脏、肌肉和头发等等。也就是说,DNA中的“基因型”通过这样一个过程被转换成了”表现型”,即生物的外部性状。

基因人类学就是这些生命科学的成果在人类学方面的一个应用。例如,2005年前美国国家地理杂志和IBM公司合作,启动了GenoGraphic项目。其目的是通过收集全球人类基因来绘制人类基因图谱,研究人类起源、迁徙和演化的路径和关系。(有兴趣的可参见https://genographic.nationalgeographic.com/about/)


这是他们寄来的样品测试盒,你只要用棉签在嘴里抹点唾液寄回去,过10周左右就会得到你的基因测试结果。

交200美元,现在好像打折,150美元。

人类一路走来,虽然在外部留下的各种痕迹不是很多,但有幸在体内留下了清晰的足印。这个足印就是人类在遗传中的基因变异轨迹。(用基因变异标记,即Marker表示)

或称突变点标记

什么叫基因突变/变异?基因在向下一代复制时,虽然绝大多数都是忠实复制的,但总难免会出现部分差错,这部分差错和不同,就是突变,用下图简单表示:


上图中,子代的红色部分和亲代的对应部位发生了变化,因此也会对蛋白的表达(表观)产生变化,这就是突变。遗传学上把这些变异用记号标注,称为基因标记(Genetic Marker)突变的类型有两种,一种是单个碱基变化SNPsingle nucleotide polymorphism),另一种是短重复序列发生突变,或STRshort tandem repeat)。

基因的不同部分突变的速率是不同的,例如Y染色体虽有6000万个碱基对,但可检测的全长只有1000万个,它的突变速率大约是每100年有一个突变,或者说,发生千万分之一的变化。换算成万年的话,就是每100万年,发生千分之一的突变。通俗的理解,就是我们和100万年前的古人相比,在Y染色体上,今天的我们和他们只有千分之一的差异。

迄今为止,全球已经有75万人参与了此项目,即提供(收费的,200美元)自己的DNA样本供研究人员分析,并获得自己的父系(Y染色体)和母系(线粒体DNA)的变异标记(Marker)和迁徙路径。随着参与人数的增加,通过这个基因大数据已经摸清了人种的大致分布情况,即已经把人类演化的主要树干和粗枝勾画出来了。

男性可测父系,女性只能测母系,因为没有Y染色体啊

我去年9月也参与了此项目做了测试,在此可以与各位简要分享一下测试结果。

首先,所有现代人类全部是6-7万年前走出非洲的,也就是说,非洲现代智人是所有人类的祖先,不论你是什么肤色、体型、面部特征或发色。(我知道这点很多人听了非常不爽)我这里先说结论,后面再论证为何全部人类都起源于非洲。



这张图中的右侧M那支走出了非洲

测试结果分几个部分。第一个部分是告诉你你6万年前的远古祖先和尼安德特人(Neanderthals)尼人)的混血情况,如下图。


尼人是现代智人的近亲,与我们在基因上有99.5%的重合。尼人生活在欧亚大陆,最早的化石有30万年之久,但到了4万年前灭绝了。原先有人分析说尼人是现代智人的一个亚种,但现在的公认是他们有独立起源。他们也是从非洲跑到欧亚大陆去的,时间大约是35万年到60万年前。他们和现代智人大约有3万年的重合,其间与现代智人有混血,所以国家地理测试的75万人全部都有尼人基因,范围从1%4%,全球平均值是2.1%。 如图,我的尼人基因比例是1.3%。 (四肢发达,大脑简单,好事还是不好?)

NG把全球人类分成9个祖先类,分别是地中海人、北欧人、西南亚人、撒哈拉非洲亚族、南部非洲人、东北亚洲人、西南亚洲人、美洲土著、大洋洲人。研究人员先找出他们的特征祖先半倍体作为基准参数,然后将各国民族与之比较,看看基因频率分布情况。然后再将被测试人的基因测试结果与所在国的平均分布进行比较。

对不起,是“单倍体”,而非“半倍体”,更正一下

比如,中国人基因由四种基因参照型构成,其平均分布是:

东亚81%, 中亚8%,东南亚/大洋洲7%,芬兰/西伯利亚2%。  


而我的基因只有两种参照基因型构成:69%的东亚型和31%的东南亚/大洋洲型。从这个结果看,似乎我的祖先是百越族,并且从云南/广西那边迁徙到北方的年代并不长,还没有机会和中亚或芬兰/西伯利亚型的人种混血。

再就是我的Y染色体和线粒体DNA的基因标记演化图。 要讲清这个,还需补些基本概念:为什么要测Y染色体和线粒体DNA?

上面说了,人类的所有遗传基因都在染色体内。人体每个细胞内有23对染色体,其中22对是”常染色体”,第23对是“性染色体”。男性是XY,女性是XX。 如下图。


如果把父系、母系看成是两幅牌,每幅牌有30亿个碱基对,今天我们体内的这22对常染色体就如同这幅牌被洗了5000次,(按我们的祖先从10万年开始,每代20年算),显而易见,无论你的计算能力再强大,几乎无法把这幅牌再复原回去的,也就是你无法弄清父系的演化路线和母系的演化路线了,这两边被彻底混合了。

但所幸从性染色体看,Y只是父系单传,从线粒体DNA看,只有母系的线粒体DNA才进入子代,这样我们就可以通过测序Y染色体和线粒体DNA来追溯父系和母系的演化路径。

我的父系路径测出来是这样的:


注意看底部的从P305一直到M95的一行,这就是我父系祖先的Y染色体的基因突变标记路径,反映了我父系单倍体的演化情况。

下面选取几个重要的标记做些说明:


标记:   P305M42

地点:   非洲

现今所有人类的父系共同祖先,被称为"Y染色体亚当",诞生于30万到15万年前。

在10万年前,发生了P305的突变,这是我们已知的最古老的父系变异。他是全人类99.9%父系祖先。

8万年前,Y染色体的BT分叉诞生了,用M42标注。这一支绝大部分走出了非洲,只有极少数留在了非洲大陆。


M168是最早走出非洲的一支,也是现存非洲大陆之外人类的共同祖先,也就是说,所有75万测试者都带有这个标记。他们在东非7万年前从红海最南端的Bab-al Mandeb海峡走出非洲。


就是这里


这是人类已经走到了西南亚,时间约为6万年前。这是人类走出非洲后第一个重要的基因突变,所以在人类进化史上扮演一个重要角色。他们沿着阿拉伯半岛海岸线迁徙,进入印度,这一支是亚洲、东南亚和澳大利亚最早的居民。5万年前,到达澳大利亚,他们是今天澳大利亚原住民的祖先。人类走出非洲的原因是气候和环境的巨大变化,如冰川变化和雨林变成草原的变化,因此改变了他们的捕食地和生活方式。简单点说,动物跟着植物走,人类跟着动物走,都是为了捕食。

因为时间和篇幅原因,这里跳过中间几个标记直接快进到P186,因为这个开始与中国相关。


标记: P186

时间: 28,000 – 41,000年前

地点: : 东南亚

2.8到4.1万年前,人类沿着亚洲海岸线进入东南亚。从那里,一部分人继续向北进入东亚。这些人的大多数进入南中国内地。所以P186是这个地区出现频率最高的标记。从这里,一部分人又向西退回印度次大陆。这个标记在印度男性中的比例占23%, 日本为47%到65%,韩国为70%到82%,汉族为69%到86%。

再快进几个到最后一个标记M95.


标记: M95

时间: 34,500 – 48,750年前

地点:东南亚

此标记在东南亚几个国家的分布如下:

爪哇42% ,越南40%, 马来西亚28%, 中国大陆大约3%

此外,测试结果还提供了一份父系基因型分布图如下,其中颜色越深表示和我的基因型越接近。也可以说,这就是我的“亲戚”分布图。


因时间关系,无法详细介绍我的母系路径,只是在此简单帖张图,可见我的母系走的是北方路线,从中亚向东亚迁徙。我的母系或者是从西伯利亚往南进入中国内陆,或者继续向东进入中国东北地区。


说了半天父系和母系的DNA标记演化路线,那么我在人类演化树上到底处在什么位置上呢?这个是由我的单倍群(Haplogroup)来描述的,如图:


即我的母系单倍体类型是Z3C,父系是O-PF3188。而且上面说,在所测试的75万人中,我的Z3C类型之占小于0.1%,即不超过750人,O-PF3188也一样。

什么叫单倍群(Haplogroup)?(对不起,这里面需要解释的概念太多,解释的话,量太大,不解释的话说不清,唉)

借用复旦大学生命科学院严实博士的文字:一個在檢測中完全不能區分開的單倍體(haploid,Y染色體、線粒體都是單倍體,相对於常染色體那樣的二倍體)的類型稱作“單倍型”(haplotype),線粒體某一段完全相同(比如高變區)的也可稱爲一個單倍型。而一些關係較近的單倍型放在一起就組成了單倍羣。

通俗点说,就是在某个突变SPN下的一群具有共同遗传特性的人。

比如有A、B、C三個人,B和C有M175這個SNP的突變(寫成M175+),A沒有M175的突變,即M175的原始型(寫成M175-)。而C有M122這個點的突變型(M122+),A和B都是M122-,那麼,因爲M175+的人包括了M122+和M122-的人,而M175-的人全都是M122-,說明M175發生得比M122早,後來有M175+的一個人又發生了M122的突變,M122更晚近,也就是說M175在M122的上游。做成樹就成了這樣:


用此方法把所有人的单倍群画出来,就画出了一棵树,能把所有单倍群的演化关系描述清楚,如下图:


请注意,这个图仅仅是张老图,所以只是示意而已。随着人类测序数据的增加,这张图每天都在变。这棵树(其实应该倒过来看)的主干就是M168,是所有非洲之外的人类共有的。然后不断分叉,我的最后一个DNA标记是M95,往下其实还有许多细分,但这个还在研究之中,并没有确定结果。

国家地理测的最后一个标记M95处于这张图的右边第三个,对应的单倍群是O2a

我企图查到我的O-PF3188究竟往上往下是什么从属关系,但就是查不到。只是看到一份2014年的更新,如图:


随着测试数据的丰富,相信今后一定能有更详细的分叉信息。

那么我这个O2a-M95分布在哪里呢? 从下面这张图可见,它主要分布在东南亚一带,中国的華南、南方少數民族、中南半島及印度Munda人群分佈較多。看来,我还真是南方系,甚至是百越族人。


据严实博士提供的资料,东亚各民族的单倍群分布是这样的:


从NG的测试结果来看,可以总结一下几点:

1. 现代人类是从非洲起源的,走出非洲的时间大约是7万年前。

2. 人类迁徙的原因主要是环境变化和觅食的需要,随着冰川期的变化及相应的全球气候变化,森林和草场在不断发生变化,由此导致动物的迁徙和人类的迁徙(采集和捕猎)

3. 人类向全球迁徙的路径是网络状的,最早一支从阿拉伯半岛沿海岸线向南亚运动,然后向东进入印度、澳洲和东南亚地区,另外一只从近东向中亚、西伯利亚运动,直至东亚和美洲;还有一只在大约4-5万年前从欧亚大陆博斯普鲁斯海峡进入欧洲。

4. 人类在几万年的迁徙过程中,自身在不断发生变化,产生出新的变异记号和单倍群(Haplogroup)。基因人类学家就是根据这些基因突变的半倍体类型来追踪人类的演化路径的。

5. 智人进入中国来自多个方向,东南西北向都有,时间有先后。 所谓华夏民族就是不同时期进入远东这块地方的西来移民的叠加和混血结果。

今天就讲到这里,谢谢大家。

问:这个讲座非常好,我之前关注过人类学论坛,但是很多看不懂. 

答:语言和人种没有简单对应关系

问: 你的父系是从南方来而母系从北方来,这是不是造成你非常聪明的原因之一?

 答:你真不知道各个群里都有大神,我这是哪对哪?

问: 这个讲座最大的意义就是告诉我们。世界上所有的人都来自于同一个祖先。每一个种族,每一个人都是平等的。 

答:人的生物性差异的确非常小

问:听说印尼一些岛上住民的头、手等词的发音,与中国普通话中头、手等词的发音一样,也可佐证夏老师的论证? 

答:语言学研究和基因人类学研究有非常高的重合度,这有很多文章。

问: 我想知道 单眼皮双眼皮是怎么变异的,反正大猩猩表哥都是双眼皮,朝鲜族基本都是单眼皮。 

答:估计目前科学家还没有找到双眼皮和单眼皮差异对应的那个突变标记。而且出非洲时是单是双我也不知道。

问:小孩身上的胎记是咋回事。

答:这个太细了,不知道人类学研究不研究。

问:我们和黑猩猩大猩猩拥有多少共同的基因?现在地球上的猿有可能近一步进化吗? 

答:人属 Homo和大猩猩的分叉大约在600万年前。共同基因绝对在90%以上。

问: 老师我有一事不明,汉藏语系占6.1%,是指人口还是语种?

答:指说汉藏语系的人数。

问:古人是如何迁徙?他们使用什么工具。

答复:在驯马之前用腿,之后有马和骆驼。

问: 尼人怎么消亡的?

答:自然(气候、食物链)和与现代智人的竞争两个因素。

问: 七万年前各大陆板块是在今天这位置吗?气侯有何不同?人类可走这么远?

答:七万年前的板块基本是今天这个样子,但还在移动,比如欧亚大陆还在以每年1根头发丝的宽度在分离。我们今天容易低估古人的迁徙能力。再说,那是海平面要比现在低100米,很多地方都是连着的。近东到中亚一直到远东都是大草原,不难走的。

问:所谓人类走出非洲,这本身也应该是个陆陆续续的过程吧?本身持续了多久呢?几千年? 一万年?累计大约有多少“人”走出了非洲呢?

答:那是一定的。走走停停,可能一停就是几千年。不仅如此,还走走退退,并不是直线前进的。

问:从非洲迁徙时每年约移动多少公里?

答:没有这样一个每年速度。如果环境不变化,有猎物有果子,就无需跑那么快,反之,就会快跑。

问: 通过科普来解构想象,是不是西西弗斯似的努力? 

答:其实我个人认为,只要传播不受限制,应该还是容易得到大众理解和接受的。西西弗斯是没有希望的事,太悲观了。

    下载DOC文档