藏缅语族语言的数理分类及其形成过程的分析

2016-01-28   王士元 邓晓华

提要 传统的藏缅语族语言的分类只重视语言差异的定性分类,而无法作语言间亲缘关系的距离的程度的量的分析。本文运用词源统计分析法,对中国境内的藏缅语族语言作出数理分类以及亲缘关系程度的描述,并通过树枝长短来表示距离关系。显示藏缅语族语言的类簇和分级层次。同时计算出藏缅语族诸语言的时间深度,并分析其形成过程。

一、藏缅语族的民族、语言、人口及分布

藏缅语族是汉藏语系中语种最多、分布最广、内部差异最大的一个语族。在中国,使用藏缅语族的民族有:藏、门巴、珞巴、景颇、独龙、怒、羌、普米、彝、哈尼、阿昌、拉祜、基诺、傈僳、纳西、白、土家族等 17个民族,据87年《中国语言地图集》公布中国境内的藏缅语族语言共有23个,即藏、嘉戎、错那 -门巴、仓洛 -门巴、博戈尔 -珞巴、义都 -珞巴、格曼 -簦语、达曼 -语、景颇、载瓦、独龙、怒、羌、普米、彝、哈尼、阿昌、拉祜、基诺、傈僳、纳西、白、土家语。而据最近的研究 (97),中国境内的藏缅语族语言则已增加到36种,原因是发现了一些新的语种,例如,木雅、道孚、扎巴等。就国内外藏缅语族语言的数量来说,分歧较大,国内学者认为 100余种,而马提索夫则认为至少有250种。主要原因是划分语言和方言的标准不统一,国内民族数量划分少,语言数量也少。彝语六大方言根本不能通话。藏缅语族内民族与语言关系极其复杂,有的一个民族使用多种语言,例如,藏族使用藏、嘉戎、木雅、扎巴、道孚等语,景颇使用5种语言,除了景颇语外,其他4种则属彝缅语支。有的几个民族使用同一种语言,例如羌族和部分藏族使用羌语。使用藏语的则包括:藏、蒙、土、回、珞巴等民族族。据估计,藏缅语族语言人口约1千5百万。例如羌语人口15万,其中羌族9万,藏族6万。

藏缅语族的分布:主要分布在中国、缅甸、泰国、越南、孟加拉、老挝、印度、尼泊尔、不丹、锡金等国。在中国,藏缅语族主要分布在西南、西北、及中南地区的西藏、青海、甘肃、云南、四川、贵州、广西、湖南、湖北等省。

二、藏缅语族语言的传统分类

1、语言分类是认识语言关系具突破性的层面。

19世纪50年代开始认识藏文跟缅文有同源关系。最早英国学者Konow Sten《印度语言调查》(1903-1928)藏缅语分9个分支。

1937李方桂《中国的语言和方言》采用谱系树分类法,分藏缅语族为4个语群,即1、藏,2、景颇,3、缅,4,彝;分语群和语言 2级。

罗常培、傅懋绩《国内少数民族语言文字概况》藏缅语族分类近似李,分4个语支。

而《地图》则分藏缅语族23种语言为7类:

A、藏、嘉戎、错那-门巴、仓洛-门巴、

B、羌、普米

C 、博戈尔 -珞巴、义都 -珞巴、格曼-簦语、达曼 -簦语

D、独龙、景颇

E、载瓦、阿昌

F、彝、纳西、白、傈僳、怒、拉祜、哈尼、基诺

G、土家语

戴庆厦 1989分藏缅语族为南北两大语群:(表引自戴 1989)。

孙宏开分藏缅语族为5个语支,增设羌语支,即藏,羌、彝、缅,景颇。孙94年增加中国境外藏缅语族语言,作全面的藏缅语族分类。

本尼迪克特的藏缅语族分类:(中译文表引自孙、江1999)。

马提索夫的藏缅语族分类:

分类的标准主要有:语音面貌,语法范畴,词汇系统即同源词的多寡和对应关系的远近。

以上分类除了国外藏缅语,涉及国内藏缅语问题的主要分歧有:

1、羌语是否单列一个语支,瞿蔼堂归藏语支,戴庆厦归嘉戎-独龙语支,孙宏开单列。

2、白语的归属,两种意见:

A、归汉语族,格林伯格1953《历史语言学和无文字语言》认为白、汉有发生学关系,主张白语归汉语族,本尼迪克特同意此观点,划归汉语族。郑张尚芳同此观点。

B、归藏缅语族。

或单列独立语支,或归入彝语支。戴庆厦单立、孙宏开、吴安其归入彝语支。他们都认为白、汉是接触关系,而非发生学关系。

三、藏缅语族语言的计量分类

1、分类的标准和方法:100词及数量方法。

本文主要运用词源统计分析的理论和方法来作藏缅语族语言的亲缘关系分类。词源统计分析法的基本观念是两种具有亲缘关系的语言分离的时间深度,可以通过它们继承的词的共享程度来判断。语言的亲疏关系不同于语言的亲缘关系,亲疏分类是一种类型上的分类,而亲缘分类便是遗传上的分类。亲疏分类的对象是不必有遗传上的联系的,但是,如果是亲缘分类的话,分类对象就必须是有亲缘联系的。词源统计分析法最初由 Swadesh 提出,近年来,由于生物学种系发生树理论的不断完善和计算机的巨大进步,词源统计分析法又开始受到历史语言学家的极大重视。王士元(1995)曾运用词源统计分析法作出壮侗语族的分类,但国内学者仍较少运用此方法作民族语言分类。

我们主要依据Swadesh的100词表作同源词的数理分析,同时参考选择雅洪托夫的35词表,具体分析了藏缅语族的12个语言,最后画出藏缅语族语言树形图。树形图包含两个重要的信息:1、语言集团的呈阶级式的聚合分类; 2、树枝的长度可以反映语言从祖语分离的时间距离以及各语言间亲缘程度。

2、数理分类的主要步骤:

(1)相似矩阵( Similarity Matrix)首先优选出同源词,编制同源词表,然后计算出每对语言的同源百分比。

lasa Alike qiang pumi jiarong jingpo yangguang sani mojiang naxi bai tujia OC

lasa 92 54 49 53 44 52 51 55 54 33 35 31

alike 52 50 52 43 52 52 55 51 31 33 31

qiang 79 73 56 60 58 60 65 40 40 34

pumi 74 46 65 63 66 64 34 32 34

jiarong 49 63 60 60 59 34 37 33

jingpo 54 43 48 50 34 33 28

yang

guang 67 69 68 34 35 32

sani 72 61 31 37 30

mojiang 72 34 38 32

naxi 32 33 31

bai 23 33

tujia 20

(2)距离矩阵( Distance Matrix)

由于数理树形图是通过分枝的长度来反映语言间的距离的,所以,我们必须把上面的相似矩阵转换为距离矩阵 (Distance Matrix)。

(3)从无根树到有根树

从距离矩阵转换成无根树有许多种方法,所有这些方法都需要大量的计算。生物学家为生物种系发生分类设计出很好的计算程序。我们采用的计算程序,则是最有影响的,1967年由Fitch和 Margoliash发明的以及 1987年由 Saitou和 Nei发明的程序。

藏缅语族语言数理树形图:

树图一:12 languages:

Neighbor joining: bai as an outgroup

树图一显示藏缅语族12支语言,可分为6个较大的聚类,即白、景颇、土家、藏 (拉萨、阿力克 )、彝缅(哈尼、彝、纳西、缅 )、羌(嘉戎、普米、羌 )。其分级和层次可假设为:由于白、景颇的树根分叉点的数字为零,所以可以认为树图的第一层为三分,即白、景颇和土家等;第二层次则为;土家与藏(拉萨、阿力克 )等;第三层次则为藏与彝缅(哈尼、彝、纳西、缅)、羌(嘉戎、普米、羌);第四层次则为彝缅与羌,显示平行关系。彝缅的远近关系依次为哈尼、彝、纳西、缅;羌的远近关系依次为普米、羌、嘉戎。树图的数字代表树枝的长短距离,反映语言之间的亲缘关系的远近,树枝长的表示两种语言亲缘距离远,树枝短的则表示两种语言亲缘距离近。而同一个小簇类里的语言关系则比外簇类的语言关系近。树图一显示在藏缅语族 12支语言中,白、与土家的线条特别长,这可理解为:如果我们假设语言分化后,各自演变的速度本来应是均等相同的,但是由于白与土家与其他语言接触多,借词成份特别多,所以其变化速度特别快,这就显示出白与土家与其他语言的不同的演变结果。

树图二:增加古汉语的数据,变成13支语言,发现图一计算出来的12支藏缅语族语言分类格局仍然未变。

neighbor joining

图二显示13支语言,可分为7个较大的聚类,即古汉、白、景颇、土家、藏(拉萨、阿力克)、彝缅(哈尼、彝、纳西、缅)、羌(嘉戎、普米、羌)。由于景颇、土家的树根分叉点的数字近为零,所以不能认为土家跟藏(拉萨、阿力克)为一个小簇。可以假设认为树图的第一层为三分,即古汉、白与景颇等;第二层为四分,即景颇、土家、藏(拉萨、阿力克)、彝缅(哈尼、彝、纳西、缅)和羌(嘉戎、普米、羌)。第三层为二分,即彝缅(哈尼、彝、纳西、缅)和羌(嘉戎、普米、羌 ),其内部距离远近一如图一所示。

树形图说明:

我们使用了Neighbor Joining 和 Fitch两种计算方法,结果都一样。各分级层次的类簇相同。增加汉语数据,由12支语言变成13支语言后,分类的情况仍然相同。

我们曾经考虑过白与土家的线条特别长,是否因为白与土家这两支语言的借词成分特别多,我们采用了排除的方法,即先排除白与土家语,看看其他语言的分类结果是否跟未排除前一样,结果显示跟原先的分类基本一致,这就说明分类结果是可信的。

从三个不同的树图比较来看,我们有个重要的发现:随着语言数的增加和减少的数据的变化,树图的反映很敏感,都会体现在树图的不同变化上;而最重要的变化是白、景颇、土家这三支语言在图中出现的位置,即摆放的位置不同,这就反映了这三支语言在12支藏缅语言中的特殊地位不同,而传统的分类正是认为白、土家系属未定,而景颇地位特别,学术界为此常常引起争论。数理分析的结果跟传统的定性分析相合。

3,几点结论:

A、据树图藏缅语族语言可分为 6个较大的聚类,即白、景颇、土家、藏(拉萨、阿力克)、彝缅(哈尼、彝、纳西、缅 )、羌(嘉戎、普米、羌 );这种分类结果与戴根据不同材料、不同的方法作出的分类完全一致。

B、树图表示白、景颇、土家各自为独立一个聚类,可视为单一语支;特别是白语,单一性特别明显,这个结论与《地图》将白语归入彝语支的观点有很大差异。但是白语虽然跟古汉语在假设的同一个分级层次上,两者关系特殊,但并没有跟古汉语形成同一个簇类。从亲缘关系的距离来 看,白语离树根最远,其次是景颇语和土家语。同其他藏缅语族语言比较,白语与彝缅语聚类最近,特别是跟哈尼语最近;这结果跟传统分类往往把白划入彝语支相似。

C、本尼迪克特认为白语归汉语,藏缅语族语言以景颇语为中心,向四周其他语言辐射。树图表明第一层次上的分类即景颇语、白语及其他藏缅语的三大聚类。这在一定程度上,跟本氏设想相合。

D、藏缅语族语言有相当高的同质性,确实存在一个藏缅语族语言共同体。

E、羌语支语言为独立一个聚类,可视为独立于藏的另一语支。黄布凡认为羌语支保留古藏文已没有的小舌音和9个辅音韵尾及其他复辅音韵尾,保留古老面貌,独具特点。树图的结果支持把羌独立为一个语支的观点。

4、计量分类跟传统分类的比较

最重要的差别:

(1)、传统分类只重视语言差异的定性分类,而无法作语言间亲缘关系的距离的程度的量的分析。而计量分类可作亲缘关系程度的描述,并通过树枝长短来表示距离关系。

(2)、虽然使用的材料和方法不同,但分类的结果却大致一样。

(3)、可以显示语言的类簇和分级层次。

(4)、传统分类都没有细分出藏缅语族各语言的较小的聚类和关系程度,我们的树图显示,羌语支内部羌语跟普米的距离最近,其次是嘉戎;而彝缅语支内部哈尼与彝关系最近,其次是纳西,最远的是缅。

5、关于白语的系属问题

白族是整个西南民族汉化最早、最深刻的一个民族。白语是否属于古汉语的一支?虽然白语中的汉语借词高达百分之60以上,包含了古今汉语各个时期的新、老借词,但是我们仍然认为白语属于藏缅语族语言。主要证据有:

(1)、语言学内部证据,在106个核心同源词中,与羌语同源40个,与彝语同源34个,有些是与其他藏缅语族语言交叉同源,有些单读同汉字,但与藏缅语族同源部分,保留在合成词的语素中;如此统计则数量更多。有些同源词虽然可以追溯到与上古汉语同源,但同源词音韵变化形式与其他藏缅语族语言相同或相似,走的是同一条音变路子。例如:“太阳、地、树、根、叶子、狗、鱼、虱、鸟、尾巴、羽毛、犄角、脖子、头、眼睛、鼻子、耳朵、嘴、脚、牙齿、乳房、胸、腹、舌头、肉、血、心脏、皮、名字、人、男人、妇女、说、吃、知道、死、杀、燃烧、给、飞、来、站、大、小、冷、满、新、好、干、白、黄、绿、你、我、我们、那 (近)、那(远)、胖、肥、什么、一、二、没有”。

统计结果表明白语在106词中有超过45个词与藏缅语族语言同源。据此,白语与藏缅语族语言是发生学关系。

如果将白语与汉语一对一的单独进行比较,很可能会认为白语中许多词是古汉语借词,但经过多语言的全面比较后,则会有新的看法。例如“新”貌似借词,实际上来源于古汉藏语。

(2)、人文科学证据,即语言学外部证据

据多学科研究,云南的汉文化直到明代才占统治地位,成为“主流文化”,明代之前汉文化为“非主流文化”,即明之前以“土著文化”的“地方化”为主,明之后以“主流文化”的“汉化”为主,所以云南的少数民族包括白族操明清时形成的西南官话,而不同于闽、粤、客方言保留唐、宋时代的中原汉语音韵。白族自称“民家”,其认同形成于明代,明政府将云南居民划分为官户、民家、夷,其中官户、民家系汉族,民家为一般汉人,夷则为云南少数民族,虽然汉族仍称白族为“夷”,但白族精英坚持自称为“民家”,以示认同汉文化,以别于云南其他少数民族。白族汉化过程很早,白族政权南诏国与唐王朝关系极密切,但据日本发现的宋元写本《南诏图传》看,白族文化与汉文化仍有较大差异。元代白族模仿汉字创造白文。宋元时,白族地主经济以及科举文化水平已与汉族地主无异。

白族是自新石器时代生活在甘、青地区的氐羌的后裔,春秋、秦汉称“滇”,三国时称“叟人”,南北朝时称“人”,唐代“白蛮”,宋元“白人”,明清“民家”。自称“爨子”,“白子”,“白尼”,“白伙”等。唐宋以前仍实行“石棺葬”和“火葬”,文化类型同彝缅民族,而异于汉族。

四、藏汉分离及藏缅语族内部各语言分离时代

计算出语言分裂的时间深度是历史语言学最具有挑战意义的工作之一。Swadesh受到化学上发明的碳-14年代测定法的启示,认为可用基本词汇作测量单位,他假设基本词在漫长的时间跨度上的取代比率,是相对稳定的,每1000年的保留比率为 80%,即r=0.8。如果两种语言La和 Lb分离的时间Td是在2000年前,那么La和 Lb所保留的比率为 0.8×0.8,即最初词汇的0.64。

如果我们用P(La、Lb)来代表两种语言中保留的基本词汇的比率,词源统计分析法的公式可写为:

P(La,Lb)=r2t

t=lg(P(La,Lb) )/(2 lg r)

根据以上公式,如果t=2,那么P(La,Lb)的值接近41%。如果t=3,那么 P(La,Lb)的值接近26%。如果已知P(La,Lb)的值,那么,就可计算出任何一对相关语言的t值,得出这两种语言分离的时间Td。比如说,如果两种语言保留有26%的共有基本词汇,它们分离的时间则在3000年前。

下面是我们根据12支藏缅语族语言的共享的基本词汇比率,运用词源统计分析法,计算出藏缅语族内部各语言分离以及藏汉分离的时代。表中数字代表距今的相对年代,例如古汉语与藏语分离距今约2755年左右,而羌与藏分离距今约1511年左右。这仅仅是个大致的推算,并非绝对年代。

假定两种语言失去联系后,在词的保留方面互不影响,那么,共享的基本词汇的比率必定是两种独立保留的基本词汇的产物。两种语言的核心词共享程度的比率不同,其分裂年代的时间深度是不一样的。学术界采用每1000年的保留比率为 80%或 85%这两种计算方法。我们认为采用每1000年的保留比率为 80%的计算结果较符合人文学科的研究结论。当然,我们还要考虑到树图的每个分级层次的结合点,往往会因为新的层次的接触产生新的词的共享度而跟上一层次的语言词的共享度有所差别,所以,注意排除各个层次的借词是很重要的。

人文学科表明,夏、商、周三代时期是前藏缅文化与前汉文化反复冲突接触的时期,以黄帝为代表的华夏集团以中原为中心建立夏王朝,这应是汉语族的直接先民;以炎帝为代表的东夷、“三苗”等南方民族取代夏,建立商王朝,但中心仍在中原。实现南方文化与北方文化的大融合。以西北地区甘、青文化圈为主的羌戎民族南下中原,建立周王朝,这是前藏缅文化与中原地区的华夏文化的大融合。所以、直至诗经时代,藏汉关系仍很密切。

藏汉分离年代与人文证据大致相同。

而藏、羌分离时代跟唐代藏族“吐番”王国的建立的时代相合。

五、藏缅语族与其他语族的关系-区域文化共同体接触融合的结果

1、藏缅语族与汉语的关系

学术界一般公认藏缅语族与汉语之间存在着发生学关系。检查106核心词,藏缅语族与汉语的同源词远高于苗瑶语族与汉语同源词,以公分母算有38个,其中以与羌语同源最多,有34个。“我”藏缅语族与汉语古今音义几乎完全一样。

2、藏缅语族和苗瑶语族各自的区域特征明显,各自有一批不同的特征词。例如“我、牙齿、火、头、手、鸟、血、烟、死、杀、盐”等。(因限于篇幅,相关词表省略)。

3、有一些跨语族及跨语系的同源核心词藏缅语族、苗瑶语族和汉语同源的,例如“月、干(干枯)、脖子、舌头、圆、满、来、角、眼睛、鼻子、耳朵、名字、路、给”等。

特别值得注意的是,有些词,南岛语跟藏缅语族、苗瑶语族、壮侗语族和汉语同源,例如“箭(射、弓、弩 )、脚(跤)、风(飞廉)、舌头、月亮、米 (稻)、路、巴 (猪)、飞、树、皮肤、油脂、马”等。

而南岛语跟苗瑶语族、壮侗语族同源的核心词则更多,例如“死、杀、穿山甲、地 (田)、盐 (卤)、我、火 (苗瑶外 )”等。

六、关于东亚语言与民族演化进程的几点思考

1、文化 -文明,多样性与同一性。

文明的交流和传播。

古藏缅语很可能与斯达罗斯廷Sergai Starostin主张的“汉语-高加索”语系有关。

M.Rulen将南亚语、苗瑶、台、南岛划归南方语系Austric,而将汉藏语归入德纳-高加索语系Dene-Caucasian。

最近的考古研究证明小麦、青铜器、铁、车马、土坯建筑技术、先进的农耕灌溉技术为西方欧亚草原传入,经新疆 ---甘青--华北(龙山文化--华夏区),铁是古藏缅人---周人(羌戎民族)用马车载到华夏族的中原地区的。家马、骑兵、驯马技术由乌克兰草原传入。

青铜器、铁、车马等非常成熟突然出现在晚商时期,并非中原地区新石器时期以来的延续性发展,而是欧亚北方草原文明传播的结果。

例如,“马”在藏缅语语言中形式变异很大,但显示同质性,所以中国学者往往构拟了一个非常复杂的上古汉藏语形式,具有词头、词尾和复杂的复辅音形式。实际上,“马”应是西亚借词。考古学证明,中国北方地区龙山 -夏商时期没有发现家马的证据,马骨很少,与人没有关系,但中、西亚马骨、马车大量出现,5000年前已有驯马文化。家马-成熟的马车突然出现在晚商殷墟墓地。“马”的大量出现和传播不超过 4000年。所以,其形式应该并不复杂。

2、区域文化的交互作用圈理论。

多元一体---独立的土著文化单元----文明中心。

一方面,我们应认识到前汉藏语时期多种语言文化系统同时并存的格局,另一方面应认识到各系统间文化交流的重要性。例如,青铜器的制作中心在黄河中游地区,而矿产资源却来自长江中游地区,显示黄河文明与长江文明之间的交互作用。但最终黄河文明影响长江文明,藏缅语汉语影响苗谣语壮侗语。这就是我们对不同文化区域的共同性和特殊性的认识。

语言的分化与融合是语言发展中的两种不同形态,龙山---夏商时期主要为语言的融合时期。语言形成因素的多源性和复杂性。一些语言主要受一个来源的语言因素的影响,形成单一构成语言形态长期稳定发展的局面。另一方面,还有一些语言则同时或先后接受了几个不同来源的语言因素的影响,形成完全变异的复合语言形态。所以,我们主张语言的演化为多线演进模式,而非单一的演进模式。著名的考古学“重瓣花朵”理论即强调区域文化的交互作用,也强调文化中心区域向周边地区的幅射作用。这个理论很值得语言学借鉴。

3、“主流文化”“汉化”与“地方化”“非汉化”的两条演化路线以及族群、国家与社会之间的互动。

强大的政治因素在语言文化的发展中起决定性的作用。自龙山---夏商时期起,到封建时代的科举政治,前汉语族所在中心 --中原语言文化一直为统治地位,所谓“逐鹿中原”,中原---边缘的关系一直是持续动态的。藏缅语语言中的白语和土家语的形成和变化应作如是观。

4、地域文化传统是语言分布格局的基础。

环境对语言发展的限制、阻隔封闭作用和语言对环境的适应这是方言形成和变化的最主要因素。前藏缅民族---羌周原先是定居的农耕社会,但4000---5000年前气候突然变化,沙漠化形成,前藏缅民族---羌周由定居的农耕社会转变为畜牧业为主的狩猎游牧社会,因争夺生存资源,其与中原关系则更为密切,藏缅语和汉语发生大融合。

综前所述,我们对古藏缅语的形成和演变提出一个假设:古藏缅人来自非洲,经过高加索、中北亚进入中国,但进入的时空不一致,又发生与土著人的杂交融合,形成相对独立的语言文化系统格局,但经龙山 -夏商以来的文化交流与传播,各个相对独立的语言文化单元经过换用规则,产生相似性,这便是汉藏语系诸语族形成过程的基础。

结语:

本文首次运用词源统计法作藏缅诸语言关系及其时间深度的研究,与传统分类相比较,虽然材料和方法不同,但分类的结果与传统分类大致相同,并能发现传统定性分类的缺陷,用数理方法测量出语言亲缘关系的相关“程度”。同时树图研究证明白语、羌语、土家应当分别独立为一个语支,这对解决长期以来的学术界因为传统的分类而产生的争论,提供一个数理分类的样品。以100核心词为对象,计算及分析汉藏诸语言的同质性和多样性、变异性,语言的同源和接触等各种复杂关系。计算出藏缅诸语言分裂的年代,其结果与人文科学研究结论大致相同。希望揭示东亚语言与民族演化进程的特殊性以及历史比较法的局限性。

参考文献

Cavalli-Sforza,L.L.and W.S-.Wang.1986.Spatial distance and lexical replacement. Language. 62.pp38-55

Dyen.Kruskal. and Black.1992. An Indo-European Classification: A Lexicostatistical Experiment.

Transactions of the American philosophical Society,Vol.82,Part 5.

Ellegard,A. 1959 Statistical measurement of linguistic relationship.Language.35.

Merrit Ruhlen,1991, A Guide to the World’s Languages:Vol. 1:Classification, Stanford University Press.

Li,F.K.1973.Languages and dialects of China. Journal of Chinese Linguistics 1.1

Swadesh, M., 1952, Lexico-statistic dating of prehistoric ethnic contacts,with special reference,

Philosophical Society 96

Swadesh, M., 1955, Time depths of American linguistic groupings, American Anthropologist 56.

Teeter, K.V.1963.Lexicostatistics and genetic relationship. Language 39

Qiao, Sanzheng and Wang, William S-Y ,1998 Evaluating Phylogenetic Trees By Matrix

Decomposition. Anthropological Sciences. 106 (1),pp1-22

Wang, William S-Y.,1994.Glottochronology,Lexicostatistics,and other Numerical Methods. Encyclopedia

Of Language and Linguistics. Pergamon Press.

-----------.1995 The Ancestry of the Chinese Language. Journal of Chinese Linguistics Monograph No.8

-----------.1995 Linguistics diversity and language relationships. In New Horizons in Chinese Linguistics.

James Huang and Audrey Li, editors. Kluwer Academic Publishers. -----------.1995 A quantitative study of Zhuang-Dong Languages,pp81-96,余霭芹、远藤光晓编《桥本万太郎纪念----中国语言学论集》,内山书店。

王士元、沈锺伟, 1992,方言关系的计量表述,中国语文。

王士元, 2000,《语言的探索 -王士元语言学论文选译》,北京语言文化大学出版社。

王士元, 2002,《王士元语言学论文集》,商务印书馆。中国社会科学院、澳大利亚国立大学, 1988 《中国语言地图集》朗文出版社。

郑锦全, 1988,汉语方言亲疏关系的计量统计,中国语文第2期。

丁邦新, 1998,《丁邦新语言学论文集》,商务印书馆。

丁邦新、孙宏开主编, 2000,《汉藏语同源词研究》(一),广西民族出版社。

吴安其, 2001,《汉藏语同源研究》,中央民族大学出版社。

马学良主编, 1991,《汉藏语概论》,北京大学出版社。

孙宏开, 1989,《原始藏缅语构拟中的一些问题-以“马”为例》,《民族语文》第2期。

孙宏开、江荻, 1999,《汉藏语言系属分类之争及其源流》,《当代语言学》第 2期。

孙宏开, 2001,《论藏缅语族中的羌语支语言》,《语言暨语言学》第 2卷第 1期,

Benedict, P.K.,1975, Austro-Thai: Language and Culture,with a Glossary of Roots.New Haven, HRAF Press.

Matisoff,J.A., 1997, Issues in the subgrouping of Tibeto-Burman in the post-Benedict Era. Paper on 30th ICSTL.

George van Driem, 2002, Tibeto-Burman replaces Indo-Chinese in the 1990s: Review of a decade of scholarship, Lingua 111(2002) 79-102

Joseph H. Greenberg,2001 The Methods and Purposes of Linguistic Genetic Classification, Language And Linguistics Volume2 Number2

戴庆厦、傅爱兰、刘菊黄, 1989,《关于我国藏缅语族的系属分类问题》,《云南民族学院学报》第 3期。

倪大白, 1995,,《汉藏语系语言的系属问题》,《中国语言学报》第 6期。

William H. Baxter, 1992, A Handbook of Old Chinese Phonology, Moutou de Gruyter, Berlin, New  York

邓晓华 , 1994, 《南方汉语中的古南岛语成分》 , 《民族语文》第 3期。

2001,《试论南中国汉人及汉语的来源》日本国立民族学博物馆调查报告 20号。瞿蔼唐、劲松,

2000,《汉藏语言研究的理论和方法》,中国藏学出版社。黄布凡主编,

1992,《藏缅语族语言词汇》,中央民族学院出版社。藏缅语语音和词汇编写组,

1991,《藏缅语语音和词汇》,中国社会科学出版社。刑公畹,

1999,《汉台语比较手册》,商务印书馆。王辅世、毛宗武,

1995《苗瑶语古音构拟》,中国社会科学出版社。梁敏、张均如,

1996,《壮侗语族概论》,中国社会科学出版社。黄行, 1999,苗瑶语方言亲疏关系的计量分析,民族语文第

3期。张光直, 1986,《考古学专题六讲》,文物出版社。

列.谢.瓦西里耶夫, 1989,《中国文明的起源问题》,文物出版社。

张增祺, 1990,《中国西南民族考古》,云南人民出版社。

王文光, 1999,《中国南方民族史》,民族出版社。

abstract

Traditional studies of the grouping of Tibetan-Burman languages have focused only on qualitative analysis of the differences among languages. Few works have investigated the genetic distances between languages quantitatively. The research reported in this paper adopts the Lexicostatistics approach to give a numerical analysis of the genetic relationships among the Tibetan-Burman languages within China. The genetic distances between languages are indicated by the branch lengths of the constructed trees, which show the clustering of the languages and their separation in hierarchies. Also, the time depths of the languages in the family are estimated and a hypothesized process of the formation of the language family given.

有关同源词的确认工作得到孙宏开、孙天心两先生的大力协助。

1本课题的研究得到香港政府“中国南方濒危语言研究”(项目批准号:9040237)和“汉语在亚洲语言中地位”( CERG #9040781)及台湾中研院“中国各民族的起源及形成过程”的专项研究基金的资助。课题由王士元教授主持并指导。本文是本课题的阶段性成果之一。课题组成员南开大学石锋教授、北京大学陈保亚教授、香港城市大学向倩先后为本课题的资料收集整理做了大量的工作。课题组成员香港城市大学柯津云小姐为本文的数据计算付出许多辛勤的劳动。藏缅语专家孙宏开教授、孙天心教授为本文的同源词识别提出很好的意见。在此一并致以深深的感谢。

编辑:仁增才郎