- 汉语资源及其管理与开发
- 王世凯
- 4854字
- 2021-03-30 08:54:14
第三节 汉语资源的类型
在上一节中我们论述了汉语资源系统问题,认为汉语资源系统是由本体资源、应用资源和语言能力构成的巨系统。这个复杂的巨系统按照不同的标准,可以分成不同的类。我们尝试从空间分布、时间段限、研究角度等几个方面来考察汉语资源的类型。
一 汉语资源的空间分布
汉语资源从空间分布的角度可以分为大陆的汉语资源、港澳台的汉语资源和海外华语资源三个部分。
(一)大陆的汉语资源
大陆的汉语资源是指分布在中国内地的语言资源,主要包括汉民族共同语及所有方言。
共同语资源是活力较大的资源。现代汉民族共同语是我国的国家通用语,是国家语言资源的重要组成部分。普通话不仅是汉族的族内交际语,还是国内不同民族之间的族际交际语,同时还是联合国六种工作语言之一。
方言资源是指分布在内陆不同地区的汉语资源。一般语言学界将汉语方言按地区划分为北、吴、湘、赣、客、闽、粤等不同方言区。方言资源与共同语资源有大同但也有小异:南方方言中保留了相对更多的历史语音资源,比如入声在北方方言中基本消失,但在某些南方方言中仍有部分保留;各种方言的词汇资源中都存在一定数量的特有资源,比如各方言区都有一定数量的特征词,例如粤语的“佬”、湘语的“断黑”等;句法资源方面,各地方言也有一些特定的资源,例如湖北大冶、浠水有S-VO直-O间和S-V-O间-O直两种句法形式;在汉字方面,各地方言中也使用一些共同语中不用或不常用的字形,如“唔、嘅、佢、覅、冇”等。共同语资源与方言资源是平等共生,互相补益的,共同构成大陆的汉语资源。
(二)港澳台的汉语资源
港澳台的汉语资源是指在港澳台地区使用的汉语。香港特别行政区的汉语资源可以从文和语两方面来考察。香港在书写上除了使用英文外,还使用中文,中文也是香港的法定语文;在日常交际中除英语外还使用广东话、普通话、客家话等汉语方言。尽管在口语层面目前港人使用更多的还是英语和广东话,普通话所占的比例较小,但由于受政治生活的影响,教育局、高等院校、“语常会”等都大力开展了推广普通话的活动。可见,普通话将作为香港地区的一股新生力量发挥越来越重要的作用。普通话、广东话及其他方言都是香港地区的汉语资源,它们共同构成了香港语言生活的多维景象。
澳门地区虽小,但是语言问题并不单纯。中文是澳门华人使用的民间语文,普通话以及大部分澳门居民所讲的粤方言是人们常用的交际语言。此外,澳门是个移民城市,因此还有中国内地许多方言,如闽方言、客家方言等——这些共同构成了澳门地区的汉语资源。汉语是占澳门人口绝大多数的中国籍人使用的语言。澳门回归后,汉语的官方语言地位受到了《中华人民共和国澳门特别行政区基本法》的保障。“澳门的汉语口语主要是粤方言。粤方言使用人口占总人口的比例最大,在整个社会通行无阻,是澳门最重要的汉语方言,并被认为是澳门华人身份的象征。”[31]普通话在澳门是一种“高层语言”,多用于社交场合及一些官方场合。澳门回归后,普通话的地位明显上升。闽方言也在澳门占有重要地位,据澳门特别行政区政府统计暨普查局《人口普查》统计表明,说福建话的人数是说普通话人数的两倍多,比说其他方言的人数总和还要多。澳门汉语语言资源还牵扯到一个中文的合法化问题。澳门回归后,中文的合法化地位得以实现。
台湾地区的汉语资源也可以从语和文两方面来考察。“语”主要有国语、闽语、客家话和战后从大陆移民到台湾的大陆各地方言。台湾的“国语”,是指战后由政府推行进而在民间逐渐普遍使用的北京话。由于北京话已经在台湾独立发展了50多年,与大陆使用的普通话有些不同,但总体来说还是一致的。闽南语,俗称“福佬话”,是由于早期移民台湾的大陆居民主要来自福建省南部,因此台湾人口中闽南人占了多数,具有河洛语特征的闽南语也成为台湾的主要方言。客家话是台湾的重要方言之一。台湾的客家话主要为四县客话及海陆客话两大方言。此外,亦有使用人数较少的大埔客话、诏安客话以及饶平客话。据不完全统计,在台湾2000多万人口中,讲闽南语的人约1400多万,讲客家语的人约450万,讲汉语其他方言的人约占10%。
台湾的“文”主要是指台湾地区使用的文字。台湾使用的文字也是汉字,但主要仍使用繁体字,与大陆的简化字有所区别。但随着两岸交流与交往的不断增加,两岸这种简繁文字差别也在逐渐缩小,在台湾已有越来越多的人使用简体字,这将有利于两岸的文化交流与语言文字的统一。
(三)海外华语资源
海外使用的汉语多称华语,是世界各地华人认同的一种载体。海外华语资源主要包括以汉语普通话及其方言(通称为“华语”)为共同语的海外华人移民地区使用的汉语资源和以汉语作为外语学习的非华人区使用的汉语资源两部分。海外华语既是一种社会变体,也是一种地域变体,同时也是一种功能变体。
关于海外华语资源的分布,目前有几种不同的说法。邹嘉彦、游汝杰(2001)将分布于世界各地的华人社区划分为包括粤语社区、闽语社区、客语社区、国语社区等在内的164个“汉语方言社区”。陆俭明(2007)提出了“大华语”的概念。徐大明、王晓梅(2009)在排除地理位置以及其他非语言标准的前提下,将全球华语分为以中国大陆为内圈的多层结构,即核心华语社区、次核心华语社区和外围华语社区。“核心华语社区包括所有讲华语的成员,他们直接认同华语,就地域分布来说,大部分人口分布在中国大陆、中国台湾、新加坡、马来西亚等地;次核心华语社区包括那些虽然不讲华语,但讲汉语方言的成员,他们间接认同华语,就地域分布来说,既包括中国的方言区,也包括海外的方言社区的许多讲话人;外围华语社区包括那些虽然不会说华语或汉语方言、但是思想上却认同华语的成员,他们通常分布于海外,其中许多人愿意学习华语,计划或已经开始学习华语。”[32]在徐大明划分的社区中,去除内地之外,就是我们所指的海外华语资源的分布区域。2010年商务印书馆出版由李宇明主编的《全球华语词典》。该词典收录包括中国大陆(内地)、中国港澳、中国台湾、新加坡、马来西亚、泰国、印度尼西亚、文莱等东南亚地区,以及日本、澳大利亚、美国、加拿大等华人社区使用的华语词语。从这本词典的收词范围看,新加坡、马来西亚、泰国、印度尼西亚、文莱等东亚地区,以及日本、澳大利亚、美国、加拿大等华人分布区域都是华语资源的主要分布范围。
海外华语资源是重要的语言资源,更是一种特殊的社会资源。首先,郭熙(2006)分析了华语资源的特殊性,即华语具有共享性。“华语作为全球华人的共同语,表明汉语已经不再只是中国的,更是世界的。作为一种资源,华语属于全球华人,全球华人有权利共同开发和利用这一资源。”[33]其次,因为华语分布范围是世界性的,所以其资源价值属性更显鲜明。郭熙(2006)认为,华语资源需要及时开发利用,具有较多的增长点,如“(1)面向全球华人的规范词典;(2)海外华人社会所在国地名、人名、机构等专有名词的翻译;(3)华文水平测试标准;(4)汉字测试等级标准;(5)非核心区华语教师华语教学能力资格考试大纲;(6)职业华语考试;(7)应用文体式;(8)汉字信息处理的一体化;(9)面向全球华人的华文教学语法”。[34]这些既是华语视角语言规划的增长点,同时也是华语资源经济价值的增长点,应该给予高度重视。
二 汉语资源的时间分布
汉语是一个稳定与动态结合的系统,它自身在不断地进行着新陈代谢,处于变化和发展之中。从汉语资源在时间上的生成、存在、发展方面我们可以将其分为三类,即历史资源、现时资源与未来资源。
(一)历史资源
汉语语言资源是一个历史范畴,所以对汉语语言资源的研究可以从历时的角度进行,即分析汉语在不同历史阶段上生成或引入并消化的资源,这种资源便是汉语历史资源。
汉语是一种古老的语言,在历史的长河中它一直在变化着以适应现实的需要。因此汉语在不同的历史时期储备了相应数量的资源,这些资源在当时的历史阶段都适应了交际的需要。随着人类对外界和自身认识的不断深化,交际内容也越发丰富和复杂。总体上看,人类交际容量呈现不断扩大的趋势,与之相应,汉语也会随之发生一定的变化。稳定与变化是语言发展的两个永恒的规律,稳定的表现就是汉语会保留和使用已有的成分,也就是本书说的汉语历史资源。“虽然有些成分不是在所有历史时期都大规模或高频使用,如汉语中的历史词和文言词在现在的使用频率就非常低,但是作为资源,它们仍然是汉语资源的一部分,是继承下来的历史资源。”[35]
(二)现时资源
汉语在共时阶段上使用的资源,即汉语的现时资源。因为语言的变化性,尤其是其与社会的共变性,会使语言处于不断地新陈代谢的过程中。在这其中,词汇资源的变化性更加明显,所以现时资源更主要是从词汇资源方面体现出来。汉语在每个时期都会产生新词新语用于记录和指称新生的客观现实,这些都是当时的现时资源。这些现时的资源与社会有着密切的联系,一般都可以在新词新语的背后直接找到某一具体的社会生活事件。社会变迁越迅速,新词新语的产生就越频繁。有的新词新语会随着广泛运用而进入全民常用词汇系统,成为词汇系统中的一名新成员,有的则因为不再被人们所关注而逐渐消亡。这些现时的新词新语有的是整个词形都是新的,有的是旧词新义,有的则是旧义新用。总之,只要一个新的词语形式或是旧有的词语表达了新的意义,就可以算作新词语。新词新语是一种重要的现时资源,也是现代汉语词汇资源的重要来源。
(三)未来资源
汉语在未来生成或从其他语言借用的资源,即未来的汉语资源。事物永远都是发展变化的,语言也不例外。在全球一体化的大趋势下,语言的接触和融合是不可避免要发生的。汉语也必将会从其他语言中吸收有用的成分为自己服务,即必然要借用其他语言的部分资源。
总之,汉语历史资源、现时资源和未来资源因语言的继承性会有部分重合或交叉,不是泾渭分明的。昨日的历史资源可能成为今日的现时资源,而今日的现时资源也必将成为明日的历史资源。
三 从研究角度进行分类
从研究角度考察汉语资源,可以将汉语资源分为备用型资源和使用型资源两个部分。
(一)使用型汉语资源
狭义地讲,使用型汉语资源是指供研究使用的各种语料库或其他资源,如语音库、词汇库、语义库、语法库等,都可以提供给研究者使用。目前使用型汉语资源的建设已经取得了很大的进展。北京大学中国语言学研究中心开发了“CCL语料库检索系统”,提供古代汉语、现代汉语和汉英对照检索;教育部语言文字应用研究所计算语言学研究室开发了“语料库在线”,提供古代汉语检索、现代汉语检索和字词典检索;台湾“中央研究院”计算机中心开发了“瀚典全文检索系统”,语言所开发了“近代汉语标记语料库”。这类语料库还有很多,如清华大学的“汉语均衡语料库”、“台湾南岛语典藏”、“闽南语典藏”、“汉籍电子文献”,香港城市大学的“LIVAC共时语料库”,浙江师范大学的“历史文献语料库”,中国科学院计算所的“双语语料库”、“中文语言资源联盟”等。除了这些专业的语料库外,目前还有其他高校开发的小型语料库,以及人民网等提供的语料库资源。
这些语料库的建设为汉语研究提供了宝贵的资源,已经是可以直接应用的资源,我们把这部分语言副产品称为使用型汉语资源。
(二)备用型汉语资源
备用型汉语资源是指可以进入供研究之用的语料库,但还没有建立并进入语料库的资源。我国语言资源十分丰富,但由于语言资源情况比较复杂,有许多语言资源特别是方言资源还没有调查清楚,甚至还有些方言没有进入我们的研究视野。这些语言资源有待于进一步考察,可以看做备用型的汉语资源。
关于备用型汉语资源的研究已经引起了学界和官方的关注。目前我国已经为多个地区立项进行普通话(含地方普通话)或方言(包括语音、词汇、语法)语料库的建设。例如2001—2003年国家863高技术规划项目支持“四大方言区的地方普通话语料库(中文平台总体技术研究与基础数据库建设)”研究,2004—2006年国家863高技术规划项目支持“六个方言点地方普通话语料库(中文平台评价技术研究与基础数据库建设)”研究,2010年国家社科基金重点资助“汉语方言俗语语料库建设研究”项目。这些项目的实施已经完成或将要完成备用资源向使用资源的转化,将对汉语研究起到积极的作用。