前言

学习者语料库是国内语料库语言学研究的一个重要内容,从建设初期就达到了国际同类研究的领先水平。1990年,比利时新鲁汶大学的S. Granger教授发表了世界上第一个大型学习者语料库ICLE,时隔不久,中国也建成了首个大型的学习者英语语料库,即CLEC,之后又相继建设了一批各具特色的学习者语料库,并触发了大量的相关研究。国内学习者语料库研究的蓬勃发展,一方面得益于我国语料库语言学研究前辈们敏锐的学术洞察力,另一方面也得益于我国拥有庞大的外语学习群体。从建设CLEC到今天,学习者语料库研究风雨兼程二十载,经历了从最初的萌芽到后来的发展壮大,也曾遭遇过瓶颈期。目前,学习者语料库研究需要创新,机遇与挑战并存。但作为一种重要的语言研究以及语言教学研究资源,学习者语料库在未来一定会继续发挥其重要作用。

笔者长期从事学习者语料库研究,直接参与了CLEC与COLSEC的开发建设,并基于这些语料库,开展了一系列理论探索与实证性研究。把这些研究整理汇总成论文集的初衷,一方面是为了重新审视这些研究,根据相关最新文献对研究进行补充与完善,并增加一些新的研究话题,另一方面,把这些原本相对独立的研究按照主题汇集起来,可以更加系统全面地了解我国学习者的英语水平和语言特征,并探讨我国学习者语料库研究的现状、问题以及未来发展方向,为从事相关研究的人员提供有价值的参考信息。

该论文集包括上篇、中篇、下篇三大部分。上篇关于国内学习者语料库研究概况,共分两章。第1章综述了国内语料库语言学近四十年的成长历史,分别考察了语料库语言学在外语教学、二语习得、翻译、普通语言、自然语言处理等相关领域的应用。第2章则聚焦于国内学习者语料库研究的现状以及未来发展的趋势。通过梳理文献,归纳出在学习者语料库研究中出现的新特点,如增加跨学科的研究视角、引介新的语言学理论、注重口语语料库研究等,并在此基础上提出一些新的议题,如开发教学语料库、建设学习者专门用途英语语料库、从短语学视角分析学习者语言等。中篇主要基于CLEC和COLSEC,采用数据驱动的方法,从多个维度系统分析中国学习者的英语特征,共有九章。前三章基于CLEC,从语义序列、配价型式、搭配配价的视角集中分析了中国学习者的英语笔语特征,后面六章基于COLSEC,从词汇覆盖率、词汇知识、口语中的预制性语块、话语标记语、反馈语、打断等角度,深入细致地分析了中国学习者的英语口语特征。下篇主要探讨学习者语料库在外语教学中的应用,共有三章,分别介绍了数据驱动学习的理念和方法、学习者语料库在外语教学中的应用途径、如何将配价型式和搭配配价应用于外语教学。后记针对语料库语言学在发展过程中出现的一些不同声音和思潮展开深入探讨,从三个方面阐释了语料库语言学在变化中应有的坚守。

学习者语料库为研究学习者语言和外语教学提供了极其重要的数据资源,本书从不同视角对学习者语料库展开理论探讨和实证分析,但仍难免挂一漏万,尚祈学界贤达指正。


甄凤超

2019年8月