1.2 研究内容与研究方法

1.2.1 研究内容

本书研究采取的逻辑主线是在明确图书馆学情报学概念和范围的基础上,以1976年以来图书馆学情报学研究的发展及其现实变革历程为背景,遵循“历史主线”和“动态演化”规律,以图书馆学情报学期刊及其所载文献的数据作为基础,综合运用科学计量学方法和信息可视化技术,不仅绘制了不同类型的图书馆学情报学知识图谱,而且进行了认真解读和详细分析。

概言之,本书主要包括以下研究内容。

1.知识图谱理论

知识图谱将复杂的学科知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,使人们得以了解某个学科、研究领域、期刊、甚至某位学者在科学知识版图中所处的位置。知识图谱是一个多学科交叉的领域,它的兴起主要与科学计量学领域的共词分析法、社会学领域的社会网络分析法、物理学和系统科学领域的复杂网络研究以及计算机科学领域的信息可视化技术等理论与方法的兴起和发展密切有关。遗憾的是,国内在这方面的研究尚不够深入。本书拟在广泛调研的基础上对此展开系统研究。

本书除了对图书馆学情报学学科知识图谱的相关理论进行分析和研究之外,还对其中涉及到的多种方法以及用到的不同数据来源、可视化工具软件进行介绍和评介。

2.知识图谱方法

绘制学科知识图谱时主要用到词频分析、共词分析、共被引分析、因子分析、多维尺度分析、聚类分析、社会网络分析等方法。其中,①词频分析方法是文献计量学的传统分析方法之一,其中的词频统计、关键词分析经常被用来描述某学科领域的研究状况,进而揭示该领域的研究热点和发展轨迹。②共词分析方法是一种内容分析技术,它利用文献集中的词汇对或是名词短语共同出现的情况,来确定该文献集所代表学科中各个主题之间的关系。一般认为词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密。因此,统计一组文献的主题词之间两两在同一篇文献中出现的频率,就可以形成一个由这些词对关联所组成的共词网络,网络内节点之间的远近便可反映主题内容的亲疏关系。共词分析正是以此为原理,将文献主题词作为分析对象,利用包容系数、聚类分析等多种统计分析方法,将众多分析对象之间错综复杂的共词网状关系简化为以数值、图形等形式直观表示出来的过程。共词分析同样也可以用来分析作者合作等情况。③引文分析法。引文分析是指对大量的引文数据进行定量分析研究,即利用各种数学和统计学方法以及比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用与被引用频率等进行分析,以便揭示其数量特征和内在规律。概言之,引文分析追寻的是文献的引用和被引用之间的重要关联关系,通过找到一系列内容、主题相关的文献,就可探测某些学科观点的演化发展脉络,以及学科发展的动态轨迹、走向和演化规律。④共引分析法。共引分析是指两篇或两篇以上的文献同时被其他文献引用。共引分析最大的优势是其客观性、分类原则的科学性以及数据的有效性。共引分析还可以进一步细分为文献共引分析、期刊共引分析、作者共引分析、学科共引分析等子类型。⑤多元统计分析法。多元统计分析法是对若干(可能)相关的随机变量观测值的分析。“维度降低技术”是多元统计分析的一个重要特征,它主要包括因子分析(主成分分析)、多维尺度分析以及聚类分析。⑥社会网络分析法。社会网络分析也称为“结构分析”,并不是一个正式的理论,而是一个广义的研究社会结构的战略,起源于人类学家对复杂社群中人际关系的探讨,是对社会关系结构及其属性加以分析的一套理论和方法。在科学合作网络中,如果两位科学家共同发表了一篇合作文献,就可以界定他们之间存在着联系,能够组成一个适度规模的合作网络。例如,在本书研究中,将以发表图书馆学情报学论文的合著者作为分析对象,将他们之间的关系视为科研合作网络关系,并进行相应的社会网络分析。

3.知识图谱应用

本书以图书馆学情报学期刊及其所载文献的数据作为基础,综合运用科学计量学方法和信息可视化技术,分别绘制包括图书馆学情报学发展轨迹、理论结构、研究前沿和合作网络等在内的不同知识图谱,试图描述不同时期图书馆学情报学的学科特点。其中,①图书馆学情报学发展轨迹知识图谱。先将不同的时段论文的关键词进行规范化、标准化处理,然后运用词频分析、共词分析、多元统计分析等方法,以这些关键词之间关联关系的强弱来挖掘学科知识结构之间的亲疏程度,从而将海量的文献数据信息转换成可视化的知识图谱,客观、形象地展示出不同时期高频关键词所代表的研究热点的变迁,为考察图书馆学情报学的学科演进全景提供一个新的视角。②图书馆学情报学理论结构知识图谱。首先在中外引文数据库中下载作者的引证数据,分析图书馆学情报学高影响力作者及其影响力变化。其次,运用作者共被引分析法,绘制图书馆学情报学理论结构知识图谱,从而揭示图书馆学情报学研究领域的演进,即通过图书馆学情报学领域作者的共被引情况,分析和发现图书馆学情报学的理论结构及特点。③图书馆学情报学研究前沿知识图谱。通过对图书馆学情报学文献的参考文献进行文献同被引分析,分别利用CiteSpace、SPSS等软件来展示图书馆学情报学文献共被引的群体网络结构及其变化,科学、直观地识别学科前沿的演进路径以及学科领域的经典基础文献,从而揭示图书馆学情报学的研究前沿及其演化过程。④图书馆学情报学合作网络知识图谱。利用社会网络分析方法,对论文的作者及其所属机构进行定量分析,以可视化的知识图谱来展示图书馆学情报学的作者合作网络以及机构合作网络,不仅展现出由核心合作者和典型机构构成的图书馆学情报学合作网络的宏观结构与微观结构。

此外,本书还运用科学知识图谱的技术和方法,进行了知识图谱的专题性应用研究。

1.2.2 研究方法

在科学研究领域,研究方法是打开科学宝库的钥匙,是驶向真理彼岸的航船。

本书研究是在传统文献研究法和比较分析法的基础上,采用科学计量学方法与可视化方法相结合的知识图谱绘制方法,将定量分析结果与前人定性研究的结论进行比较,以验证结论的有效性,并结合定性分析的方法,深入诠释不同知识图谱的定量分析结果。

1.文献研究法

文献研究方法主要是指搜集、鉴别、整理文献,通过对文献的加工形成对事实的科学认识的一种方法。本书通过对已有资料进行阅读和分析,全面、系统地归纳图书馆学情报学的学科要素、历史脉络和研究方法。同样,本书归纳了知识图谱的产生背景、构建方法、可视化软件及其应用领域,这个归纳过程本身就是一种知识的再造,同时也为本书的进一步研究提供坚实的理论依据和方法基础。

2.比较分析法

比较是人类认识事物的一种基本方法。马克思和恩格斯在《德意志意识形态》中指出,比较解剖学、比较植物学、比较语言学“这些科学正是由于比较和确定了被比较对象之间的差别而获得了巨大的成就,在这些科学中比较具有普遍意义(24)”。

本书运用比较分析的方法,讨论了图书馆学情报学在不同历史阶段的发展轨迹知识图谱、主流研究领域、研究前沿和合作网络的知识图谱,分析其变迁特征,并用可视化手段展示了图书馆学情报学的学科全景,为进行科学合理的学科布局、把握重点研究方向、选择前沿课题奠定实证基础。

3.科学计量学方法

科学计量学方法是一种基于数学和统计学的著名定量分析方法。它以各种科学文献的外部特征作为研究对象,以输出量必定是量化的信息内容为主要特点,采用数学与统计方法来描述、评价和预测科学技术的现状与发展趋势。科学计量学方法研究的对象可以是一切与文献有关的媒介及其特征(例如,引文、所属学科、主题词、关键词、作者所属的机构、地区和国家等)。本书研究中应用的科学计量学方法主要包括词频分析法、共词分析法、共被引分析法等,这些方法需要与信息可视化方法进行融合,才能以人们容易辨识的知识图谱方式展现出来。

4.信息可视化方法

信息可视化方法是指将抽象数据以可视化形式表示出来,以利于进行分析数据、发现规律和决策制定,其内涵就是将数据通过图形形象直观地展现出来并且找出数据背后蕴含的信息。该方法能够实现对海量信息数据的分析和提取,并将原始数据间的复杂关系、潜在信息以及发展趋势,以图形或图像等为人们所容易辨识的方式展现出来。本书应用的信息可视化方法主要包括聚类分析、因子分析、多维尺度分析和社会网络分析,这些信息可视化方法需要进行有机的融合,才能绘制出主题研究等知识图谱。