按需数字化与数字图书馆服务原载于《图书情报工作》2013年第16期。

刘军 毛一国

[摘要]指出按需数字化是数字图书馆服务的发展方向之一;阐述按需数字化的概念、背景及需求,从版权问题、操作模式、扫描质量与后期处理、存储与传递、运转周期和费用等方面介绍国外图书馆按需数字化服务的概况及其对我国图书馆开展按需数字化服务的启示,以供国内图书馆借鉴。

[关键词]按需数字化 扫描与传递 数字图书馆 按需服务

1 引言

近年来,随着网络与信息技术的发展,教学科研对图书馆传统馆藏数字化的需求越来越多,图书馆也正努力通过大规模的数字化项目来满足这一需求,按需数字化则是图书馆为应对数字化信息需求提供的新兴按需服务之一,如欧洲建立了一个由若干国家图书馆、大学图书馆和州图书馆组成的泛欧公共领域图书按需数字化服务网络[1]。北美一些大学图书馆和公共图书馆开展了“扫描与传递”等的类似服务。OCLC的报告显示“传递数字化内容已成为图书馆和档案馆的核心功能之一”[2]。本文通过阐述按需数字化的概念、背景及需求,分析按需数字化服务中出现的版权问题、操作模式问题等,旨在对国内图书馆建设数字图书馆,开展按需数字化服务提供借鉴。

2 按需数字化的概念、背景及需求

2.1 按需数字化的概念

数字图书馆中数字化服务即图书文献资料的数字化,是指将馆藏的印刷本图书、报纸、缩微胶片、磁带等通过扫描、拍照、转录等技术手段转为数字形式,并以网络为媒介提供给读者使用。按需数字化则是图书馆数字化服务的一种方式,即由读者提出数字化内容的需求申请,图书馆给以响应,在适当时间内将符合条件的印刷本图书的全部内容或部分章节数字化,并提供网络传递服务[3]。通过馆藏文献资源的数字化,可实现馆藏“长尾效应”。

2.2 按需数字化的背景及需求

2.2.1 按需数字化是在数字化项目背景下展开的

当前我国的大学数字图书馆国际合作计划(China Academic Digital Associative Library,简称CADAL)二期已经完成250万册/件数字资源[4], Google图书搜索项目通过与图书馆和出版社合作,到2013年4月已经扫描了3000万册图书[5]。这些项目为按需数字化积累了丰富的实践经验,同时我们也应看到,一些读者急需的馆藏仍然未被数字化,未能得到有效利用。

在人类丰富的历史文化遗产中,存世的藏品太多,如据估计欧洲,1500—1800年间有100万册图书,1800-1900年间有500万册图书,20世纪有2000万册图书[6],21世纪是“信息爆炸”时代,新的文献资料呈爆炸性增长。新的文献资料转为数字化较易或者本身就已是数字化状态,但旧的文献资料通常被置于密集库或者远程存储图书馆中,较难获取。

同时需要数字化的对象太广,除图书馆的馆藏外,档案馆、标本馆、博物馆等机构的馆藏也需要数字化。

2.2.2 按需数字化来源于读者的实际需要

随着数字化项目的大规模实施,图书馆传统馆藏资源数字化蓬勃发展,假以时日,必然能实现图书馆传统馆藏完全数字化的目标,但面对巨大数量的馆藏和众多的对象,安排数字化优先权并不容易,现实中读者需要的文献资源却可能没有及时数字化,按需数字化则是根据读者的需求,由读者来决定哪本图书需要优先数字化。

放在密集库或者远程存储图书馆中的图书,通常需要提前预约才能借阅;部分年代久远的图书,尤其是特藏,考虑到保存条件及文物价值,仅限于读者到馆阅读。按需数字化则可拓展读者服务时空,有利于提高馆藏资源使用效益。

电子书是读者信息获取的需要。在针对按需电子书需求的市场调查中[1],超过60%的被调查者基于专业兴趣/科研需要电子书,16%的则是基于收藏/特殊兴趣。另据英国剑桥大学学者调查显示[3],如果没有版权限制,91%的读者对整本图书数字化感兴趣;如果仅能提供图书部分章节的数字化内容(如一个章节),则62%的人感兴趣。

3 国外图书馆按需数字化概况

3.1 国外图书馆按需数字化的版权问题

版权问题是按需数字化之前和之后都必须考量的一个问题,本文从公共领域内的作品、版权保护期内的作品和孤儿作品三方面来讨论:

3.1.1 公共领域内的作品

以剑桥大学图书馆馆藏的评估为例[3],按照英国的版权法,大约15%-20%的馆藏属于公共领域,其中1870年之前的作品100%属于公共领域,1950年之后的作品基本不属于公共领域。在美国,1923年之前的作品和美国政府出版物属于公共领域。公共领域内的作品按需数字化没有法律障碍,可以整本数字化,但作品的物理实际保存状态,往往不利于数字化。公共领域内的作品按需数字化之后,学界认为其版权状态也应属于公共领域,只需按照“使用创作共用许可(Creative Commons usage license)”公平使用即可。

3.1.2 版权保护期内的作品

版权保护期内的作品在获得授权的情况下可以整本数字化,否则应按照各国的版权法来实施,但可以基于公平使用的原则,数字化图书的部分内容,用于文献传递等,如芝加哥大学图书馆明确规定“扫描与传递”服务只能是一本书的一个或两个章节、一本期刊/报纸一期的一篇或两篇论文,不能超过全部内容的20% [7],牛津大学波德林Bodleian图书馆还要求每次扫描不能超过50页,数字化后的文献,仅限于个人研究使用,不得与他人分享、发布、张贴。牛津大学波德林图书馆在提供“扫描与传递”服务前,即明确告知读者权利与限制[8]

3.1.3 孤儿作品

孤儿作品是指那些尚处于版权保护期内,需依法征得版权人许可才能使用,但又无法联络上其版权人的作品,也称“无主作品”。相对于年代久远的公共领域图书,孤儿作品则更具有数字化价值。但因获得授权难,文献资料数字化不易开展。欧美国家曾对此项工作进行探索,但效果不一[9]:欧盟从2008年11月开始实施“版权信息与孤儿作品登记”(Accessible Registries of Rights Information and OrphanWorks,简称ARROW)项目,取得了一定成功,到2010年6月已开始提供版权人及作品的权利信息检索识别服务。另一个案例是Google公司的“Google图书搜索和解协议”。该协议拟处理Google图书扫描项目涉及的孤儿作品,由Google公司出资创设一个独立、非营利性的图书版权登记处(Book Rights Registry),负责查找版权人,搜集和维护准确的版权人信息,并为版权人提供加入或退出该项目的途径,但2011年3月美国纽约南区法院否决了该项协议。

综上所述,目前国外图书馆按需数字化的对象主要是公共领域内的作品,可以整本图书数字化;版权保护期内的作品未获授权情况下基于公平使用原则,只能部分数字化;孤儿作品的整本数字化仍在探索中。

3.2 国外图书馆按需数字化的操作模式

OCLC在其《扫描与传递:基于用户需求的特色馆藏与档案的数字化管理》报告[2]中提出一个“基于用户需求的文献数字化工作流程”:审查-决定-扫描-传递,其中“审查”阶段包括用户提出请求、批准请求、查重、版权管理;“决定”阶段包括图书馆是否存储图像、扫描精度、元数据是否加工等;“扫描”阶段包括扫描、质量控制等;“传递”阶段包括存储、传递方法等。但在实际操作中,上述流程也可以简化,不一定要逐个步骤进行。牛津大学图书馆也制订了一个类似的详细的按需数字化工作流程[10]

在图书馆按需数字化实践中,还可分为单馆模式和中心分布式网络模式:

3.2.1 单馆模式

即指仅一个图书馆提供按需数字化服务,如哈佛大学图书馆、芝加哥大学图书馆相继开展的“扫描与传递(scan and deliver)”服务[11],杜克大学图书馆对公共领域图书提供的“数字化这本图书(digitize this book)”服务[12],威斯康星-麦迪逊大学图书馆对不再流通的绝版图书提供的“按需数字化(digitization on demand)”服务[13],密歇根大学图书馆提供的“数字化需求(request for digitization)”服务[14],纽约公共图书馆对存储馆图书开展的“电子传递(electronic delivery)”服务[15],澳大利亚国家图书馆提供的“直接复制(copies direct)”服务[16],服务对象为各图书馆的合法注册读者。

3.2.2 中心分布式网络模式

典型代表是欧洲按需电子书(eBooks on Demand,简称EOD)项目[17],该项目延续了欧盟资助的“Digitisation on Demand”项目(2006—2008年)的框架,当前由12个欧洲国家的35个图书馆组成,允许来自全世界的读者以PDF格式电子书方式订购公共领域内的图书(以1500—1900年间的图书为主),读者通过EOD搜索引擎或者图书馆在线目录,发出需求申请,需求图书被数字化后,被作为电子书传递给读者并且在数字图书馆中长久保存。EOD服务是中心分布式网络服务,成员图书馆负责处理读者需求申请,与读者及时交流并完成数字化;奥地利茵斯布鲁克大学下属的蒂罗尔大学与区域图书馆则提供中心数据库核心服务,该项服务包括订单数据管理、生成数字对象、传递给读者、电子支付和自动文本识别等。另外,Kirtas图书项目[18]与EOD项目类似,是Kirtas Technologies公司与加拿大麦克吉尔大学图书馆、纽约公共图书馆等图书馆合作提供公共领域内绝版图书的按需数字化服务,参与项目的图书馆提供图书,Kirtas技术公司提供数字化解决方案,并在网站提供付费下载和按需再版服务。

3.3 国外图书馆按需数字化的运行

按需数字化的质量、费用、存储与运转周期密切相关,扫描质量要求越高,后期处理要求越多,运转周期将越长,相应的费用也越高,读者对按需数字化的兴趣随之降低。因此,在实际操作中应及时处理好各因素的关系,在保证扫描质量同时,提供合理的收费标准和尽可能短的服务期限,提高读者的满意度和积极性。

3.3.1 扫描质量与后期处理

芝加哥大学图书馆“扫描与传递”服务提供清晰的300DPI解析度。牛津大学图书馆提供300DPI黑白PDF文档,也可以根据读者需要提供灰度/彩色扫描服务。“扫描与传递”服务基本不提供后期处理。EOD项目提供300-400DPI扫描,并完成后期的自动文本识别、数字对象生成、元数据制作等内容。

3.3.2 存储与传递

公共领域的电子书,一般提供永久保存,如EOD项目将数字化的电子书放到各自参与馆的机构知识库中永久保存,带链接的元数据可以在欧洲数字图书馆门户网站上查询。杜克大学图书馆将电子书放到Internet Archive网站上。提供“扫描与传递”服务的电子书放在各自图书馆的服务器上临时保存,且保存时间不一,如哈佛大学图书馆保存30天,牛津大学图书馆保存28天,读者可下载时间限定在14天。图书馆一般通过电子邮件方式告知读者所需文献电子版链接地址,让读者自行下载。也有图书馆如纽约公共图书馆通过邮件方式将读者所需电子文献(PDF格式)直接以附件方式发给读者。

3.3.3 运转周期与费用

剑桥大学学者调查显示,对按需数字化服务,44%的人愿意等一个星期或者更长时间,10%的人希望24小时内获得。杜克大学图书馆一周内提供所需文献。牛津大学图书馆周一至周五的24小时内提供“扫描与传递”服务[8],芝加哥大学图书馆与哈佛大学图书馆则是4个工作日。密歇根大学图书馆的“数字化需求”服务周期可能长达2-3个月。

关于文献资料按需数字化服务费用,在被调查的剑桥大学学者中66%的人愿意支付10-15英镑,35%的人愿意支付15-25英镑。EOD项目电子书的价格在不同国家、不同图书馆各不相同,平均一本电子图书订购费用为50欧元。在“扫描与传递”服务中,哈佛大学图书馆对本校读者免费提供,牛津大学图书馆则对每一次需求收取统一的4.75英镑费用,密歇根大学图书馆提供免费的“数字化需求”服务。威斯康星-麦迪逊大学图书馆则根据页数收费。EOD项目中电子书一旦生成即可永久免费下载,在Kirtas图书项目中,每本电子书需支付1.95美元下载费[18]

3.3.4 按需数字化与按需印刷(POD)相结合

调查显示[3],剑桥大学学者中有65%的人对印刷本图书同时感兴趣。EOD项目的客户调查显示了类似结果,60%的被调查者在使用电子图书中通常会打印出部分页面甚至整本图书。根据读者需要,EOD项目增加了按需再版(reprints on demand)服务,此项服务在图书馆的在线目录和亚马逊网站上提供[19]。Kirtas图书项目在网站销售中除提供数字化下载外,还提供三种印刷本的购买选项[18]:平装本另加18.05美元,精装本加28.05美元,如果加38.05美元,则在平装本外,另加下一次销售的5%提成,亦称“知识的投资(invest in knowledge)”。

4国外图书馆按需数字化服务对我国图书馆的启示

4.1 按需数字化拓展了图书馆服务渠道

国外图书馆按需数字化服务取得了不少成功经验,丰富了数字馆藏,拓展了读者文献资源获取渠道,满足了读者对传统馆藏的数字化需求,极大地提高了读者服务的效率和效益,为国内图书馆开展按需数字化服务提供了大量的实践经验,具有重要的参考价值。

4.2 按需数字化促进了馆藏文献资源的系统完整

按需数字化有利于图书馆对绝版、稀有图书的采集和对馆藏文献资源的补缺。出版年份久远、利用率高的图书,因流通损耗、收藏条件等的影响需要定期剔除补缺,图书馆可以在定期评估馆藏质量、馆藏图书损耗,分析图书流通借阅率、拒借率等统计数据的基础上,整理收集馆藏补缺书单,以图书馆联盟或独立馆的形式提交给图书供应商或图书出版商,通过按需数字化方式及时获取指定文献,完善馆藏。

4.3 按需数字化有助于图书馆开展个性化服务

按需数字化是满足读者个性化信息需求的重要发展方向。在提高读者服务质量,深化服务内涵,拓展服务外延的同时,可完善馆藏品质,提高文献资源建设效益,如在数字图书采集中,文献供应商可根据图书馆的要求,直接在指定的图书位置印上馆藏收藏标志;补缺图书还可以提供加印馆藏财产号、索书号等服务,尤其是古籍图书,按需数字化能够使它改变原有的流通收藏模式,方便读者使用,绝版图书不再“绝版”,稀有图书不再稀有,真正做到按需、即时、个性、便捷地为用户提供服务。

4.4 按需数字化可促进图书馆技术革新

按需数字化服务是以数字技术和现代网络通信技术为平台的一种新型信息服务模式,其工作步骤和工作程序均在网上实现一体化运行。当前数字图书馆建设欣欣向荣,实体图书馆和数字图书馆建设并驾齐驱,要充分利用按需数字化做好服务工作,就必须在现有的技术条件基础上,积极促进技术革新和设备的更新换代。

4.5 按需数字化可促进图书馆联盟的发展

图书馆联盟是以资源共享、利益互惠为目标的受共同认可的协议和合同制约的联合体。自20世纪70年代开始,各国在图书馆联盟建设方面进行了许多探索与实践,图书馆合作的范围也不断拓展,开展了联合回溯建库、联合储存空间、联合保存、合作发展馆藏、联合编目、合作参考咨询等工作。目前,国际图书馆联盟组织的成员已超过150个。我国图书馆联盟建设开始于20世纪90年代中后期,主要由高校图书馆、专业图书馆(以中国科学院系统为代表)和公共图书馆联盟3种类型构成,其中以高校图书馆联盟数量居多。以CALIS为代表的高校图书馆联盟不仅提供数据库联合采购、书目共享、编目合作,而且建设了联合参考咨询网。按需数字化服务不仅仅是对需要数字化的图书提供在线查询,也促进了图书馆联盟的建设与更广意义上的数字资源的合作共建共享的发展。

5 结语

按需数字化是数字图书馆服务的发展方向之一,它有助于解决图书馆现存的采购危机、资源危机、馆藏危机、读者危机等问题,在拓展馆藏文献资源采购渠道,丰富馆藏文献品种,提高馆藏品质,加强读者个性化增值服务,推进图书馆文化传播,提高读者吸引力,缓解实体图书馆在信息化数字化环境中的发展危机等方面将产生重要影响。

参考文献

[1]Silvia G.Günter M.Producing eBooks on Demand:A European library network [EB /OL]. [2013-06-06 ].http://books2ebooks.eu/sites/default/files/u2/ebooksondemand.pdf.

[2] Jennifer S.Francine S.Shannon S.Scan and deliver: Managing user-initiated digitization in special collections and archives[EB/OL].[2013-06-06].http://www.oclc.org/research/publications/library/2011/2011-05.pdf.

[3]Edmund C.Digitization-on-Demand in academic research libraries[EB /OL].[2013-06-06].http://www.dspace.cam.ac.uk/handle/1810/240492

[4]CADAL项目简介[EB /OL].[2013-06-06].http://www.cadal.cn/xmjj.

[5]Google Books [EB /OL].[2013-06-06].http://en.wikipedia.org/wiki/Google_books.

[6]Günter M.Silvia G.eBooks on demand(EOD):A European digitization service[J]. IFLA Journal,2009,35(1):35—43

[7] About scan & deliver[EB /OL].[2013-06-06].http://guides.lib.uchicago.edu/scananddeliver.

[8]Scan & deliver[EB /OL].[2013-06-06].http://www.bodleian.ox.ac.uk/using/scan-and-deliver.

[9]蹇瑞卿,于佳亮,马炳和.探寻孤儿作品版权问题的解决之道-欧洲A RROW项目的实践与启示[J].图书馆建设,2011(10):37—40

[10](Reactive)On-demand digitization service proposed work-flow[EB /OL].[2013-06-06].http://www.bodley.ox.ac.uk/scoping/ondd.pdf.

[11] Scan & deliver [EB /OL].[2013-06-06].http:///portalcs.hul.harvard.edu/libraries/scananddeliver.html.

[12]“Digitize this book”puts duke's collections at your fingertips[EB/OL].[2013-06-06].http://sites.duke.edu/digital/2013/02/25/digitize-this-book/.

[13]Digitization on demand[EB/OL].[2013-06-06].http://www.wils.wisc.edu/lend/digitdemand.html.

[14]Request for digitization service[EB /OL].[2013-06-06].http://www.lib.umich.edu/digital-library-production-service-dlps/request-digitization-service.

[15]Access to offsite collections[EB/OL].[2013-06-06].http://www.nypl.org/help/get-what-you-need/access-offsite-collectionsed.

[16]Can I get copies of items from the library? [EB/OL][2013-06-06].http://www.nla.gov.au/getting-started/copies.

[17]Collection development of digitized books on demand:Opportunities for collaboration and strategic partnerships between libraries [EB /OL].[2013-06-06].http://www.library.mcgill.ca/ifla-stthomas/papers/gstrein_2011.pdf.

[18]KirtasBooks.com[EB/OL].[2013-06-06].http://www.kirtasbooks.com/.

[19]How to order an EOD reprint? [EB /OL].[2013-06-06].http://books2ebooks.eu/en/content/how-order-eod-reprint.