- 全球科学数据出版态势分析报告(2016—2020)
- 周园春等
- 5字
- 2024-03-22 20:25:12
第1章 绪论
1.1 科学数据出版的发展历史回顾
广义的科学数据出版是将科学数据实体文件及相关描述信息通过网络方式公开发布,使科学数据得以开放共享的行为与实践,它伴随着科学数据的产生而存在[10]。从出版语义的角度,科学数据出版是使科学数据获得“可溯源、可引用、质量可信、作者贡献可评价、可长期保存”等特征的活动和过程。作为一种正式的出版行为,数据出版不仅可以揭示数据科学质量和重要性,还能够为数据生产者带来声誉。数据出版同时是对数据长期保存的承诺,面向数据消费者的数据增值服务。从概念辨析的角度,数据出版与数据发表、数据发布、数据开放既关联又有区别[11]。
科学数据开放共享最早可追溯至1957—1958年间举办国际地球物理年会时所创建的World Data Center系统。该系统明确要求数据必须以“机器可读取”的格式存储,并尽可能增强数据的获取性[12]。数据开放共享实践主要是通过数据中心、数据仓储、机构知识库、数据服务网站等多种形式来发布和共享数据的。随着开放政府数据运动的推进,欧美等国家和地区及一些国际组织积极建设各种数据门户,帮助数据用户发现和利用政府数据和政府资助科研项目数据[13]。
随着科学数据开放共享的发展,学术界对科学数据出版的关注也不断深入。2010年,国际科技数据委员会(Committee on Data for Science and Technology, CODATA)在其年会上提出了“数据出版”(Data Publishing)的概念。2011年,国际科学理事会世界数据系统(World Data System, WDS)举办了“数据出版”主题讨论[10]。
早期,科学数据出版更多是期刊机构在发表论文时为了防止科研数据造假,保证学术论文结论与数据的可再现性及数据被复用[14],要求作者将相关数据以附件形式进行出版。例如,Science、Nature、BMC等诸多学术期刊及出版社均对科研数据的存储及传播规定明确政策,要求作者在发表论文时按照期刊的数据要求提交科研数据,并将共享原始数据集作为论文发表的条件之一[15]。
随着科技的飞速发展,科学数据在数据密集型科研范式的科研活动中已成为越来越重要的支撑要素,科学数据出版也日渐由期刊出版商驱动的以附件形式发表的传统科学数据出版拓展到科研领域众多主体协同合作、共同推动的数据论文发表的科学数据出版方式,并成为促进科学数据共享的有效途径之一,受到数据共享领域和出版界的高度重视。这种科学数据出版是对“数据及其信息”进行“出版”,由“提交数据、存储数据、质量评审、发表数据信息,以及对数据引用和评价”等关键环节构成基本的数据出版体系[14]。
尤其是21世纪以来,各类数据存储库和数据共享平台不断发展,不仅可以直接发布数据,作为传统期刊附件材料的存储依托,还陆续出现了专门出版数据论文的新型数据期刊,如Earth System Science Data、Biodiversity Data Journal、Scientific Data等[10]。此外,从时间及数量规模上看,独立数据出版历史悠久,已经形成庞大的出版规模。数据论文出版的出现时间较短,在年度出版数量上虽然增加迅速,但是从规模上看仍然处于初期发展阶段[16]。