1.6.1 扫描修图

(1)对扫描图的要求

扫描是出版社历史资源(通用提法是纸质文档)电子化的第一步,也是数字出版中电子书加工的第一步。

以某出版社为例,图书扫描图的要求如下:①图片文件命名要求按名称排序,与纸书页的顺序一致;②从封面到封底均进行扫描;③扫描图文件要求格式为TIFTIFF格式(Tag Image File Format)是Macintosh上广泛使用的图形格式,具有图形格式复杂、存贮信息多的特点,是一种比较灵活的图像格式。,其中,黑白文字要求扫描为600dpidpi(dots per inch)是指单位面积内像素的多少,也就是扫描精度。dpi越小,扫描的清晰度越低,现在我们通常讲的打印机分辨率是多少DPI,指的是“在该打印机最高分辨率模式下,每英寸所能打印的最多”理论“墨点数”。的黑白图,黑白图片扫描为300dpi的灰度图,彩色图片扫描为300dpi的彩色图;④要求图像清晰、版心居中、无明显歪斜、无污点及颜色失真现象;⑤同一本书版心及图像尺寸统一,图像完整无残缺;⑥书中插图单独提供文件,格式采用TIF或JPEGJPEG是与平台无关的一种比较常见的图画格式,以24位颜色存储单个光栅图像。JPEG支持最高级别的压缩,不过,这种压缩是有损耗的。。插图文件名要求含有所在页码的信息。

(2)扫描

将原稿拆开成单页,利用高清高速扫描仪进行原件扫描,实现原稿版式信息的电子化,也就是图像PDF文件。扫描完毕,要整体翻看扫描好的文件,确定没有扫描错误后,将原文件和扫描后文件按照合同要求的命名方式及存储结构分别放到指定的位置。对每幅图像均进行图像处理,按照生产流程规范对图像进行去脏、纠偏等图像处理,确保每一幅扫描图像的清晰、洁净。

图像PDF文件一般用于中华人民共和国成立前出版的图书及一些手迹、画册等以图片形式展示内容为主的图书。这类图书主要作为资料保管和保持原貌为主,无全文检索的需要。PDF中所使用的图片格式要求为JPEG,精度与扫描图保持一致,图像其他要求与扫描图一致。如一页中既有文字也有黑白图像的,文字部分采用黑白图,图像部分使用灰度图进行拼接。图书印刷原稿经过扫描后转换成的原版式电子化文档,如图1-4所示。

图1-4 印刷原稿扫描转换成的电子化文档

(3)修图

为了得到清晰的文档,扫描之后要进入修图工序。

对扫描图进行修图,需要采用专用软件和Photoshop软件,通过检测暗、亮度的模式确定其形状,将扫描原稿中的杂质尽可能去掉,保持内容信息显示的清晰度。这时得到的是图像文档,如图1-5所示。

图1-5 印刷原稿修图后的图像文档

(4)图像文档的作用与问题

①经过扫描、修图得到的清晰图像PDF文件,能够方便查阅、核对,同时能够方便进行数码印刷,即能够实现按需印刷(Print on Demand,POD),这是重新获得绝版、短版纸质出版物的最佳方式,也是数字出版中将内容转承到纸介质的跨媒体出版中的一种形式,有新的市场生命力。

②尽管这种文档已经可以显示阅读,但是离实际的阅读体验还存在相当的距离,最基本的阅读功能如连续打开、连续翻页、标记等,它都无法实现。因此,在整本书或者大批量的阅读时,还需要对图像文档进一步加工处理,以满足阅读体验的需要。