研究报告 | 图书馆系统 2020 愿景:设立“超级扫描中心”可省23的数字化制作成本

发布时间:2017-07-04      阅读次数:678

        如今人们通过在线渠道获取信息,而这些信息往往被营利性平台过滤。一本书如果不能在线阅读,那么看起来就跟从来没出现过似的。然而,大量的现代知识仍然只出现在印刷品上,并保存在图书馆中。因为经费缺乏、电子图书的限制等,图书馆尚未能满足数字化的需求。
        目前已经拥有技术和法律框架,可以实现图书馆系统在2020年前的变革。互联网档案(Internet Archive)是一个与图书馆合作伙伴共同工作的项目,它提出了将上百万的书籍转为在线版本的方案,以采购或数字化的方式,从那些在图书馆和教室中最广泛拥有和使用的图书开始。
       我们的愿景包括:数字图书的大规模流通,让拥有实体著作的图书馆用可借阅的数字化副本来取代它们。到2020年,可以建立一个协作的数字图书馆收藏和流通系统。其中,数以千计的图书馆可以为下一代学习者解除模拟藏书的限制,使他们能免费、长期、公开地获得知识。
        协作建造一个数字化的图书收藏
        建造一个包含1000万本图书的协作的数字化藏书,将要求图书馆和其他合作者有效地执行下列职能:协调藏品开发,以避免重复劳动;提供本地的和基于云的访问;提供分布式的保存。更广泛地,这些收藏的建设需要有图书馆管理者或者管理途径来选择最有用的书,然后通过流程确定哪些书籍已经被数字化了。还要有机构和供应商能够为那些遗失的实体版本提供来源,以进行数字化。参与其中的组织要能够为这些职能提供经费和人员支持,无论是基于自身内部经费,还是慈善来源。或者,可以从一些已有经费保障的项目开始,那样它们将有助于塑造整个系统的其他部分。
        对图书进行优先级分类仍然是个未决问题。一个方式是将藏书分组,其中一组是K-16学习者广泛使用的核心图书,还有若干组与重要主题相关的藏书。互联网档案项目可以集中精力来获取和扫描大概100万到200万卷的核心图书;专业背景较强的合作图书馆,可以开发和扫描基于主题的藏书。例如,工程类学校可以在工程方面的图书上努力,而法学院则可以聚焦法律类图书。
        必须继续与谷歌图书、HathiTrust和亚马逊合作,以探索出更多协同一致的领域。没有图书馆愿意把资源浪费在对一组文本进行多次数字化上。如果这些大规模的数字化者能够愿意为合作努力做出贡献,是有利于公共利益的。
        同时还要研究哪些书籍在版权保护期之外,同时要对所有已经数字化的著作建立一个全面的列表。这些都是支持我们工作的重要研究领域。
        不同等级的使用
        当建立起核心收藏后,每所图书馆就可以自行决定提供现代作品的方法。有些图书馆也许从对盲人和阅读障碍者提供全面的使用作为起步,例如多伦多大学正在通过安大略大学图书馆理事会和无障碍内容电子门户这样做。其他的如加利福尼亚大学等图书馆希望创建一个保存用副本。
        有些例如HathiTrust 也许将为非破坏性研究者的使用提供数据集。在这个将20世纪的书籍变为在线的整个方式中,使用模式的灵活性可能是一个重要的强项,不同国家的不同图书馆可以根据环境允许情况而扮演不同的角色。
         通过对采购的和数字化的电子图书提供借阅,图书馆能够向前迈进一大步。互联网档案的数字化电子图书借阅项目反映了传统的图书馆实践,每位读者一次可以借阅一本书,然后其他人必须要等待这本书被手工归还,或者两周以后这本书将被自动归还,然后提供给下一个正在等待的读者。这种技术保护机制确保图书每次只为一位读者使用,与出版商用于保护正在发行的电子图书的技术是一样的。
        通过这种方式,开放图书馆网站表示了对版权问题的尊重,而且能够利用图书出版商们的经验和工具。加利福尼亚图书馆联盟设置了自有的借阅服务器,并且通过自有的基础设施将采购的和数字化的图书开放给所有的加利福尼亚居民。
        我们了解到,中国教育部同样将其拥有的图书每次借阅给一位中国主要大学中的读者。不同国家的不同组织对使用图书的各种方法进行尝试,以平衡便捷和版权问题,都能学到东西并从中受益。
         如何流通数字化的电子图书呢?
         有些图书馆将链接集成到图书目录中,这样数字版本和实体副本的信息将会在同一个记录中展现。图书馆也可以将链接总是指向互联网档案开放图书馆的副本,然而,如果这是一本现代图书,那么可能整个世界范围内只能有一个可用的副本。
        图书馆也可以保存自有的数字化副本,并且管理自有的借阅系统,就像Califa正在做的那样。这样,实际上每个图书馆都可以选择不同的方法来为收藏的实体图书提供数字化版本的借阅。这样可以在对本地图书馆保持控制,同时享受到由其他人维护和更新的云端系统的便捷。
        在目录中开启电子图书的链接可以非常容易,因为现在很多图书馆将图书目录放置于主要目录提供商的云服务上。说服这些提供商与整个社群合作,就能够使得像打开数字化开关那样向上百万的用户传递电子图书。
        分布式保存
        既然我们努力奋斗于建立一个当今的亚历山大图书馆,就应当避免上一个亚历山大图书馆的命运——被焚毁。如果它当时对每一个著作都建立一个副本,然后存放到印度或者中国,那么我们现在就能拥有亚里士多德的完整的著作以及欧里庇得斯的那些失传的戏剧。
        我们的社区应当为这些采购的和数字化的图书保存多个副本。当很多图书馆满足于在云端服务器上使用藏书时,也要允许和鼓励一些图书馆在本地保存数字版本的图书。
        幸运的是,数字化的图书都足够紧凑,对于图书馆而言,保存它们是经济上可以接受的。即便是高分辨率的图像和衍生的各种格式的数字化图书,大小通常也就是500兆字节,100万本图书也就是500太字节。
        对采购的电子书和数字化图书进行分布式保存,可以帮助确保图书馆中这些珍贵材料的长久性。
        互联网档案项目的经费和技术
        互联网档案项目已经获得了新的资金保障来建立“超级扫描中心”,从而实现大规模的上百万图书的数字化并显著地节约成本。设置在亚洲的第一个超级扫描中心正在进行验证性的生产,对于那些有意愿通过退出流通几个月就能够实现大规模图书扫描的合作者而言,互联网档案项目可以为它们节约50%~60%的成本。我们正与一个大学的大型研究型图书馆洽谈制定计划,将50万本现代书籍通过互联网档案的超级扫描中心来进行数字化。
         这个项目为该图书馆提供了藏书管理的新选项,实现对那些已经迁移到馆外存储地的图书的数字化的使用机制。图书馆员们将会发现,降低成本的大规模数字化,将会成为藏书管理的强有力的工具。
        过去的几年中,互联网档案项目已经建成了图书馆内的图书扫描系统,集成了重复检测目录、查找数字化和集成化传递的功能。
        如果一些组织希望检查全部藏书,找出那些既没有被他们也没有被别人数字化过的内容,并且将这些文本进行数字化,这一系统将是非常有用的。同时他们也能在互联网档案项目中获取他们所有图书的数字版本。这些图书基本上是在图书馆数字化的。
        同时,我们也获得了给互联网档案项目的资金捐赠承诺,用来数字化上百万的图书和其他资料。通过这个计划,基于图书馆长团队的推荐,同时考虑OCLC和开放课程表项目等编辑的列表,互联网档案项目将寻求获得和数字化一个核心的图书收藏。这笔资金也为其他组织提供了一个选项,他们可以将适当的实体图书捐赠给互联网档案项目,然后获得一个数字化的副本作为回报,不需要付任何的费用。
        通过这些方式,图书馆可以选择扫描持有藏书的最适合的办法。我们现在提供的选项包括桌面顶级扫描(Table TopScribe),即机构采购硬件设施和利用自有人员进行扫描,如图2所示;或者利用设在机构中的区域中心,例如波士顿公共图书馆、多伦多大学、普林斯顿神学院和国会图书馆等。我们在亚洲超级扫描中心提供更便宜的价格来进行大规模的数字化,并对一些捐赠给互联网档案的适当的材料进行免费数字化。
        我们提供这么多扫描选项的目的,是为了鼓励每个图书馆都能找到一种适合他们的模式来参与到这个协作收藏的建设中来。
        数字化的成本
        在互联网档案项目中,数字化的成本从每本书10美元到30美元不等,取决于扫描在哪里进行,离岸的还是图书馆中的。额外的成本,包括使用、存储和数字化档案的全生命周期管理,将来有可能成为主要成本。
目前的印刷版书籍经常会有电子图书格式,但是非常少有出版商愿意同意图书馆采购与实体书版权许可类似的电子图书。如果我们协调采购行动,那么图书出版商就有希望接受向图书馆销售电子图书,正如音乐出版商接受或者被迫接受将mp3销售给提供更广泛使用的服务一样。
        财务稳定性
        迄今为止,几乎没有讨论涉及资金开销和对系统的维护和增长提供支持财务模型。如果图书馆分担数字化的负担,并且共享结果,那么某些人就有动力来“搭便车”,等待其他的图书馆将图书数字化和提供服务。
如果要打击这种行为,这些没有对数字化和后台服务做出贡献的图书馆就要为数字化的图书的使用而付费。而且,也可以对想要保存本地副本的图书馆收取一笔一次性的传送费用。我们还要对财务模式进行深入思考,以避免鼓励支配性系统的形成而限制了创新。
        在建设协同的数字化图书馆收藏和流通系统过程中,组织中的每个成员都有其角色。互联网档案项目已经做好准备,要在扫描技术后台基础设施,以及服务于K-16学生的核心图书的数字化的慈善性经费保障等方面做出贡献。
        如今的学习者都是在线寻求知识的,因此我们必须要能够使图书馆顾客通过移动设备、网页搜索和浏览在线的图书馆目录来借阅电子图书。通过成千上万的图书馆的共同协作,可以为下一代学习者除模拟藏书的限制,使得对目前超出可及范围的上百万本图书进行数字化访问成为可能。这个中心目标,即为了让将来的学生能够不受物理限制地使用所有图书,将在2020年成为现实。

[原文出处]  http://www.sohu.com/a/153283464_278960
[作    者]   清华大学信息化工作办公室陈强译
[单    位]  中国教育网络
[编    辑]  湖南省高校数字图书馆

声明:本栏目大多信息来源于网友推荐。如果作者或其他版权所有人认为违反了您的权益,请告知我们,我们会在24小时内删除。