开放书目原则
李恺 编译
1 引言
书目数据的生产者,例如图书馆、出版商、大学、学者或者社会化参考工具的管理社区,在支持人类知识的发展上起着重要的作用。对于要从书目工作中受益的社会来讲,书目数据的开放势在必行。也就是说,书目数据要能够让所有人出于任何目的进行使用且可重复使用。
2 书目数据
为了定义本原则的范围,我们首先需要解释书目数据的隐含概念。
核心数据
书目描述由书目数据构成,而一个书目资源(文章、专著等,既包括印刷资源,也包括电子资源)则是由书目描述进行描述。其目的包括:
1、识别被描述的资源,也就是在所有书目资源组成的环境中,指向一个独一无二的资源;
2、定位被描述的资源,也就是指明如何以及在哪里能够找到被描述的资源。
传统意义上,书目描述同时具有上述两个作用。它包含了如下的信息:作者和编者、题名、出版者、出版时间和地点、大作品的识别(比如期刊)以及页码信息。
在网络环境中,为了识别资源而使用了统一资源标识符(Uniform Resource Identifiers, URI),比如URN或者DOI等等。而定位则通过统一资源定位符(Uniform Resource Locators, URL)的HTTP-URI方式来实现。因此,书目资源的所有URI都包含在书目数据这个狭义概念内。
次要数据
书目描述可能会包含属于书目数据范畴的其他信息,比如非网络识别符(ISBN、LCCN或OCLC号等)、版权声明、管理数据或者其他信息(附录中列举了相关次要书目数据)。这些数据可能由图书馆、出版商、学者、爱书人的网络社区或者社会化参考文献管理系统等生产。
此外,图书馆和其他相关机构还为书目描述制作了受控词表,比如名称和主题的规范文档、分类法等等,这些也属于书目数据。
3 四原则
正式地,我们推荐所有人采用并且遵照以下四个原则:
原则一:出版商出版书目数据或者书目数据集时应附上清楚而明确的声明,表明出版商对于单个书目描述、整个数据集以及这个集合中的子集的复用和重新编制的希望和期待。此声明应当采用准确、不可撤销或者是基于适当法律的免责声明或者许可证。
即:出版书目数据时,给出明确而且涵盖广泛情况的许可声明。
原则二:许多被广泛认可的许可声明并非为书目数据或者书目数据集而专门设计,也并不适用于开放书目的情况。在开放知识定义网站(http://opendefinition.org/licenses/#Data)中描述了许多为数据而专门设计的且适用的免责声明和许可。创用共享许可(除CC0外)、GFLD、GPL、BSD等则不适用于数据,我们也强烈的建议您不要使用这些许可。
即:使用被认可的适用于数据的免责声明或许可。
原则三:我们强烈建议勿在许可声明要求禁止特定用途或者特定人和机构的使用,从而限制商业重用、或者限制生产衍生作品。这类许可声明不利于有效整合和重新编制元素集。阻碍商业服务为书目数据增值的行为,不易于支持数据保存的商业活动开展。
即:如果希望数据被其他人有效的使用和增值,那么它就应当是开放的,且使用“开放知识定义”所规定的许可——尤其不应使用非商业性限制条款和其他限制性条款。
原则四:建议书目数据或者书目数据集、尤其是受到公共资助的部分,应当通过使用“公共领域声明与许可”(Public Domain Dedication and Licence)或“创作共享零权力声明”(Creative Commons Zero Waiver)将其明确置于公共领域。从而最大程度上推动数据的重用,并与公共资助的文化遗产部门内的共享文化保持一致。
即:尽可能通过PDDL或者CC0明确将书目数据置于公共领域中。
4 附录
以下为一份不完整的书目数据列表。
核心数据:作者和编者的名称和识别符、题名、出版者信息、出版时间和出版地、大作品的识别符(比如,期刊)、页码信息、URI。
次要数据:作品的格式、非网络的识别符(ISBN、LCCN或者OCLC号等)、作品的版权说明、赞助信息、载体类型信息、尺寸信息、管理数据(最后一次修改等)、相关链接(指向Amazon、Wikipedia和Google Books等的链接)、目次表、指向作品数字化部分的链接(包括目次表、参考文献等)、作者的地址和其他联系方式、封面、摘要、评论、概要、主题、关键词、分类、用户生成的标签、复本数据(复本量、索取号等)。
编译自:Open Bibliography Principles. http://openbiblio.net/principles/. [2011-10-29]
(徐静校对)
