dspace经验谈.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《dspace经验谈.doc》由会员分享,可在线阅读,更多相关《dspace经验谈.doc(16页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、Dspace系统文档(选译)糊涂小三一、 简介 Dspace是一个开软软见平台,它具有如下功能: 通过使用工作流提交模块或者一系列的规范获取接口获取和表述数字资源。 使用搜索系统和检索,通过网络的方式发布机构所拥有的数字资产。 长期保存数字资产。Dspace系统文档对系统功能作了一个整体的描述。它对Dspace系统进行了一个良好的性能描述,为非技术人员学习使用Dspace系统是一个良好的导向。在阅读整个系统文档之前,读者应该首先阅读这一部分内容,因为该部分内容包括许多后续文档中用到的术语。对于需要运行Dspace系统的用户来说,文档提供了安装指南,以及如何配置系统以及介绍系统目录结构的相关内容
2、。注意:自从Dspace1.2版本之后,系统就提供了有关用户接口管理的在线帮助手册。 最后,为了那些Dspace系统爱好者能更好的了解Dspace系统如何工作,为了使使用者能根据具体应用对Dspace系统进行修改使用,文档中提供了Dspace详细系统架构和设计部分的内容。Dspace系统文档还提供了如下一些有用的信息。 Dspace Public API Javadocs Dspace Wiki:A list of DSpace resources FAQ: Technical FAQ Projects: A list of projects using DSpace Guidelines:
3、Guidelines for contributing back to DSpace 二、 Dspace功能介绍1Data Model(数据模型)Dspace系统中数据组织方式能很好地反映一个组织的结构。每个Dspace站点被分成若干个Communities,每个community对应一个实验室、研究中心、或者部门。Communities由Collections组成,这些Collections将相关的内容(数字资产)分组。一个Collection可能同时出现在几个不同的Communities中。一个Collection由多个item组成。2. Metadata(元数据)一般来说,Dspace系
4、统支持三种类型的元数据(1) Descriptive metadata(描述元数据)每一个条目(item)包含一个规范的DC元数据记录。MIT实验室使用的元素和限定词集合是一个Dspace源代码默认的配置。另外的关于条目(item)的描述元数据存在于一系列的Bitstream中。Communities和Collections也包含一些简单的描述元数据,这些元数据存储于DBMS中。(2) Aministrative Metadata(管理元数据)管理元数据包括保存元数据(preservation metadata)、起源数据(provenance)以及授权政策数据(authorization p
5、olicy)。大部分数据于Dspace的关系数据库管理系统模式中。起源元数据(provenance metadata)存储于DC元数据记录中。此外,其他的管理元数据被复制到DC元数据记录中以便Dspace系统访问者能够轻松实现数据访问。(3) Structural Metadata(结构元数据结构元数据包含如下信息:条目(item)描述信息、条目内部的字节流(bitstream)描述信息、条目各组成部分之间的关系信息(对最终用户而言)。例如:假定一篇论文由若干TIFF格式的图片构成,每一张图片表示论文的一页;那么,结构元数据将包含如下信息:每一个图片由一个单独的页面构成;每个页面或者图片在论文
6、中的位置。 3Eperson(电子用户)Dspace电子用户的功能:控制资料提交、系统管理权限等。Dspace系统中,每个e-person由如下信息构成:E-mail地址、姓名、是否允许用户通过WebUI登陆系统、用户密码、是否是用户自己注册、network ID等。 4Authorization(授权)Dspace授权系统与EpersonGroup和ResourcePolicy紧密联系。Dspace系统包含两个特殊的组(Groups):“administrator”(能对系统进行任何操作)和“anonymous”(包含所有用户的表列)。Assigning a policy for an ac
7、tion on an object to anonymous means giving everyone permission to do that action.对一个对象的一个操作(action)指派一个“anonymous”意味着允许系统的所有用户执行指定操作。目前,Dspace系统的Collections、Communities以及Items都是可以公开浏览的。仅仅在阅读全文内容时受到阅读权限控制。Community: ADD/REMOVE 添加/删除Community中的collections/sub-communitisCollection:ADD/REMOVE 添加/删除item
8、sDEFAULT_ITEM_READ inherited as READ by all submitted itemsDEFAULT_BITSTREAM_READ inherited as READ by bitstreams of all submitted itemsCOLLECTION_ADMIN 编辑条目(edit items)、删除条目(withdraw items)、map other items into this collectionItem:ADD/REMOVE 添加/删除条目(items)READ 浏览条目内容(view item)WRITE 修改条目内容(modify i
9、tem)BUNDLE:ADD/REMOVE 从Bundle(包)中删除字节流(bitstream)BITSTREAM:READ 浏览BitstreamWRITE 修改Bitstream 5Ingest Process and WorkflowDSpace Ingest Process InprogressInformation:该类封装了将要导入dspace数据库系统的Item的所有内容。可以通过三种方式将item导入到Dspace系统中;WebUI接口提交ItemBatch Item Importer 批量导入直接对Dspace DBMS Table 进行数据写入。该方法安全性不好,如果对D
10、space系统架构不熟悉的话,不建议使用。The Item Installer:指派一个访问日期(Accession Date)把字段“date.available”的值添加到Item的DC元数据记录中(Dublin Core Medatadata Record of Item)添加发行日期(如果元数据记录中没有)(issue date)添加provenance message(含bitstream checksums)添加items到指定的collections,同时添加合适的授权信息(authorization policies)创建新增items的浏览和检索索引 6Workflow St
11、eps(工作流步骤)一个Collection的工作流workflow 可以分为三个步骤。每一个Collection都存在一个相关的e-person group 来执行相应的步骤。如果没有e-person group与相应的步骤(step)对应,那么该步骤将被跳过(skipped)。如果一个Collection的任何步骤都没有与一个e-person group相关联,那么Collection的提交信息将被直接载入档案。换句话说(In other words),workflow的工作顺序如下:The collection receives a submission. If the collecti
12、on has a group assigned for workflow step 1, that step is invoked, and the group is notified. Otherwise, workflow step 1 is skipped. Likewise, workflow steps 2 and 3 are performed if and only if the collection has a group assigned to those steps.Submission Workflow in Dspace 7HANDLES为存储在Dspace系统中的每一
13、个Community、Collection、Item创建一个永久标识符(persistent identifier)。Dspace使用CNRI Handle System 创建标识符(identifiers)。Dspace主要使用Handles来为每一个数字对象指定一个全球唯一的标识符。每一个运行Dspace系统的站点需要从CNRI获取一个Handle Prefix。一旦用户创建CNRI指定的Handle Prefix来创建标识符,所创建的标识符就不会和全球其他的标识符产生冲突。Handles可以用两种方法来书写:hdl:1712.123/4567 8. BITSTEAM Persistent
14、 IdentifiersEach bitstream has a sequence ID, unique within an item. This sequence ID is used to create a persistent ID, of the form:dspace url/bitstream/handle/sequence ID/filename 9Dspace系统提供两种方法来存储Bitstreams。一种是将Bitstreams存储于服务器端的文件系统中;另一种是使用SRB。两种方法都通过简单而有效的API来实现。SRB是用来代替服务器端文件系统或者同服务器文件系统一同使用的
15、不二选择。无需过多的描述,SRB是一个稳定的(Robust)并久经考研的存储管理器(Storage Manager),它从根本上提供了从本地或者远程存储系统复制内容的无存储限制的直截了当的方法。 10Search and BrowseDspace允许最终用户使用多种方法发现其存储的数字资源:Handle:CNRI服务器访问检索一个或多个关键词:元数据或者全文索引浏览:使用Lucene开源软件包对title、date、author进行索引 检索(Search)是Dspace系统中重要的资源发现组件。用户对搜索引擎的要求很挑剔,Dspace搜索组件的目标是为用户提供尽可能多的搜索特性。Dspace
16、系统的索引和搜索模块由一个简单的API构成,该API可以索引新内容、重新生成索引、在全部资源、Community以及Collections上进行搜索。该API的核心组件是一个开源的Java 全文搜索引擎包Lucene。资源浏览机制是Dspace系统中又一重要的资源发现组件。浏览子系统也提供了一个有效的API,该API可以指定索引以及索引的部分内容。Dspace系统中,可以通过title、item issue date(条目发布时间)以及authors(作者)的索引来浏览相应的内容。此外,浏览的内容还可以限定在特定的Community或者Collection中。 11HTML Support在极
17、大程度上(For the most part),在不经任何修改的情况下(as-is),目前Dspace系统仅支持简单的Bitstream上传和下载。这对大多数常规的文件格式(如:PDFs、Microsoft word documents、spread sheets等)来说,是一个很不错的选择。但是,HTML 文档却要复杂得多,涉及到数字保存这里还又许多重要的问题需要解决。网页由多个文件组成:一个或者几个相互关联的HTML文件,级连样式表以及图形文件。网页通常链接到其他页面,或者包含其他页面的内容。因此,在短期内,但用户浏览某个网页时,他同时也需要浏览与该网页相关联的其他网页。通常,网页都是由网
18、络服务器动态生成的,并且反映相应数据库内容的变化。 解决以上问题是大多数文档研究的议题。目前,Dspace系统处理了这些问题的极小的一部分。Dspace系统能够存储并且在线浏览自保容的非动态的HTML文档。12OAI Support OAI 开发了一个元数据获取协议OAI-PMH,该协议允许程序(Program)从一系列数字资源库获取元数据。这样,用户就可以通过程序从一个地方获取大量的数据资源。Dspace向外提供条目的DC元数据,同时也通过OAI的set机制将Collection公开。Dspace系统使用OCLC的开放源代码软件OAICat来实现这一功能。13openURL SupportD
19、space系统以一种极其(extremely)简单的方式支持SFX的openURL 协议。如果拥有一个SFX Server,Dspace系统,通过自动使用DC元数据,将在每一个Item页面上显示一个OpenURL链接。此外,Dspace系统还能相应一个引入的(incoming)OpenURL。目前,Dspace系统已能通过openURL Support 将openURL内部的信息传递到搜索子系统。 14 15Subscriptions16History17Import and ExportDspace提供相应的批量处理工具导入和导出items,导出或者用于导入的items都按一定的目录和文件结
20、构存储于文件系统中。导入导出工具主要有如下几个:ItemImport、ItemExprot、METSExport等。 18Registration(条目注册)Registration 是一个合并条目(items),条目对应的元数据(metadata)以及Bitstreams的(alternate means)处理方法。例如:假定一个仓储系统(Repository)中存储大量的数字资产。与其使用通常的交互式数据获取过程或者批导入命令来处理这些元数据并上传相应的Bitstreams,不如使用regitration方法来注册Dspace的元数据和Bitstream的位置。Dspace系统使用可以配置
21、参数的导入工具来完成条目注册。 19Statistics(统计功能)Dspace系统中使用的有关内容的各种统计报告是由系统自动生成的。这些报告是通过分析dspace的log文件而生成的。统计信息每月清理一次。统计报告包括如下数据:A customisable general summary of activities in the archive, by default including:Number of item viewsNumber of collection visitsNumber of community visitsNumber of OAI RequestsCustomis
22、able summary of archive contentsBroken-down list of item viewingsA full break-down of all system activityUser loginsMost popular searches20Checksum Checker验证Dspace数字仓储系统中的内容是否被损坏或者篡改。 三、 Windows下安装Dspace系统1 综述:dspace1.2.2 beta 2版本与postgreSQL 8.0兼容,使得在windows下安装dspace变得比以往更加容易。随着大量的windows批处理文件的出现,Cy
23、gwin已经不再必要。 2 安装准备: (1) jsdk1.4.2及其以上版本 (2) PostgreSQL8.x windows版 (3) Aparch Ant 1.6.x (4) Jakarta Tomcat 5.x (5) Dspace 软件包(目前最新版本是dspace1.4)3 安装步骤: (1) 获取以下两个批处理文件dsrun.bat和buildpath.bat, 并置于dspace-source/bin下。 (2) 将PostgreSQL8.xjdbc.目录下的文件postgresql-8.x-yyy.jdbc2.jar 复制到dspace-source/lib目录下。 (3)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- dspace 经验谈
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内