文献检索与利用2.ppt
《文献检索与利用2.ppt》由会员分享,可在线阅读,更多相关《文献检索与利用2.ppt(76页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、信息存储与检索信息存储与检索刘刘 佳佳第二章第二章 网络信息检索的方法与技术网络信息检索的方法与技术 第一节第一节 网络信息检索的基本方法网络信息检索的基本方法信息检索方法的分类信息检索方法的分类1.直接法直接法 不利用检索系统(工具),直接通过原文或文献指不利用检索系统(工具),直接通过原文或文献指引来获取相关信息的方法。引来获取相关信息的方法。浏览法:直接通过浏览、查阅文献原文来获取所需浏览法:直接通过浏览、查阅文献原文来获取所需 信息的方法。信息的方法。追溯法:利用已知文献的某种指引来获取所需信息追溯法:利用已知文献的某种指引来获取所需信息 的方法。的方法。2.工具法工具法 是最常用的方
2、法,利用各种检索系统(工具)来检是最常用的方法,利用各种检索系统(工具)来检索信息。索信息。顺查法:按照时间顺序由远及近地查找信息的方顺查法:按照时间顺序由远及近地查找信息的方 法。法。倒查法:按照时间顺序由近及远地逐年查找所需倒查法:按照时间顺序由近及远地逐年查找所需 信息。信息。抽查法:根据检索需求的特点和学科发展的实际抽查法:根据检索需求的特点和学科发展的实际 情况,抽取这一段时间的文献进行检索。情况,抽取这一段时间的文献进行检索。3.综合法综合法 综合利用上述各种方法来查找信息的方法。综合利用上述各种方法来查找信息的方法。第一节第一节 网络信息检索的基本方法网络信息检索的基本方法 布尔
3、逻辑检索(布尔逻辑检索(boolean logic searching)布尔逻辑检索是多个检索项(可以是单词、词组布尔逻辑检索是多个检索项(可以是单词、词组或检索式)之间通过运用布尔逻辑算符来准确的表或检索式)之间通过运用布尔逻辑算符来准确的表达检索提问的检索技术。达检索提问的检索技术。(1)逻辑逻辑“与与”AND或或*同时含有两个检索词才能被命中同时含有两个检索词才能被命中用于交叉概念或限定关系概念之间的组配,可以缩用于交叉概念或限定关系概念之间的组配,可以缩小检索范围,提高检准率。小检索范围,提高检准率。(2)逻辑逻辑“或或”OR 或或+,或,或|表示只要含有其中一个检索词或同时含有这两个
4、检表示只要含有其中一个检索词或同时含有这两个检索词的文献都将被命中。索词的文献都将被命中。用于并列关系的概念组配,相当于增加了检索词主用于并列关系的概念组配,相当于增加了检索词主题的同义词或近义词,有助于扩大检索范围,提高题的同义词或近义词,有助于扩大检索范围,提高查全率。查全率。(3)逻辑)逻辑“非非”NOT或或-表示被检索文献在含有检索词表示被检索文献在含有检索词A而不含有检而不含有检索词索词B时才能被命中。时才能被命中。用于排斥与选择关系的组配,能够缩小命中用于排斥与选择关系的组配,能够缩小命中文献的范围,增强检索的准确性。文献的范围,增强检索的准确性。例:北京除冬季外汽车和可吸入颗粒物
5、造成的例:北京除冬季外汽车和可吸入颗粒物造成的空气污染状况空气污染状况”这一主题的检索。这一主题的检索。北京北京*空气污染空气污染*(汽车(汽车+可吸入颗粒物)可吸入颗粒物)-冬季冬季 邻近检索(邻近检索(proximity search)又称为位置限制检索,是用一些特定的算符(位置又称为位置限制检索,是用一些特定的算符(位置算符)来表达检索词与检索词之间的顺序和词间距算符)来表达检索词与检索词之间的顺序和词间距的检索。的检索。(1)()(W)在此算符两侧的检索词必须按此前后的顺序排列,在此算符两侧的检索词必须按此前后的顺序排列,顺序不能颠倒,两个检索词之间不许有其他的词或顺序不能颠倒,两个检
6、索词之间不许有其他的词或字母,但允许有空格或标点符号。字母,但允许有空格或标点符号。例:例:information(W)retrieval Information retrieval,information-retrieval(2)()(nW)在此算符两侧的检索词之间最多不超过在此算符两侧的检索词之间最多不超过n个(最大个(最大数量)实词或虚词(非用词),两个检索词的词序数量)实词或虚词(非用词),两个检索词的词序不许颠倒。不许颠倒。例例1:electronic(1W)resourceselectronic resources,electronic information resourses例
7、例2:Jilin Medical University,Jilin Agricultural University,Jilin Technology University Jilin(1W)University(3)()(N)在此算符两侧的检索词必须紧密相连,但词序可在此算符两侧的检索词必须紧密相连,但词序可颠倒。颠倒。例:例:information(N)retrieval information retrieval,retrieval information(4)()(nN)表示两个词位置可以颠倒,两个词间插入词的表示两个词位置可以颠倒,两个词间插入词的最多数目是最多数目是n个。个。例例:i
8、nformation retrieval,retrieval information retrieval of information,retrieval of law information,retrieval of Chinese law information information(3N)retrieval(5)()(F)表示在此运算符两侧的检索词必须同时出表示在此运算符两侧的检索词必须同时出现在文献记录的同一字段内。两个词的前后现在文献记录的同一字段内。两个词的前后顺序不限,夹在两个词之间的词的个数也不顺序不限,夹在两个词之间的词的个数也不限。限。(6)()(S)表示在此运算符两侧的
9、检索词只要出现在文表示在此运算符两侧的检索词只要出现在文献记录的同一子字段或同一段内,此文献即献记录的同一子字段或同一段内,此文献即被命中,两个词词序不限,两个词中间可间被命中,两个词词序不限,两个词中间可间隔若干个词。隔若干个词。(7)NOT NOT与邻接运算符组合使用,而产生相反的含义。与邻接运算符组合使用,而产生相反的含义。NOT W 表示其后的词不能紧跟其前的词表示其后的词不能紧跟其前的词 NOT N 表示两个词不能相邻表示两个词不能相邻 NOT S 表示其后的词不应出现在同一子字段中表示其后的词不应出现在同一子字段中 NOT F 表示两个词不应出现在同一字段中表示两个词不应出现在同一
10、字段中短语检索(短语检索(phrase search)用用“”表示,检索出与表示,检索出与“”内形式完全相同的短内形式完全相同的短语,以提高检索的精度和准确度,也称为语,以提高检索的精度和准确度,也称为“精确检精确检索索”(exact search)。)。George W.Washington George W.Bush spoke at Washington D.C.about human rights “George W.Washington”截词检索(截词检索(truncation/wildcats)用截词符号加在检索词的前后或中间,以检索一组用截词符号加在检索词的前后或中间,以检索一组
11、概念相关或同一词根的词,即概念相关或同一词根的词,即在检索标识中保留相在检索标识中保留相同的部分,用相应的截词符代替可变化部分。同的部分,用相应的截词符代替可变化部分。可以可以扩大检索范围,提高查全率,主要用于西文数据库扩大检索范围,提高查全率,主要用于西文数据库检索,中文数据库通常不使用。检索,中文数据库通常不使用。?代表?代表0至至1个字符个字符 *代表代表0至多个字符至多个字符(1)前截词(词首截词)前截词(词首截词)截词符在检索词的开头。截词符在检索词的开头。例:例:*ology biology,geology,physiology,sociology(2)中间截词)中间截词 wom?
12、n(3)后截词(词尾截词)后截词(词尾截词)词尾的有限截词。词尾的有限截词。“?”几个问号连在一起时,问号的几个问号连在一起时,问号的个数代表可变化的字符数的上限。个数代表可变化的字符数的上限。词尾的无限截词。词尾的无限截词。“*”允许有允许有0至任意个字符的变化。至任意个字符的变化。例:例:cat*cat,cats,catalog,catalogue,category econom*economy,economic,economics,economical,economist,economize等等字段限制检索(字段限制检索(field limiting)在信息检索过程中,为提高查全率或查准
13、率,检索在信息检索过程中,为提高查全率或查准率,检索范围限制在特定的字段中,即字段限制检索。范围限制在特定的字段中,即字段限制检索。基本索引字段(基本索引字段(basic index fields)一篇记录中主要用来表达文献内容特征的字段。一篇记录中主要用来表达文献内容特征的字段。如篇名、文摘、主题词、关键词如篇名、文摘、主题词、关键词基本索引字段的限定由基本索引字段的限定由“/”与一个基本索引字段代与一个基本索引字段代码组成,又称后缀限定。码组成,又称后缀限定。字段名字段名字段代码字段代码中译名中译名AbstractAB文摘文摘DescriptorDE叙词(主题词)叙词(主题词)Keywor
14、dKW关键词关键词TitleTI题名题名常用基本索引字段及代码表常用基本索引字段及代码表例:地震例:地震/TI辅助索引字段(辅助索引字段(additional index fields)表达文献外部特征的字段。表达文献外部特征的字段。如著者、机构名称、语种、刊名、来源、出如著者、机构名称、语种、刊名、来源、出 版年。版年。辅助检索字段由辅助字段代码和辅助检索字段由辅助字段代码和“=”组成,一般将组成,一般将辅助索引字段代码置于检索词前,称为前缀。辅助索引字段代码置于检索词前,称为前缀。字段名字段名字段代码字段代码中译名中译名Author AffiliationAA著者单位著者单位Author,
15、InventorAU著者,发明者著者,发明者Conference TitleCT会议名称会议名称Journal NameJN刊名刊名PublisherPU出版者出版者Publication YearPY出版年出版年常用辅助索引字段及其代码表常用辅助索引字段及其代码表例:例:PY=2000例例1:检索:检索“吉林大学吉林大学”姓名是姓名是“王力王力”的作者的文献。的作者的文献。AU=王力王力 AND(AA=吉林大学)吉林大学)例例2:检索:检索“2010年年”出版的关于出版的关于“人寿保险人寿保险”的资料。的资料。人寿(人寿(N)保险)保险 AND PY=2010 例例3:检索主题内容是情报的:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 检索 利用
限制150内