Advertisement

科研ABC - 文献检索

阅读量:

文献检索

  • 1 文献的定义和分类
    • 1.1 文献的定义
    • 1.2 文献的分类

文献检索类型设置

  • 3 检索基础介绍
    • 3.1 检索工具定义

    • 3.2 检索平台名词解析

    • 3.3 提问式检索方法

    • 3.4 文献检索标识标准

    • 3.5 常用检索手段分析

    • 3.6 检索关键词选择策略

    • 3.7 计算机辅助检索技术概述

      • 3.7.1 布尔逻辑检索方法
      • 3.7.2 截词、模糊、词干检索技术
      • 3.7.3 字段限制性检索方法
      • 3.7.4 位置信息辅助检索技术
      • 3.7.5 组合式词组、短语及精确性检索技术
      • 3.7.6 禁用词应用指南
    • 3.8 检索效果的技术评价指标

    • 3.9 常见检索工具

    • 3.10 文献检索流程

    • 3.11 有效筛选文献

1 文献的定义和分类

1.1 文献的定义

GB/T4894-1985定义:记录知识的一切载体;

1.2 文献的分类

1)按照载体形式 ,可以分为印刷型、缩微型、机读型和声像型;

  • 印刷型作为文献的基本保存方式,在历史上占据重要地位;其典型表现形式包括铅印、油印、胶印、石印等多种工艺;
  • 缩微型则通过感光材料记录文献内容的一种形式;它能够有效保存微小细节并提供高清晰度;
  • 计算机阅读型是现代信息存储的重要手段;通过编码技术和程序设计将传统文献转化为符号与机器语言;将其存储于磁带或磁盘等媒介中;当需要查阅时;计算机系统会根据编码指令自动输出相关信息;电子图书就是这一类型的具体应用;
  • 声像型也被称为直感型或视听型;它是以音频与视觉信息相结合的形式记录文献内容;具体实例包括唱片、录音带、录像带、科技电影以及幻灯片等多种载体;

2) 按照出版形式 ,可以分为图书、连续性出版物、特种文献;

  • 图书被归类为达到不少于48页并构成一个书目单元的文学献。
    • 连续性出版物包括:
      • 包括核心期刊的期刊,
      • 报纸,
      • 年度出版物。
    • 特种献包括:
      • 其专利献,
      • 其标准献,
      • 其学位论文,
      • 其科技报告,
      • 其会议献,
      • 其政府出版本,
      • 档案资料及其产品资料。

3)按照文献加工深度 ,可以分为零次文献、一次文献、二次文献、三次文献;

  • 零次文献 :指未经加工的手稿以及未经整理的数据原始记录等文件资料形式。它作为一次文献发挥着基础性作用;
    • 一次文献 :指以个人研究成果为基础创作而成的文字形式的技术性资料类型内容范围包括:期刊文章(专著)、研究综述(评述)、专利文件(图表)、学术会议成果汇编(报告)等;
      (其具体内容包含但不限于:
  • 书籍类资料
  • 简报或摘录类材料
  • 学术会议成果汇编
  • 学位研究成果总结
  • 专利相关技术文件
  • 政府发布类资料
  • 产品规格样本
  • 科技调研报告
  • 标准化文件
  • 档案材料)
  • 二次文献 :指通过系统整理对一次文献进行加工处理后形成的多种类型检索途径;
    • 三次文献 :指在基础研究性文献(一次文献)和专业性研究性文献(二次文献)的基础上,在深入分析其研究价值与应用前景的前提下形成的成果。

2 文献检索类型

文献信息检索的类型可以分为文献检索、数据检索、是时间锁和概念检索;

  • 文献检索:从一个文献集合中筛选出专门包含所需信息内容的文献,并通过二次文献提供一次或三次文献的获取途径。
  • 数据检索:以特定数据为对象和目的进行信息检索,并具备一定的运算处理能力。包括数据图表、物质成份、性能、图谱、市场行情以及物质物理与化学特性和设备型号规格等。
  • 事实检索:通过事物实际情况生成新的分析成果,并包含有无的数据信息以及非数据信息两部分的内容。包括事物的基本情况及其发生的时间地点和相关事实及过程。
  • 概念检索:查询特定概念的定义及其作用原理或使用范围等解释性内容,并配合相关说明资料使用。

3 检索基础

3.1 检索工具定义

人们用来存储、报道和查找文献的工具;

3.2 检索平台名词

字段(Field)

文献条目(Record):包含多个字段的文献单元,在全文数据库中,一条文献条目相当于一篇完整的文献在书目数据库中;具体来说,则是一篇文摘或题录;

文档(File) 是由多个逻辑记录组成的集合体,在数据库系统中处于核心位置,并被划分为顺向索引和反向索引。

  • 顺序排列数据表挡:作为数据库的核心部分。
    • 反向索引文档:通过从记录中提取可检字段或属性值并按特定顺序重新组织来生成。

数据资源库(Database):通过计算机处理同类信息集合以实现有序组织。其主要功能是存储与检索文献信息的电子化工具。

3.3 提问式检索

提问式检索分为简单检索、高级检索、专家检索和二次检索;

  • 单目检索 :属于单一类型的一种信息获取方式。通常只需输入一个关键词即可完成搜索;
    • 多重组合式信息获取 :通过输入多个关键词配合不同的逻辑连接词来构建查询式;一些系统也被称为复杂式信息获取或拓展式搜索;
    • 多维度信息筛选 :通过使用多个关键词配合不同的逻辑连接词来构建查询式;其核心功能与高级式信息获取相仿;
    • 基于原始搜索结果的信息拓展 :在原始搜索结果基础上可再次执行一次查询操作;该过程可以通过反复应用不断扩展或收缩最终的搜索范围。

3.4 文献检索标识

  • 文献外部特征 :作者及其所属机构(单位)、出处(期刊或出版物名称)、期刊卷期与期号(即卷号/期刊号)、页码以及发表年月和卷期编号;
    • 文献内容特征 :标题及其所属类别(学科领域)、文献与引用资料的关系;

3.5 常用检索手段

1)直接检索法 ,包括顺查法、倒查法和抽查法;

  • 顺查法:基于课题起始年份作为出发点,在依时间递进的过程中从前向后有条理地搜寻相关文献资料。此方法可全面掌握课题的发展脉络与演变历程;其特点是可以有效降低漏检的可能性(漏检概率较低),但需要投入较大的工作量。
    • 倒查法:从当前时段出发,在按照逆 chronological order进行系统性文献检索的过程中着重关注近期研究内容与成果总结。此方法的优势在于能够迅速把握住学科领域的最新动态与研究进展;其不足之处在于可能存在信息覆盖的可能性较高(即容易出现漏检现象)。
    • 抽查法:选取课题研究最为活跃的研究时期作为检索时间段

2)追溯法 :通过文章后面所列参考文献目录的线索,查找所需信息;

3)综合法 :交替使用直接检索法和追溯法;

备注1:
a)关键文献的判定标准是单位时间内被全球其他学者引用的次数。
b)对文献质量的误判是常见的误区。

  • 盲从于影响因子的高低;
  • 盲从于大众媒体的报道;

3.6 检索词的确定

这一项建议:在开展研究时, 应优先选择能够准确反映研究主题的关键词汇, 并建议查阅工具书或参考几篇相关文献以确保选词的准确性.

对一个课题而言,在检索关键词时不应仅基于现成课题名称中的提取词汇;而应对其名称进行分解、删减、替代及增补等处理步骤以确保所提取的关键词能够准确反映课题的核心内容。

3)切分

  • 定义:该方法旨在明确检索课题所涉及词汇的基本划分方式;
  • 例如,在分析"条形糖果包装机的设计"这一课题时, 我们会在词层次上对其进行最小单元切分, 即将"条形糖果包装机的设计"分解为"条形、糖果、包装机、设计"等基本要素;
  • 注意到的是, 在某些情况下, 某些词语在被拆分成多个部分后可能会导致其原有的意义被削弱或改变. 因此, 我们应当避免对像"北京大学"这样的术语进行拆解.

4) 删除

  • 定义:对过于松散且没有实际意义的连词、虚词应当进行删除;
    • 例如,在"条形糖果包装机的设计"这一表述中包含了"的"以及"设计"等词汇。与"设计"具有相同性质的词语还包括"研究"、"探讨"以及"方法"等。
    • 此外,在处理涉及逻辑联系的词语时需要注意避免使用这些词汇:例如,在分析"心脏病患者的治疗过程"时应当避免使用并列关系连接的词语。

5) 替换

  • 定义:对于表述模糊或可能导致检索误用的词汇进行替换;
    • 例如,在'绿色包装'这一概念中,'绿色'一词可以替换为'环保材料'或'可降解材料'等更加明确且不易混淆的表述。

6)补充

  • 定义:在信息处理中对近义词及其实现方式进行扩展与补充时,在数据处理过程中通过引入这些词语的变化形式能够有效降低漏检的可能性。
    • 注意:还需要识别潜在的相关检索术语(概念),例如搜索引擎结果页面通常包含大量与查询主题相关的信息。

备注2:

  • 关注关键词与标题术语以及描述性语素的区别;
    • 在关键词中注重互换用法及相近表达的选择;
    • 在检索过程中应合理选择适当层次的检索词汇;
    • 需特别注意部分数据库禁止使用特定词汇如 the、about 和 on 等。

3.7 计算机检索技术

涵盖的主要类型包括基于布尔逻辑的搜索、截词限定式的查询、有限制条件下的信息收集、依据字符位置进行筛选以及复合关键词搜索等方法;其中的具体符号设置应当参考实际应用中使用的搜索引擎规范;

3.7.1 布尔检索

布尔检索被称为使用逻辑运算符与、或、非三种运算符来表示不同概念之间的关联关系;

2)表达式:逻辑与(A AND/* B)、逻辑或(A OR/+ B)、逻辑非(A NOT/- B);

3)遵守数学运算规则:

  • 在构建逻辑表达式时,请确保每个运算符两边留有适当的空格。
  • 括号内的内容应最先被评估:(A OR B)的结果随后与C进行AND运算,并非与NOT D直接作用。
  • 请遵循以下运算顺序规则:
    • NOT运算具有最高优先度(即最先执行)
    • 其次是AND运算
    • 最后是OR运算

3.7.2 截词检索/模糊检索/词干检索

1)截词:指检索者将检索词汇在他认为合适的地方截断;

截取词匹配:指在索引标记中保留相同的关键词,并用特定的标记符替代变量部分。计算机会自动提取所有包含该关键词的文档。通常采用问号「?」或星号「*」作为标记符号。

3)截词分类
a)按截词数量分为有限截词和无限截词;

  • 有限截词 :采用“?”作为截取符号,在检索关键词的主体部分或末尾可能变动的位置放置n个“?”符号(其中n表示截取位数为0至n个字符)。例如:如stud?、如stud??、如stud???等;wom?n等类似形式。
    • 无限截词 :在检索关键词后添加一个“*”符号,在这种情况下表示该关键词允许在末尾有任意变化的字符数量。例如:如comput#等类似形式。

b)按截词位置分为前截词、中间截词、后截词和前后截词;

前缀共享:也被称为前后一致。将其放置在一系列字符的末尾以实现相同前缀但不同结尾的所有词汇的一致性处理。比如:apple, pie, are different三个单词。

  • stud? 表示与 study 相关的各种记录;
    • stud?? 表示 studio 类型的相关数据;
    • stud??? 包括 student 和 studied 等状态的详细信息;
    • comput* 涵盖了 computer 以及相关的计算技术及其应用;
    • physic* 包括 physical 学科领域的研究和技术应用情况;

中间截词 :将截词符号置于检索词的中间,代替该位置上的有限个字符。用于解决英英、美英不同拼写,不规则的检索词单复数等问题。例如:

womn, 表示woman和women等词的记录;

  • defense*, 表示defence和defense等词的记录;
    fiberboard, 表示fiberboard和fibreboard等词的记录;
    sulphur, 表示sulfur和sulphur等词的记录;

前缀符号

    • physics-related terms, encompassing physics, astrophysics, biophysics, and related fields;
    • computer-related terms, including computer, microcomputer, minicomputer, and associated technologies;

前后截词 :较少使用,前截词和后截词的结合。例如:

computer ??,
—— chemi #。

注3:被用于截词检索过程中,在一个句子同时出现两个‘*’无限截断符号时,在与‘强调文本’符号相区分的情况下,本博客中第二个无限截断符号采用‘#’代替。

3.7.3 字段限制检索

字段位置检索是一种规定在数据库记录中某一特定字段范围内包含检索词的技术。在匹配过程中仅考虑指定的字段内容,在满足条件后即可完成数据提取操作,并能显著提升搜索效率与准确性;

2)索引字段:分为基本索引子段和辅助索引子段

  • 核心分类项(basic index terms):涵盖文献内容的关键部分,包括篇名分类项、文摘分类项、叙词分类项及自由词分类项;
    • 补充分类项(additional index terms):涵盖文献相关属性的分类项。

3)常见记录字段

  • 存取号字段(AN,Access Number) :是计算机检索系统为每个数据库的每篇记录规定的能被计算机识别的特定号码。在同一数据库中,每篇文献记录只有一个存取号;
  • 篇(题)名字段(Title Field,/TI)
  • 文摘字段(Abstract Field,/AB)
  • 叙词字段或受控词字段(Destriptor Field,/DE或Controlled term Field-SU) ,这一字段是标引人员给文献标引的反映其主题概念的词,这些词来自规范化的词表。也称主题词;
  • 标识词字段或非受控词字段(Identified Field,/ID或Keyword Field,/KY或Uncontrolled term Field) ,这一字段也是标引人员给文献标引反映其主题概念的词,但这些词不是规范化词表中的词,来自于原始文献;
  • 著者机构子段(corporate source,CS或AF)
  • 刊名字段(journal,JN或ST)
  • 出版年子段(publication year,PY)
  • 文献类型子段(ducument type,DT或TY)
  • 语种子段(language,LA)
  • 分类号子段(classification,CC) :区分EI数据库中的核心(有CC)和非核心(无CC)记录;

4)常见记录字段-对应内容:

在这里插入图片描述

5)常见记录字段总结:

常用索引字段

备注4:
a)现有多种检索系统所选的字段各有差异;即便字段一致,
检域范围可能采用不同的书写规范。
因此,在执行字段检索操作时,
请最好查阅该数据库的操作指南

b)CODEN(Code Number)

来源:由美国 ASTM(美国材料与测试协会)制定的科技期刊分类体系。该标准被视为国际通用参考。

由六个字符构成,在其中前四个字符作为基本识别码;对于《期刊名》来说,则是每个实词(中文期刊采用汉语拼音)作为前四个字符;当实词数量不足四个时,则使用其他词汇进行补充;第五个字符编码通常用于表示期刊类别等信息;第六个字符是校验码;例如:

  • 南大学报(自然科学版): Dongnan Daxue Xuebao : Ziran Kexue BanDDXZB9
  • 《中国医学科学杂志》英文版: Chinese Medical Sciences JournalCMSJEP

标识位置:CODEN应当印在期刊封面右上角,ISSN 之下;

c)DOI(Digital Object Unique Identifier-DOI / 数字对象唯一标识符)

由美国出版协会(AAPI)于1998年创立的该组织主要针对互联网环境下知识产权的保护与管理的出现和发展而产生

该采用美国标准ANSI/NISO Z39.84-2000的规定来设计DOIs的编码方案。一个DOI由前后缀两部分构成,并以斜杠分隔符分隔。无对前后缀字符长度的限制。例如,在实际应用中可表示为:DOI 10.1007/978-3-540-69478-6_34;

  • 前缀分为两个部分: 其中一个是目录代码, 所有DOI的前缀都以"10."结尾; 另一个则是登记机构代码;
  • 后缀则可包含各种字母、数字或其他字符组合, 其具体的编码规则则由登记机关自行制定;

3.7.4 位置检索

在信息处理领域中进行索引研究时所采用的位置标记符指的是那些用来表示检索词在信息组织中的具体排列方式的标记符号。这些标记符不仅能够体现记录中的顺序特征还能够反映出各字段间的相对位置关系

它避免了布尔逻辑算符仅关注检索词在命中记录中是否出现而忽略了它们的位置关系所导致的检索错误;

3)分类:

  • 在记录级别执行检索时(L),需确保查询关键词位于同一记录内。
  • 进行字段级别搜索时(F),系统会锁定特定字段中的关键词。
  • 当执行子领域或自然句子级别的搜索任务时(S),系统会识别出关键词所在的子部分。
  • 针对不同情况下的词语排列需求,在进行词位置处理时(W、nW、N和nN等),系统会根据预设规则调整关键词的位置。

4)检索符优先级:括号中的检索词 > W/N/L/S/F > NOT > AND > OR;

5) 检索精确度由高到低排序:(W)>(nW)>(N)>(nN)>(S)>(F);

6)词位置检索
a)(W) — With :(W)表示该算符两侧的检索词紧邻,在记录中的先后顺序不能颠倒,且两者之间只允许有一个空格、标点符号或连字符,不允许有任何字母或词。(W)可简写为( )。例如:

  • Aircraft( )design 能够检索到包含Aircraft design 的文献资料;
  • computer-aided design 能够找到涉及 Computer-aided-design 或 Computer aided design 的文献资料;
    在进行专有名词及短语的检索时,请采用该运算符;

b项**(nW) — n Words** 即(nW)表示,在该算符两侧的检索词之间最多可容纳n个单词(无论是实词还是虚词或其他代码),并且这些词语在记录中的出现顺序必须保持不变。例如:

  • 该系统能够检测到包括激光打印机以及激光彩色打印机在内的文献;
    • 该系统能够识别包括计算机动画以及计算机辅助动画在内的文献;

c)(N) — Near :(N)说明该运算符两侧的搜索项必须直接相连(不允许在两者之间插入任何字符),但它们的位置关系是可以调换的。

本研究开发了一种新型信息检索系统,在计算机网络领域中具有显著的应用价值

d)(nN) — n Near :(nN)定义为此算符两侧的检索词之间最多相距n个词或代码,并且两者之间的顺序可互换。

例如:计算机(2N)系统能够识别包含以下几种形式的文献记录:computer system、computer code system、computer aided design system以及system using modern computer。

6)字段级别检索
(F) —— Field:指两边的检索关键词必须位于同一个字段内(如篇名场域、述词场域以及文摘场域等),顺序不限制,并且其中夹在中间的词汇数量也不有限。例如:

  • computers(F)controlling/TI,表示这些术语即使出现在题名字段中也会被包含;
    • water()pollution(F)controlling/TI,表示即使在题名或关键词字段中包含water pollution和controlling的文献也会被检索出来。

7)子字段或自然句级检索
(S) — Subfield :表示其两侧的检索词必须出现在同一子字段中(文摘字段中,一个句子就是一个子字段, 用句号或豆号结束),词序不限。使用(S)算符时,系统会到篇名、自由标引词、节标题、叙词、文摘等字段中查找。
例如:computer()control(s)system,可检出文摘中含有“This paper is concerned with an application of the computer control technique in a intelligent system for testing inner walls of pipes.”这样一句话的文献记录;

8)记录级检索
(L) — Link:表示其连接的两个检索词间存在从属关系,并且后者修饰并限定前者,在这种情况下两者处于主从关系中。例如,在主题词表中常见的主标题词常与副标题词具有从属关系。若同时使用主标题词与副标题词作为检索项,则可用**(L)**算符将其连接在一起。例如,在主题索引中输入SOLAR(L)**ENERGY时,系统会自动将文献信息导向"叙"字段进行搜索。

9)常用位置检索符号总结:

常用位置检索符号总结

3.7.5 词组检索/短语检索/精确检索

采用双引号" "包裹多个相关关键词组合

在当今网络搜索引擎中存在特定于网络搜索的技术:其中一种是自然语言检索采用的方式是从自然语言中的字词和句出发进行提问式的搜索与日常对话的方式相似其被称为"智能检索"技术这种技术特别适合那些不熟悉网络信息技术的人群使用

b)多种语言检索:支持多国语言查询功能:为用户提供多国语言查询环境,并依据用户的选定语种执行查询操作并返回结果;

c)模糊检索:也被称为语义相关性检索。当我们在搜索引擎中输入一个关键词时,除了返回包含该关键词的相关网页地址外,还会提供与该关键词语义相关的信息。例如,在搜索"查询"这个词时(注:这里的"这个词"指的是具体的搜索词汇),系统不仅会显示包含"查询"的相关网页链接(注:这里的链接指代网络资源中的具体页面),还会列出那些涉及"查找""寻找""搜索""查一查"等类似含义的结果页(注:结果页指的是网络页面)。这些结果按照与查询相关的程度排序排列起来,在最前面的是最直接相关的资源链接,在其后则是 increasingly 相关度逐渐降低的信息内容。(注:括号中的解释性说明属于补充说明而非原文内容)大多数现代搜索引擎都具备这一功能特性(注:特指),但其具体的实现程度可能会有所不同。(注:程度差异)

d)字母大小写检索:当用户的搜索表达式使用小写字母时,搜索工具不仅识别该关键词并匹配大小写的同义词(如"瓷器"与"中国"),还会同时处理两种形式;而当采用大写字母表示时,则迫使搜索工具仅识别完全一致的键值对(如"china"仅检索到键值为"china"的结果)。

3.7.6 禁用词

在信息管理系统中开发人员常常会遇到一些无法直接作为关键词使用的过滤词汇(Stop Words)或者干扰词汇(Noise Words)。这些过滤词汇主要来自于网络系统、CD-ROM数据库以及期刊索引等非专门的信息资源。在信息检索与知识服务过程中,我们必须特别注意这些情况;这些术语的特点在于它们不具备明确的意义指向性,并且常常与其他相关关键词产生混淆。因此,在实际应用中需要充分理解其作用机制并合理运用这些概念作为理论依据。

2)禁用词的词性:

冠词,如a、an(AN)、the(THE)等;

连词,如and(AND)等;

介词,如as、at、by、during等;

代词,如their、THAT、those等;

be动词,如has、have ARE、used、using等;

形容词,如various等;

副词,如also等;

缩略词,如yt、ta等;

其他:在除了上述提到名词之外,在其他方面,在除了上述提到名词之外

3)常见数据库禁用词表:

在这里插入图片描述

除了上述这些数据库系统及光盘数据库外,由美国科学情报研究所(ISI)出版的《科学引文索引》(Science Citation Index,简称SCI)以及《科学技术会议录索引》(Index of Science and Technical Proceedings,简称ISTP)每期定期更新的主题索引(Permuterm Subject Index)之前,也分别编制了完整的禁止单词列表(Full Stop Last)与部分禁止单词列表(Semi一Stop List).其中,《科学引文索引》收录了199条禁止词汇及963条部分禁止词汇,《科学技术会议录索引》则记录了211条禁止词汇与1035条部分禁止词汇

4)文献检索中的禁用词常用处理方法
a)在文献检索过程中对禁止使用的词汇通常采用位置算符(W)或(N)进行替代,例如:

  • 在Dialog联机系统中进行ORBITS AND TRAJECTORIES领域的文献搜索时, 可使用S ORBITS(1W)TRAJECTORIES这一搜索模式;
    • 在ProQuest系统的INSPEC光盘数据库内执行RESEARCH AND DEVELOPMENT领域的文献搜索时, 可采用SELECT RESEARCH(1W)DEVELOPMENT这一查询语句;

b)若检索词采用词组表引方式,则在执行检索时需以双引号标记整个查询项。
例如,在Dialog联机系统中进行文献查找时,默认支持对完整查询项的引用;

当在SCI和ISTP的轮转主题索引中执行检索操作时,在这些索引中出现的"见"(See)指引可帮助检索者借助以核实全禁用词表(Full Stop List)以及半禁用词表(Semi-Stop list)。

我们应特别关注论文标题中的某些词汇——这些词汇既不可作为主要术语也不可作为辅助术语。其中完全禁止使用的关键词包括:A, AND, AS, IS, OF, ON以及 OR等;而部分仅能作为辅助术语使用的关键词则有:analysis法(分析法)与method(方法)。

3.8 检索效果的技术评价指标

1)常用技术指标:查全率和查准率;

2)查全率
a)意义:反映所需文献被检出的程度

查全率等于以下两种方式之一:第一种是(检出的相关文献量 / 检测系统内已有的相关文献总量)乘以100%;第二种是(检出的相关文献量除以(检出的相关文献量加未检出的相关文献量))乘以100%。

c)提高查全率的方法:

  • 扩大检索词汇的概括性
    • 全面选取同义词和近义词
    • 增加截取符号的使用
    • 减少"与"和"非"逻辑运算符的应用
    • 宜于增加"或"逻辑运算符的应用
    • 移除部分限制符号
    • 在多个字段或全文范围内进行搜索
    • 使用分类号进行检索等

3)查准率
a)意义:则反映系统拒绝非相关文献的能力;

b) 精确率等于被识别为相关文献的数量除以总被识别文献数量乘以百分之百;准确率为被识别为相关文学的数量除以(被识别为相关与不相关的文学数量之和)乘以百分之百

c)提高查准率的方法:

  • 增强检索词的专用性;
  • 采用具有更具体指向性的词汇,并结合更具针对性的自由词汇;
  • 避免使用截断标记;
  • 优先运用条件判断机制中的逻辑与和逻辑非操作;
  • 尽量避免条件叠加中的逻辑或关系处理;
  • 引入更多限定标识符以及限定字段参数的应用策略;
  • 依据文献外部属性进行筛选设置等;

4)查全率和查准率关系:

  • 两者综合表征检索系统。
    • 查全率与查准率间存在反比关系,在优化系统性能时二者相互制约:提高系统查全率会导致其查准率显著降低,并反之亦然。

3.9 常见检索工具

进行数据库检索:包括Web of Science(韦伯科学综合索引)、Engineering Village(工程村)、IEEE Xplore Digital Library(IEEE电气电子工程师学会数字图书馆)、ScienceDirect(科学直投)、Scopus(跨学科引文索引)以及ResearchGate(研究Gate)等多个资源库;

2)搜索引擎:百度学术、Google学术等;

3)中文数据库:中国知网、万方、维普等;

3.10 文献检索流程

步骤 内容
1 分析检索课题
2 选择检索工具
3 确定检索词
4 构建检索提问式
5 上机检索并调整检索策略
6 输出结果

3.11 有效筛选文献

步骤 内容
1 明确文献类型和文献研究方向
2 选择合适的文献检索系统,列出恰当的检索条件
3 阅读文献摘要,判断文献主题内容是否符合内心期望
4 定向查找全文,有效下载

备注6:知识点分散且难以系统化处理。需要持续加强检索技巧的训练,并通过参考特定的检索工具和相关指导文档来提升技能水平。经过一段时间的积累后可能会有更清晰的理解;

全部评论 (0)

还没有任何评论哟~