信息检索课程重点整理

发布 2022-08-25 05:48:28 阅读 6113

一、信息概念:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。特征:预先性、实用性、时效性、可传递性、共享性。

传递渠道:1、非正式过程(表现为个人的行为特征。对话、通信、演讲、授课);2、正式过程(表现为文献流通。借助文献系统进行正式交流)。

文献概念:大凡人类的知识用文字、图形、符号、声频、**的手段记录下来的东西,统统可称为文献。也可以称为固化在一定载体上的知识。必须含有知识、记录方式、载体。

资料概念:固化在一定的实物或载体上的知识。

二、信息的类型:

1、按信息的加工层次划分:一次信息(原始文献)、二次信息(检索工具)、三次信息(参考性文献)。p4

2、按信息载体的出版编辑特点划分:十二大文献源。p5

3、按信息载体的物理类型划分:印刷型、缩微型、电子型、声像型。p6

4、按信息的性质划分:一、自然信息(自然界发出的信息,以自然物为载体);二、社会信息(经过人类利用语言、文字、符号、图像等方式加工过的自然信息)。

5、按信息所表征的服务对象划分:经济信息、科技信息、教育信息、军事信息、商业信息、金融信息、综合信息。

三、信息检索的定义及类型p2

信息检索,就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。它包括三个方面: 数据检索、事实检索、文献检索。

三者中以文献检索为主。数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。

四、文献检索的定义及类型p3

定义:1、检索系统的建立及检索工具的组织和积累;2、文献的查寻,利用检索工具检出与课题相关的文献。

类型:直接检索:是从通过阅读原始文献直接获取所需信息;快捷、方便;漏查率高。

间接检索:是通过检索工具的指导再查找原始文献而获取所需信息。系统、全面:滞后。

五、检索工具定义、具备条件及类型。

检索工具是按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。

具备条件:(1)对所收录的文献的各种特征(包括外部特征和内容特征)要有详细的描述。 (2)每条描述记录(即款目)都标明有可供检索用的标识。

(3)全部描述记录科学地组织成一个有机的整体。(4)具有多种必要的检索手段。

类型:按检索方法划分:手工检索工具、机械检索工具。

按报道的学科范围:综合性检索工具、专业性检索工具。

按出版形式:全面性检索工具、单一性检索工具。

著录的形式:目录、题录、文摘、索引。p9

第二章、网络。

一、网络基本术语。

tcp(transmission control protocol,传输控制协议)将文本分成包(数据包) ,再加上特别信息,使数据可以准确无误的地发送到接收方的计算机上。

ip(internet protocol,网际协议)在数据包上标上特别的信息(接收主机的ip地址),到目的地后,系统自动将ip地址去掉,再利用tcp检查数据是否完整,如有丢损则要求发送方重新发送被丢损的数据包。

pop3 (post office protocol) ,表示邮局协议。允许用户访问接收邮件的主机,并取走存放在上面的邮件。

pop邮件服务器。

ftp是file transfer protocol(文件传输协议)的缩写,它允许两台因特网主机相互传送/拷贝文件,可以把自己计算机上的某个文件拷贝到网络上的某台计算机上,或是把网络上某台计算机上的文件拷贝自己计算机上。

http:超文本传输协议。

ip地址:在internet上的每一台计算机主机都必须有唯一的“地址”,以保证internet上所有的计算机和网络能够被互相传送信息而不被混淆,以数字表示,称为ip地址。为确保ip地址在整个网上的唯一性,该地址一般由internet网络信息中心统一分配。

域名系统dns,按域名系统定义的名字称为域名。域名和ip地址的联系:前者是名称,面对用户操作;后者是主机地址,主要供电脑识别用的,ip 地址共有32位,这么多数字不便于我们记忆,就对应取了域名便于人们的使用,域名和ip地址间是一一对应的,可通过域名服务器进行转换。

p54html (超文本标记语言)

http (超文本传输协议)

url(统一资源定位器) 格式:协议: /主机地址[: 端口号]/子目录/文档名。

email地址组成:用户名@邮件服务器域名。

ftp 是 tcp/ip 协议组中的协议之一,简单的说,ftp就是完成两台计算机之间的拷贝,从远程计算机拷贝文件至自己的计算机上,称之为“**(download)”文件。若将文件从自己计算机中拷贝至远程计算机上,则称之为“上载(upload)”文件。文件传输工具。

二、搜索引擎的分类。

按检索机制分:分类目录式搜索引擎、全文搜索引擎、元搜索引擎。

按搜索的内容分:综合性搜索引擎、专门搜索引擎。

三、搜索引擎的工作原理。

搜索引擎是指通过“网络机器人”(网络信息挖掘系统)在网际某一空间、某一领域中寻找和发现有用或相关的信息,并在此基础上建立检索数据库,通过简单友好的界面提供给用户查询的工具。

三大功能:在因特网上漫游收集信息(人工的,自动的两种);对收集到的信息标引并建立或更新数据库;提供检索服务接待用户访问。p65

第三章、图书。

索引语言定义与类型:

作为一种通讯工具,索引需要有一种用来描述文献特征的检索标识,以将文献信息的产生者、加工者、检索者在文献特征的识别上彼此联系起来,以便取得能共同理解、实现思想交流的语言,这种语言就叫索引语言。

按结构原理分:

分类语言:体系分类语言、组配分类语言

描述语言:标题词叙词单元词关键词(非规范化语言)

**语言 引文语言。

定义:体系分类法是一种直接体现知识分类的等级标识系统,它对概括文献信息内容及其外表特征的概念进行逻辑分类(划分与概括)和系统排列而构成。它提供某学科、专业的集中文献。

类型:《中图法》《科图法》《资料法》《人**》

中图法:5大部22大类。索书号=分类号+作者号。

联合目录:汇总某地区或若干地区甚至是全国图书馆或其他收藏单位所收藏的书刊统计目录。反映几个图书馆藏书的情况,某一种书刊见于何处,藏于何馆,便于查找借阅。

馆藏目录:是图书馆或信息资料部门所收藏的全部书刊的统计目录。

公共检索目录:各图书馆的网上公共可检索目录opac(online public access catalog),即一个基于网络的书目检索系统,提供本馆书目信息的检索服务。

课题检索——检索步骤 p20

1)分析检索课题。

2)选择检索方法。

常用法:要求查全---用顺查法;

要求快、新---用倒查法;

掌握了课题的发展阶段特点-用抽查法。

追溯法:查全率、查准率较低,易误检漏检。

综合法:优点是当检索工具缺期、缺卷时,也能连续获得所需年限以内的文献资料。

3)选择检索工具p9

一般结构:1、使用说明:是检索工具编制着为检索工具检索者提供的必要指导。

包括编辑内容、著录标准、代号说明和使用方法。2、目次表:检索工具的正文一般按分类方法组织编排,在检索工具前有详简不等的分类目次表。

为使用者提供分类途径的检索。3、正文:正文部分是检索工具的主体部分。

4、辅助索引:为用户提供多种途径的检索,从而提高检索效率。5、附表:

是检索工具内容的必要补充,包括摘用刊物的种类,各种缩写,文字转译,术语和文献入藏单位代号等。

4)确定检索途径。

主题途径(要求特性检索)、分类途径(要求族性检索)、著者途径 、序号途径 、书名途径 。

5)查找文献线索

6)获取原文。

a、到本单位的图书馆或资料部门去查找 ;b 、从国内图书信息机构,由近及远地获取;c、给著者写信获取;d、从文摘、索引等检索工具出版机构获取;e、网上查询,查全文期刊数据库、搜索引擎、电子期刊等;f、通过商业机构获取。

计算机检索的基本技术(p31)

1、布尔逻辑检索+*-2、截词检索 ;3、字段限制检索 (field limiting)

检索效果评价(p25)

1查全率、查准率的定义以及两者之间的关系。

被检索出的相关文献的数量

查全率。总文献中所有相关文献的数量

被检索出的相关文献的数量。

查准率。被检索出文献的数量。

查全率与查准率两者是互逆的关系。

优化检索策略的方法。

1、如果检索结果太多,可缩小检索范围,提高查准率。①使用逻辑非剔除无关内容; ②使用规范词、下位类主题词,提高检索词专指度; ③限定检索字段; ④限定文献外表特征,如语种、时间等; ⑤将and算符改为更严格的位置算符。

2、如果检索结果太少或为0,可扩大检索范围,提高查全率。①少用and,多用or; ②使用主题词的同义词、近义词、上位类词; ③使用截词符,以检出所有词干相同的词; ④将限制严格的位置算符改为不太严格的位置算符; ⑤选择更合适的数据库。

检索表达式:作者单位=北京大学*作者=王少华*刊名=首都经济**大学学报*关键词=(人力资源管理+人才资源管理)* 年=2000

文献著录形式。

1)期刊 例如: 袁庆龙,候文义.ni-p 合金镀层组织形貌及显微硬度研究[j].太原理工大学学报,2001,32(1):51-53.

2)图书(专著)

例如:刘国钧,王连成.图书馆史研究[m].北京:高等教育出版社,1979:15-18,31.

3)**集

例如:孙品一.高校学报编辑工作现代化特征[c].中国高等学校自然科学学报研究会.科技编辑学**集(2).北京:北京师范大学出版社,1998:10-22.

4)学位**

例如:张和生.地质力学系统理论[d].太原:太原理工大学,1998.

5)专利文献

例如:姜锡洲.一种温热外敷药制备方案[p].中国专利:881056078,1983-08-12.

6)国际、国家标准

例如:gb/t 16159—1996,汉语拼音正词法基本规则[s].北京:中国标准出版社,1996.

第五章特种文献。

专利定义、类型、专利三性。

专利定义:由个人或单位将自己的发明创造向专利局提出申请,经专利局审查核实,发明人在法律规定的时间和区域内,对其发明享有独占权,即专利权,在该期限内若有人未经允许而采用此项专利,属于侵权。

《市场营销》课程重点整理

名词解释题。市场营销 市场营销组合 组合 顾客满意 营销调研 市场营销管理 市场营销环境 文化 态度 市场细分 市场定位 市场总需求 品牌 品牌资产 产品组合 无差异营销 差异营销 目标市场 分销渠道 成本加成定价 市场营销 市场营销重点整理。1 名词解释题。市场营销 市场营销组合 组合 顾客满意 ...

市政实务重点整理

1 施工方案是施工组织设计的核心部分,主要包括施工方法的确定 施工机具的选择 施工顺序的确定和专项设计。2 侧壁水平位移 基坑周围建筑物及地下管线 地下水位都是监测的重点。3 四不放过是指 事故原因不清楚不放过,事故责任者和员工没有受到教育不放过,事故责任者没有处理不放过,没有制度防范措施不放过 4...

市政学重点整理

1 简答题。1.田园城市 理论。田园城市是为健康 生活以及产业而设计的城市,它的规模能足以提供丰富的社会生活,但不应超过这一程度 四周要有永久性农业地带围绕,城市的土地归公众所有,由一委员会受托掌管。田园城市理论是一种城市建设和社会改革理论,倡议建立一种兼具城市和乡村优点的田园城市,用城乡一体的新社...