信 息 检 索 论 文
信息检索
“信息”已成为今天使用频率最高的词汇之一。搜索引擎“搜狐”上查到的32217个网站,2444525张网页;Inforseek上71418个网站,13376974张网页。获取信息、评价信息、使用信息的能力,已经是信息社会劳动者必须掌握的终身技能。教育专家们在20年前就宣布,面向21世纪的学生,除了要接受传统的阅读、写作教育外,还必须具备一定的信息素质。为此,美国 “信息素质全国论坛”将45项评价标准列为全国教育总目标的评价内容。
大约在4000年前,人类就开始有了信息组织和信息检索的活动。典型的一个例子是书的目录。因为信息的 范围最终会超出一本书或多本书的容纳空间,因此需要建立特殊的信息结构,保障对存储数据的快速存储。一种普便使用的用于快速检索的数据结构是索引(index),即选择一组词或概念,并通过指针与相关信息(或对象)关联。索引是现代信息检索系统的核心,他提供快速的对数据的存取,加快查询处理任务。
多个世纪以来,索引是手工方式产生的,形成分类的的层次。事实上,现在的许多图书馆仍然在使用这样的分类层次来对收藏的资料进行分类。通常这种层次是从图书馆科学的领域出发,根据人的主观来设计。现在,计算机技术的发展使得自动构建大型索引成为可能。自动索引技术为查询提供的支持更多地是与系统本身相关,与用户需要的相关程度就低一些,于是,就产生了两种不同的检索策略,既以计算机为中心的和以人为中心的信息检索。
对于以计算机为中心的观点,信息检索问题主要是建立有效的索引,高性能地处理用户的查询,开发排序算法以改善查询应答子集的“质量”。对于以人为中心的观点,信息检索问题主要是研究用户的行为,理解他们的主要需求,根据这些需求改进和完善检索系统的组织和操作。那么,根据以人为中心的观点,基于关键字的查询处理就不是一种好的检索策略。
那么什么是信息检索呢: 信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。
狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。 信息检索的手段
(1)手工检索 (2)光盘检索
(3)联机检索 (4)网络检索
概括起来分为手工检索和机械检索:
手工检索:指利用印刷型检索书刊检索信息的过程,优点是回溯性好,没有时间限制,不收费,缺点是费时,效率低。
机械检索:指利用计算机检索数据库的过程,优点是速度快,缺点是回溯性不好,且有时间限制。
计算机检索、网络文献检索将成为信息检索的主流。
网络信息检索,也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。 信息检索的对象
1文献检索(Document Retrieval):是以文献(包括题录、文摘和全文)为检索对象的检索。可分为全文检索和书目检索两种。
2 数据检索(Data Retrieval):是以数值或数据(包括数据、图表、公式等)为对象的检索。
3 事实检索 (Fact Retrieval):是以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索。
以前我在网上找资料基本上处于一种盲目的状态。在百度、天网等网站里输入关键词就行了,本学期上了信息检索课,我学习到了检索文献的一些知识,并且也由此及彼地把这些知识应用到信息的检索中,不单单是文献的检索。在学习阶段,通过上信息检索课我对信息检索的认识又上升到了一个新的高度。
首先我认识到了信息检索对科学研究的重要性,我在做老师布置的题目的时候查资料是最认真的,因为要了解我做的课题,要写综述,我以为这样已经足够了,但是第一节课我就发现原来还有跟踪查询这回事,就是在你做课题的时候还要密切关注本领域的动态,这是我没想到的,这是第一个收获。
继续学习以后发现,信息检索的策略也是非常重要的,我原来误以为一个好的检索策略只能提高查准率,大不了我多看几篇文献,现在发现它还能提高你的查全率,而且对于你从较高层次上把握课题的研究方向、发展脉络是极有帮助的。这是第二个收获。
关于检索策略的体会我就不说了,同学们和我的体会有的差不多,有的给了我极大的帮助。通过学习这门课程,掌握一些基本的网上搜索技巧可以说是必需的。
1、使用逻辑词辅助查找
比较大的搜索引擎都支持使用逻辑词进行更复杂的搜索界定,常用的有:AND(和)、OR(或)、NOT(否)及NEAR(两个单词的靠近程度),恰当应用它们可以使搜索结果非常精确。另外,也可以使用括号将搜索词分别组合,如„(新闻OR足球)AND米兰)NOT(“新闻”OR足球‟。
2、使用双引号进行精确查找
如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最少、最精确。
3、有针对性地选择搜索引擎
用不同的搜索引擎进行查询得到的结果常常有很大的差异,这是因为它们的设计目的和发展走向存在着许多不同,有的专用于USENET的搜索引擎,
而有的则是针对邮递列表或IRC等的搜索引擎。使用时要根据自己的需要选择合适的搜索引擎。
4、使用加减号限定查找
很多搜索引擎都支持在搜索词前冠以加号“+”限定搜索结果中必须包含的词汇,用减号“-”限定搜索结果不能包含的词汇。
5、细化查询
许多搜索引擎都提供了对搜索结果进行细化与再查询的功能,如有的搜索引擎在结果中有“查询类似网页”的按钮,还有一些则可以对得到的结果进行新一轮的查询。
6、根据要求选择查询方法
如果需要快速找到一些相关性比较大的信息,可以使用目录式搜索引擎的查找功能。如果想得到某一方面比较系统的资源信息,可以使用目录一级一级地进行查找。如果要找的信息比较冷门,应该用比较大的全文搜索引擎查找。
7、注意细节
在Internet上进行查询时如果能注意一些细节问题,常常能增加搜索结果的准确性,如许多搜索引擎都区分字母的大小写,因此,如果您正在搜索人名或地名等关键词,应该正确使用它们的大小写字母形式。
8、利用选项界定查询
目前越来越多的搜索引擎开始提供更多的查询选项,利用这些选项人们可以轻松地构造比较复杂的搜索模式,进行更为精确的查询,并且能更好地控制查询结果的显示。
快速搜索的技巧:网上的信息搜索技术越来越多,怎样才能高效迅速地找到问题的答案呢?有几种技术可以帮助你更加快捷地找到所需网页。没有一种技术是万能的,但将几种技术巧妙地结合起来使用会大大加快网页搜索进程。
1、搜索词组
如果只给出一个单词进行搜索,经常会出现数以千计甚至以百万计的匹配网页。然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词,并将两个词用AND(与逻辑)结合起来,或者在每个词前面加上加号“+”,这种与逻辑技术大大地缩小了搜索结果的范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使用同样的语法。一个带引号的词组意味着只有完全匹配该词组(包括空格)的网页才是要搜索的网页。把这几种符号结合起来使用,能大大提高搜索效率。
2、选择词组
一般说来在网页搜索引擎中,用词组搜索来缩小范围从而找到搜索结果是最好的办法。但是,运用词组搜索涉及到如何使用一个词组来表达某一具体问题。有时简单地输入一个问题作为词组就能奏效,然而简单明了地提问方法只对一部分搜索奏效。选择合适的词组对提高搜索效率是很重要的,实在找不出时可以试试下面的方法。
3、查找信息源
有时词组搜索太精确或者一个词组无法准确表达所需信息。那么可以直接到信息源,这种技术“简单得似乎不值一提”,但却很有效。根本不用搜索引擎,直接到提供某种信息组织的站点去。很多时候我们可以用公式“www.公司名.com”去猜测某一组织的特点。从而得到所要搜索的信息的主要词组。
在改革开放的今天,传统教育培养的知识型人才已满足不了改革环境下市场经济的需求,新形势要求培养的是能力型和创造型人才,具备这些能力的人才首先需要具备自学能力和独立的研究能力。大学生在校期间,已经掌握了一定的基础知识和专业知识。但是,“授之以鱼”只能让其享用一时。如果掌握了信息检索的方法便可以无师自通,找到一条吸收和利用大量新知识的捷径,把大家引导到更广阔的知识领域中去,对未知世界进行探索。是谓“教人以渔”,才能终身受用无穷。
因篇幅问题不能全部显示,请点此查看更多更全内容