数据挖掘----图书馆员应掌握的基本工具-搜索引擎技术

作者：袖梨 2022-07-02

王绿园康梅英广州解放军体育学院 510502
　　摘要：本文揭示了在未来数字图书馆中图书馆员进行信息服务的一种方式；论述了数据挖掘和WEB挖掘的基本原理和方法；强调图书馆员应掌握数据挖掘这项新技术的必要性。
关键词：数据挖掘、WEB、INTERNET、信息服务、图书馆员
　　一、引言
　　随着信息时代的到来、INTERNET技术的发展，图书馆未来的功能变得越来越多样化。由于WEB技术的巨大成功，人们越来越多地依靠INTERNET来获取知识、信息。显然，人们到图书馆的次数和时间已越来越少，总有一天，人们再也不会亲自跑到图书馆去借一本书或咨询某个问题。面临着如此巨大的挑战，从事图书馆工作的人们提出了数字图书馆的设想。经过艰苦的研究已成功地建立了数字图书馆。数字图书馆是一个标准的电子信息基础设施，它采用分布数据存储，用户可以通过各种链接和操作在一个较大的地域范围内搜索和检索出自己所需的信息，而且整个操作对用户是开放的。也就是说，数字图书馆能够把数据存储在多个站点中，用户只须一个简单的操作就可从这些站点中搜索信息。数字图书馆是传统图书馆在信息时代的发展，它不但包含了传统图书馆的功能，还提供综合的信息访问服务。人们希望，数字图书馆将成为未来图书馆的信息中心和枢纽。
　　但是，从网络技术角度来看，数字图书馆与其它WEB信息源没有两样，它们都是建立在INTERNET上的信息站点。从用户的角度来看，他们关心的是从INTERNET上获得信息和知识，他们不能体会到你是数字图书馆还是INTERNET上的一般站点。但是要从成千上万的WEB信息站点中检索到有用的信息是不容易的，有时甚至是不可能的，更何况信息的索要者往往没有多少时间在茫茫的数据海洋中漫游。我们知道在数字图书馆中，图书馆员是信息专家，他们是信息组织者、信息生产者、信息服务者和信息管理者。正是通过图书馆员的信息服务活动使数字图书馆有别于其它信息站点。那么，图书馆员特别是院校图书馆中的图书馆员在二十一世纪的数字图书馆中应如何进行信息服务？图书馆员须掌握什么先进技术工具为用户服务？这是当前图书馆界应该研究的重要问题。
　　二、技术的选择
　　WEB是一个非常成功的信息系统。这个系统为信息在全球范围发布和传播提供了机会，它允许任何人在任何地点任何时间传播和获取信息。WEB的非结构化信息传播和获取方式引发了信息爆炸。大量的非结构化的信息分散在整个INTERNET中。大量信息在给人们带来方便的同时也带来了许多问题：信息过量，难以消化；信息真假难以辨识；信息安全难以保证；信息形式不一致，难以统一处理。在信息的海洋中，即使是最先进的搜索引擎也只能从1/3可以索引的WEB站点中获取信息。人们开始提出一个新的口号：“要学会抛弃信息”。人们开始考虑：“如何才能不被信息淹没，而是从中及时发现有用的知识、提高信息利用率？”事实上，作为一个非专业的信息管理人员，要从茫茫的信息海洋中获取本专业最新、最权威知识和较为全面的信息，并从中得到有用的知识几乎变得不可能。要知道，各高等院校或研究所里的专家教授们由于研究课题计划的紧迫，他们急需本专业领域的最新最权威的知识和信息，他们没有时间在成千上万的站点中的数不清的页面中查找所需的信息。所以在信息的提供者与信息的消费者之间应有一个中间环节，通过这个环节，信息消费者能够快捷方便地得到想要的信息，正是这种迫切需要为图书馆员提供了展现才华的机会。图书馆员们运用信息管理技能，直接为用户提供有用信息。图书馆员们应抓住机会，认真考虑在INTERNET环境中，如何使其服务领域得以扩宽，从桌面咨询服务扩展到基于WEB信息空间电子咨询服务。

数据挖掘----图书馆员应掌握的基本工具-搜索引擎技术

相关文章

精彩推荐