网络搜索引擎的实践应用研究 第6页


网络搜索引擎的实践应用研究 第6页

第三章 各大搜索引擎的比较研究

 

在互联网不断走向成熟的今天,新的利润增长点在哪里?Google,百度在纳斯达克的神话,使得越来越多的人将目光投向了搜索引擎行业。同时在信息大爆炸的时代里,人们对网络信息的处理也越来越借重于许许多多的各种各样的搜索引擎。在这里,我仅仅是将几个我们较为常用的搜索引擎加以粗略的比较,希望对大家的选择和使用有所帮助。

 

3.1 百度搜索引擎介绍和研究

 

百度,网址http://www.baidu.com

   百度搜索是世界上第一个中文搜索引擎,拥有目前世界上最大的中文搜索引擎,总量超过3亿页以上,并且还在保持快速的增长。百度搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点,能够帮助广大网民快速的在浩如烟海的互联网信息中找到自己需要的信息,因此深受网民的喜爱。

“百度”作为全球最大的中文搜索引擎,是人们最常用的搜索引擎之一,最常用于搜索网页、图片和mp3,但搜索结果中广告、垃圾网站和死链比较多。如搜索网页链接打开后却标示着“该链接已被删除”的信息或“请尝试其他链接”等提示,网民不能第一时间获取自己想要的信息。

作为中文搜索引擎的老大,百度也有其及为独到的一面。其基于字词结合的信息处理方式,就相当巧妙解决了中文信息的理解问题,极大地提高了搜索的准确性和查全率。百度还支持主流的中文编码标准。包括GBK(汉字内码扩展规范)GB2312(简体)BIG5(繁体),并且能够在不同的编码之间转换。

百度的智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。百度搜索支持二次检索(又称渐进检索或逼进检索)也是其相当重要的特点。可在上次检索结果中继续检索,逐步缩小查找范围,直至达到最小、最准确的结果集。利于用户更加方便地在海量信息中找到自己真正感兴趣的内容。还有就是百度智能性、可扩展的搜索技术保证最快最多的收集互联网信息。拥有目前世界上最大的中文信息库,为用户提供最准确、最广泛、最具时效性的信息提供了坚实基础。

 

3.2 GOOGLE搜索引擎的介绍和研究

 

Google网址http://www.google.com

    Google 的使命是整合全球范围的信息,使人人皆可访问并从中受益。完成该使命的第一步就是Google 的创始人 Larry Page  Sergey Brin 共同开发的全新的在线搜索引擎。该技术诞生于斯坦福大学的一个学生宿舍里,然后迅速传播到全球的信息搜索者。Google 目前被公认为全球最大的搜索引擎,它提供了简单易用的免费服务,用户可以在瞬间返回相关的搜索结果。

 在访问 Google 主页时,您可以使用多种语言查找信息、查看新闻标题、搜索超过10 亿幅的图片,并能够细读全球最大的 Usenet 消息存档,其中提供的帖子超过 10 亿个,时间可以追溯到 1981 年。比百度搜索引擎输入中文方便,而且适用范围更广。2005年,Google高调进军中国市场,推出Google搜索中国版,命名为:谷歌搜索www.google.cn

“Google”是功能强大,易用性最强的搜索网站,搜索速度快而且提供了最丰富的高级搜索功能。死链率比较高是Google最大的问题,中文网站检索的更新频率不够高,不能及时淘汰已经过时的链接。虽然通过网页快照功能,可以减少目标页面不存在的现象,但Google网页快照功能在国内经常出现不可访问的问题,令用户无所适从。

与大多数其它搜索引擎的区别在于:Google 只显示相关的网页,其正文或指向它的链接包含您所输入的所有关键词,而无须再受其它无关结果的烦扰。Google 不仅能搜索出包含所有关键词的结果,并且还对网页关键词的接近度进行分析。与大多数其它搜索引擎的又一区别是:Google 按照关键词的接近度确定搜索结果的先后次序,优先考虑关键词较为接近的结果,这样可以为您节省时间,而无须在无关的结果中徘徊。Google 最擅长于为常见查询找出最准确的搜索结果。其中“手气不错(tm)” 按钮是最有特色的,它会直接带您进入最符合搜索条件的网站,相对省时又方便。Google 储存网页的快照,当存有网页的服务器暂时出现故障时您仍可浏览该网页的内容。如果找不到服务器,Google 储存的网页快照也可救急。虽然网页快照中的信息可能不是最新的,但在网页快照中查找资料要比在实际网页中快得多。

 

3.3网易搜索引擎的介绍与研究

 

在中国的搜索引擎市场当中,网易也是不可忽视的一股巨大的力量。对于己于人他搜索引擎而言,网易搜索也有其相当独特的特点。

首先是网易搜索引擎提供多语言检索,英语,日语,俄语等几十种语言关键词都可以直接输入搜索框检索网页资料。而不仅仅是单语种的搜索。其次,网易还拥有全国最大的开放式管理目录,有约5000名各行业目录管理员负责管理网站注册信息。相关网站里汇集了大量精选网站(25),相关网页的信息量最大(16亿1千万网页)

网易采用的搜索原理是:网易搜索引擎是模糊的搜索方式 -- 对用户输入的关键词,先作语言分析,分解成多个词或词组,再去数据中心匹配结果,因此用户可以输入一整段句子,而可能得到包含了这段话中部分词语的结果,这样得到的结果更丰富;网易搜索引擎按搜索结果和用户输入的搜索词的关联程度排列结果的,用户的关键词出现了的越多的结果排得越靠前;在相关度排序的同时,越知名的站点排得越靠前。

上一页  [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] 下一页

Copyright © 2007-2012 www.chuibin.com 六维论文网 版权所有