什么是搜索引擎?
搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
一. 基本概念
搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。因特网上的信息浩瀚万千,而且毫无秩序,所有的信息像汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为用户绘制一幅一目了然的信息地图,供用户随时查阅。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
二. 工作原理
1.抓取网页
每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
2.处理网页
搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。
3.提供检索服务
用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
综合搜索引擎有哪些
问题一:常用的搜索引擎有哪些? 索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。 搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。 早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。 随着yahoo!的出现,搜索引擎的发展也进入了黄金时代,相比以前其性能更加优越。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。以搜索引擎权威yahoo!为例,从1995年3月由美籍华裔杨致远等人创办yahoo!开始,到现在,他们从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,充分说明了搜索引擎的发展从单一到综合的过程。 然而由于搜索引擎的工作方式和因特网的快速发展,使其搜索的结果让人越来越不满意。例如,搜索“电脑”这个词汇,就可能有数百万页的结果。这是由于搜索引擎通过对网站的相关性来优化搜索结果,这种相关性又是由关键字在网站的位置、网站的名称、 标签等公式来决定的。这就是使搜索引擎搜索结果多而杂的原因。而搜索引擎中的数据库因为因特网的发展变化也必然包含了死链接。 这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000‘000个网页。我们可以从google.stanford.edu/ 下载。 设计搜索引擎是一项富有挑战性的工作。搜索引擎为上亿个网页建立索引,其中包含大量迥然不同的词汇。而且每天要回答成千上万个查询。在网络中,尽管大型搜索引擎非常重要,但是学术界却很少研究它。此外由于技术的快速发展和网页的大量增加,现在建立一个搜索引擎和三年前完全不同。 本文详细介绍了我们的大型搜索引擎,据我们所知,在公开发表的论文中,这是第一篇描述地如此详细。除了把传统数据搜索技术应用到如此大量级网页中所遇到的问题,还有许多新的技术挑战,包括应用超文本中的附加信息改进搜索结果。 本文将解决这个问题,描述如何运用超文本中的附加信息,建立一个大型实用系统。任何人都可以在网上随意发布信息,如何有效地处理这些无组织的超文本 *** ,也是本文要关注的问题。 关键词 World Wide Web,搜索引擎,信息检索,PageRank, Google 1 绪论 Web 给信息检索带来了新的挑战。Web上的信息量快速增长,同时不断有毫无经验的新用户来体验Web这门艺术。人们喜欢用超级链接来网上冲浪,通常都以象Yahoo这样重要的网页或搜索引擎开始。大家认为List(目录)......
问题二:中国主要的搜索引擎有哪几个? 百度(baidu)中文搜索引擎
全球最大中文搜索引擎。提供网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索、百度搜霸、搜索援助中心。
北大天网中英文搜索引擎
由北京大学开发,简体中文、繁体中文和英文三个版本。提供全文检索、新闻组检索、FTP检索(北京大学、中科院等FTP站点)。目前大约收集了100万个WWW页面(国内)和14万篇Newsgroup(新闻组)文章。支持简体中文、繁体中文、英文关键词搜索,不支持数字关键词和URL名检索。
新浪搜索引擎
互联网上规模 最大的中文搜索引擎之一。设大类目录18个,子目1万多个,收录网站20余万。提供网站、中文网页、英文网页、新闻、汉英辞典、软件、沪深行情、游戏等多种资源的查询。
雅虎中国搜索引擎
Yahoo!是世界上最著名的目录搜索引擎。雅虎中国于1999年9月正式开通,是雅虎在全球的第20个网站。Yahoo!目录是一个Web资源的导航指南,包括14个主题大类的内容。
搜狐搜索引擎
搜狐于1998年推出中国首家大型分类查询搜索引擎,到现在已经发展成为中国影响力最大的分类搜索引擎。每日页面浏览量超过800万,可以查找网站、网页、新闻、网址、软件、黄页等信息。
网易搜索引擎
网易新一代开放式目录管理系统(ODP)。拥有近万名义务目录管理员。为广大网民创建了一个拥有超过一万个类目,超过25万条活跃站点信息,日增加新站点信息500~1000条,日访问量超过500万次的专业权威的目录查询体系。
3721网络实名/智能搜索
3721公司提供的中文上网服务3721网络实名,使用户无须记忆复杂的网址,直接输入中文名称,即可直达网站。3721智能搜索系统不仅含有精确的网络实名搜索结果,同时集成多家搜索引擎。
360综合搜索引擎
问题三:哪些是综合性搜索引擎? 世界主要搜索引擎都是综合性的
google,baidu,yahoo,bing,。。。
问题四:常用的搜索引擎都有哪些基本类型? 索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。
搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。
早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。
随着yahoo!的出现,搜索引擎的发展也进入了黄金时代,相比以前其性能更加优越。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。以搜索引擎权威yahoo!为例,从1995年3月由美籍华裔杨致远等人创办yahoo!开始,到现在,他们从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,充分说明了搜索引擎的发展从单一到综合的过程。
然而由于搜索引擎的工作方式和因特网的快速发展,使其搜索的结果让人越来越不满意。例如,搜索“电脑”这个词汇,就可能有数百万页的结果。这是由于搜索引擎通过对网站的相关性来优化搜索结果,这种相关性又是由关键字在网站的位置、网站的名称、 标签等公式来决定的。这就是使搜索引擎搜索结果多而杂的原因。而搜索引擎中的数据库因为因特网的发展变化也必然包含了死链接。
这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文和超连接的数据库至少包含24‘000‘000个网页。我们可以从google.stanford.edu/ 下载。
设计搜索引擎是一项富有挑战性的工作。搜索引擎为上亿个网页建立索引,其中包含大量迥然不同的词汇。而且每天要回答成千上万个查询。在网络中,尽管大型搜索引擎非常重要,但是学术界却很少研究它。此外由于技术的快速发展和网页的大量增加,现在建立一个搜索引擎和三年前完全不同。
本文详细介绍了我们的大型搜索引擎,据我们所知,在公开发表的论文中,这是第一篇描述地如此详细。除了把传统数据搜索技术应用到如此大量级网页中所遇到的问题,还有许多新的技术挑战,包括应用超文本中的附加信息改进搜索结果。
本文将解决这个问题,描述如何运用超文本中的附加信息,建立一个大型实用系统。任何人都可以在网上随意发布信息,如何有效地处理这些无组织的超文本 *** ,也是本文要关注的问题。
关键词 World Wide Web,搜索引擎,信息检索,PageRank, Google 1 绪论 Web 给信息检索带来了新的挑战。Web上的信息量快速增长,同时不断有毫无经验的新用户来体验Web这门艺术。人们喜欢用超级链接来网上冲浪,通常都以象Yahoo这样重要的网页或搜索引擎开始。大家认为List(目录)......
问题五:比较好的搜索引擎有哪些 综合类的:google、baidu、yahoo、bing其他国产的很多,搜狐、网易、搜狗,在搜索类里面名气不如google和百度高
问题六:四大搜索引擎是什么 google
baidu
search.yahoo
search.msn
或
yisou
baidu
sogou
问题七:什么是搜索引擎?作用是什么? 什么是搜索引擎?
搜索引擎的英文为search engine。搜索引擎是一个对互联网信息资源进行搜索整理和分类,并储存在网络数据库中供用户查询的系统,包括信息搜集、信息分类、用户查询三部分。
从使用者的角度看,搜索引擎提供一个包含浮索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。其实,搜索引擎涉及多领域的理论和技术:数字图书馆、数据库、信息检索、信息提取、人工智能、机器学习、自然语言处理、计算机语言学、统计数据分析、数据挖掘、计算机网络、分布式处理等,具有综合性和挑战性。
搜索引擎的用途,对普通网民而言,搜索引擎则仅仅是一种查询工具,作为工具,使用者要了解搜索引擎的功用、性能,探讨并掌握其使用方法和技巧。对商家来说,搜索引擎是一种赢利的产品或服务,而作为产品,搜索引擎商要研制、改进和创新其搜索技术;作为服务,搜索引擎营销商要研究搜索引擎优化和推广。利用搜索引擎的目的不同,构成了搜索引擎研究的不同群体和对搜索引擎不同角度不同侧重的研究。
问题八:世界上最大的搜索引擎是哪几个 GOOGLE搜索引擎是由两位斯坦福大学的博士LARRY PAGE和SERGEY BRIN在1988年创立的,几年间发展为目前规模最大的。目前每天需要处理2亿次搜索请求,数据库存有30亿个WEB文件。 提供常规搜索和高级搜索两种功能。信息条目数量。多种语言。 1、作为一个整体查询时,最好全他们加上引号。如“电子商务”。如果直接输入电子商务就会自动分为电子和商务两个。 2、如果要求特定词语包括到索引的文档中,则可以在前面加上“+”号,并且“+”号和单词不能有空格。 3、一般的搜索引擎都支持布尔运算符。 注意一下一些特点: 1、以关键词搜索时,返回结果中包含全部及部分关键词,短语搜索时,默认以精确方式进行,字母无大小写之分,全部默认为小写,不使用词干法,也不支持通配符 2、在查询时不需要使用AND。缩小范围时,只需要输入更多的关键词,或者使用二次检索。不支持OR。 3、只显示网页标题、链接及网页字节数。匹配的关键词以粗体显示。 4、还拥有搜索图片的功能。 5、拥有全球地图,即拥有导航功能。 6、提供在先翻译功能 Google有四大功能模块:网站、图像、新闻组和目录服务 Google搜索速录机快,网页数量在搜索引擎中名列前茅,支持多大132种语言,叮索结果准确率极高,具有独到的图片搜索功能和强大的新闻组搜索功能
问题九:什么是垂直搜索引擎以及综合搜索引擎 垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩。
综合搜索引擎又称通用搜索引擎,在检索过程中不限制所检索信息的类型与主题范围,它可以以所有网络信息资源为检索对象,检索结果包括所涉及的任何领域、任何方面的网络信息资源,这些信息依照与搜索条件符合的程度排列,在快速、准确的基础上,给用户提供了更多的选择。
问题十:什么是综合搜索引擎 就是侵仅,不侵仅,就影响互联网的发展了
夸克浏览器怎样搜索引擎地址链接?
夸克 浏览器 是很多小伙伴都比较喜欢用的,但是这款浏览器目前只有手机版,对于想要在pc端使用的小伙伴们来说就比较不方便了。下面我就为大家带来了夸克浏览器网页版入口,夸克搜索引擎地址链接,有需要的小伙伴不要错过啦!
《夸克浏览器》网页版入口:
地址链接:
复制上方链接到任意浏览器中打开,然后直接搜索自己想要的内容就可以了。系统默认采用的就是夸克的搜索引擎,和手机版的夸克浏览器是一样的,搜索内容同步哦!
夸克搜索引擎特色:
1、夸克是阿里巴巴旗下的智能浏览器,搭载阿里巴巴自研的AI搜索引擎,由UC原创团队设计打造的,旨在让用户使用更加简便的APP,带来绝佳的沉浸式体验。
2、夸克浏览器是UC团队打造的异于UC浏览器的“旗舰”浏览器,主打无广告、无信息流、内存小和高效沉浸式体验的应用,而且夸克浏览器还是一款智能搜索的软件。
3、无论在哪款应用上复制内容,回到夸克都无需粘贴,一键点击即可进入复制内容搜索页面。
4、除此之外,夸克还支持以图搜图功能,无论在夸克内长按图片还是打开手机相册分享功能,都能找到夸克以图搜图功能,十分便捷。
搜索引擎有哪些?
问题一:搜索引擎有哪些 目前比较主流的搜索引擎
有百度、360搜索、搜狗、谷歌、有道、必应
但是用户量大的有百度、360、搜狗和谷歌
移动端有神马搜索
问题二:当今世界上最流行的搜索引擎有哪些 全世界有成千上万个被称为 “ 搜索引擎 ” 的网站。实际上,这些网站中真正适合海外推广的搜索引擎不过 10 个。其中最著名的是 Google, Yahoo, Alltheweb, AltaVista 和 Inktomi 等。其他网站的搜索结果都来自于这些搜索引擎,或者他们之间的搜索结果交叉使用。
相关图片:
1.Google 全球最大的机器搜索引擎, Google 每天提供 2 亿次查询服务,占全球搜索引擎查询市场份额的 29.2 %,无可争议的世界第一; Google 通过对 80 多亿网页进行整理,为世界各地的用户提供适需的搜索结果,而且搜索时间通常不到半秒。
2.Yahoo !是全球认知度最高及最有价值的互联网品牌之一,也是最大的门户网站。有英、中、日、韩、法、德等 10 余种语言版本。在全球消费者品牌排名中居第 38 位 , 是全球最大的搜索引擎和门户网站。拥有 2.94 亿有效注册用户,每天 12 亿访问人次,覆盖全球网民的 61% ;全球有 1840 万业务采购决策者访问 Yahoo!
3.MSN 属于微软公司,美国对互联网浏览量进行统计的康姆斯科公司公布统计数据称:微软 MSN 网站已接近雅虎,成为继美国在线之后,网民浏览人数排名第二的美国门户网站。
4.AOL (美国在线)是美国也是世界上最早的门户网站之一, 80% 是美国本土用户,其搜索结果全部来自于 Google 。也就是说,有良好的 Google 排名也有良好的 AOL 排名。
5.Lycos 是全世界最早的搜索引擎之一。根据媒体调查统计, Lycos 以月 3700 万次的独立访问排名第 5 大用户最常访问的网站。目前, Lycos 主要搜索结果来自于 Alltheweb 。
6. Ask 规模不大,但很有特色的搜索搜索。 Ask 是 DirectHit 的母公司,于 2001 年收购 Teoma 搜索引擎,并全部采用 Teoma 搜索结果。
7.Overture 是最早的付费搜索引擎(竞价排名搜索引擎)。搜索结果被 Yahoo, MSN 等采用。 Overture 收购了 Google 的对手 Inktomi 后被 Yahoo 收购,它开通了含约 32 亿文档的 “ 全球最大 ” ( Overture )的搜索索引服务,也是业界提供关键词标准流量的公司。
8.Netscape 由著名的浏览器公司网景公司开发的搜索引擎, Netscape 的搜索结果全部来自于 Google 。另外,全世界最大的开放式目录 DMOZ 录属于网景公司。
9.AltaVista 全世界最古老的搜索引擎之一,也是功能最完善,搜索精度较高的全文搜索引擎之一。截止 2002 年 6 月, AltaVista 宣称其数据库已存有 11 亿个 Web 文件,并且经过升级,其搜索精度已达业界领先水平。该搜索引擎已于 2003 年被 Yahoo 收购。
10.Inktomi 只对搜索引擎提供搜索结果。 2003 年被 Overture 收购。在 2004 年 Yahoo 开发自己全新的搜索引擎技术之前, Inktomi 还是全球第二大搜索引擎,其搜索结果被 Hotbot, MSN 等著名的网站采用。
11.HotBot 是比较活跃的搜索引擎,数据更新速度比其他引擎都快。网页库容量为 1.1 亿,以独特的搜索界面著称。该引擎已被 Lycos 收购,成......
问题三:中国主要的搜索引擎有哪几个? 百度(baidu)中文搜索引擎
全球最大中文搜索引擎。提供网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索、百度搜霸、搜索援助中心。
北大天网中英文搜索引擎
由北京大学开发,简体中文、繁体中文和英文三个版本。提供全文检索、新闻组检索、FTP检索(北京大学、中科院等FTP站点)。目前大约收集了100万个WWW页面(国内)和14万篇Newsgroup(新闻组)文章。支持简体中文、繁体中文、英文关键词搜索,不支持数字关键词和URL名检索。
新浪搜索引擎
互联网上规模 最大的中文搜索引擎之一。设大类目录18个,子目1万多个,收录网站20余万。提供网站、中文网页、英文网页、新闻、汉英辞典、软件、沪深行情、游戏等多种资源的查询。
雅虎中国搜索引擎
Yahoo!是世界上最著名的目录搜索引擎。雅虎中国于1999年9月正式开通,是雅虎在全球的第20个网站。Yahoo!目录是一个Web资源的导航指南,包括14个主题大类的内容。
搜狐搜索引擎
搜狐于1998年推出中国首家大型分类查询搜索引擎,到现在已经发展成为中国影响力最大的分类搜索引擎。每日页面浏览量超过800万,可以查找网站、网页、新闻、网址、软件、黄页等信息。
网易搜索引擎
网易新一代开放式目录管理系统(ODP)。拥有近万名义务目录管理员。为广大网民创建了一个拥有超过一万个类目,超过25万条活跃站点信息,日增加新站点信息500~1000条,日访问量超过500万次的专业权威的目录查询体系。
3721网络实名/智能搜索
3721公司提供的中文上网服务DD3721网络实名,使用户无须记忆复杂的网址,直接输入中文名称,即可直达网站。3721智能搜索系统不仅含有精确的网络实名搜索结果,同时集成多家搜索引擎。
360综合搜索引擎
问题四:搜索引擎名称有哪些 百度 GOOGLE 雅虎 有道 必应 搜狗 腾讯搜搜 还有一些不怎么出名的
问题五:中国的搜索引擎有哪些 1.百度搜索
百度是国内搜索引擎当之无愧的老大,大概占到63.55%的市场份额,“百度”二字源于中国宋朝词人辛弃疾的《青玉案・元夕》诗句:“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求,是目前国内最大的商业化全文搜索引擎。
2.360搜索
360搜索在国内可以算是老二,大致有21.84%的市场份额,至于为什么叫360搜索,就不解释了。今天进去的时候看到其页面变灰了,搜索了一下昆明才知道发生了“3・01”严重暴力恐怖事件,借用一句话:祈福昆明,愿逝者安息,生者坚强!
3.搜狗
去年,腾讯向搜狗注资4.48亿美元,并将其搜搜业务并入搜狗,搜狗国内排行老三,市场份额大致为10.53%,搜狗的名称取自2001年电影《大腕》里的幽默台词――“他们搜狐,我们搜狗,各搜各的!”。
4.谷歌
Google作为世界最大的搜索引擎,但由于某些原因退出中国之后,现今的国内市场份额大概为1.66%,在国内访问google会自动跳转至google,Google 在中国称之为谷歌,Google中国对“谷歌”的解释是 “播种与期待之歌,亦是收获与欢愉之歌”,并称此名称是经Google中国的全体员工投票选出。
5.搜搜
搜搜自去年并入搜狗之后,虽然仍可以搜索,但其搜索返回内容与搜狗已经完全一致,其市场份额大致为1.36%,09年9月3日之前其一直由Google提供技术支持,之后采用自主研发的搜索引擎技术,至于其名字有什么深意还真不太清楚。
6.必应
必应是微软推出的搜索引擎,英文名字是Bing,其在国内市场份额大致为0.56%,其中的必应图片很有特色,必应的默认首页背景是一张美图,中文名“必应”,取义有求必应。
7.雅虎
雅虎是全球第一门户搜索网站,1999年9月,中国雅虎网站开通。2005年8月,中国雅虎由阿里巴巴集团全资收购,2013年9月1日,中国雅虎宣布停止服务。外界有称阿里拟将雅虎中国归还美国雅虎,雅虎在国内份额为0.31%,英文名yahoo来源于格列佛游记第四卷:慧S国(Houyhnhnms)游记中提到的怪物雅虎。
8.有道
有道是网易自主研发的中文搜索引擎,2013年8月2日,有道搜索宣布与奇虎公司合作,由360搜索为有道搜索提供技术支持服务,自此网易正式放弃通用搜索领域争夺,国内市场份额大致为0.12%,有道名字来源于“君子爱财,取之有道”中的“有道”。
上面多是我们熟知的,而市场份额基本上也就没有了,至于其他的搜索引擎有很多,下面只找几个代表看看:
9.阿里云搜索
阿里巴巴公司下的搜索引擎,阿里云搜索返回的信息并不同于百度谷歌,作为电商企业旗下搜索引擎更趋于网购信息,想必阿里云搜索开发的目的就是提供给网购人群的一个专属搜索引擎。
10.即刻搜索,盘古搜索,中国搜索
“即刻搜索”的前身是人民网推出的“人民搜索”,是搜索行业国家队,与它同期诞生的,便是“盘古搜索”,是由新华通讯社和中国移动通信集团公司联手打造的搜索引擎,合并之后就是昨天刚上线的中国搜索,都是国家级搜索引擎...
11.新浪搜索
新浪搜索是面向华人的网上资源查询系统,提供网站、网页、新闻、软件、游......
问题六:搜索引擎有哪四大类,每一种类型的代表是那些搜索引擎 1.全文索引
全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。
2.目录索引
目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo!、新浪分类目录搜索。
3.元搜索引擎
元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
其他非主流搜索引擎形式
(1) *** 式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。
(2)门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。
(3)免费链接列表(Free For All Links,简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。
问题七:搜索引擎都有哪几种类型 搜索引擎主要分类,及特点:
一、全文索引
全文搜索引擎是目前广泛应用的主流搜索引擎,国外代表搜索是Google,国内则有最大中文搜索百度。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和360搜索就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。
二、目录索引
目录索引也称为:分类检索,是因特网上最早提供WWW资源查询的服务,主要通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。目录索引无需输入任何文字,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源。
三、元搜索引擎
元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
四、垂直搜索引擎
垂直搜索引擎为2006年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。
五、 *** 式搜索引擎
*** 式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。
六、门户搜索引擎
门户搜索引擎:AOLSearch、MSNSearch等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。
七、免费链接列表
免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。
希望可以帮助到你~望采纳哦~谢谢~ 看评论
问题八:全球较大的搜索引擎有哪些?(至少5个) google baidu bing yahoo soso
求采纳
搜索引擎是什么
搜索引擎是一个对互联网信息资源进行搜索整理和分类,并储存在网络数据库中供用户查询的系统,包括信息搜集、信息分类、用户查询三部分。
工作原理
1.爬行:搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”。搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。
2.抓取存储:搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全一样的。搜索引擎蜘蛛在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站上有大量抄袭、采集或者复制的内容,很可能就不再爬行。
3.预处理:搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。