什么叫垂直搜索?
垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。
垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。
整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。
垂直搜索引擎的岁咐应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。
举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。
垂直搜索引擎大体上需要以下技术
1.Spider
2.网页结构化信息抽取技术或元数据采集技术
3.分词、索引
4.其族雀乱他信息处理技术
垂直搜索引擎的技术评估应从以下几点来判断
1.全面性
2.更新性
3.准确性
4.功能性
垂直搜索的进入门槛很低,但是竞争的门槛很高。没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有技术优势的,绝对不要想像着招几个人就可以搞定垂直搜索的全部技术,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂兆档直搜索成功的重要因素之一。
搜索引擎、目录搜索引擎、垂直搜索引擎是什么意思?
搜索引擎简单的来说,就是百度,360,搜狗,神马等浏览器;目录搜索引擎:是在一个网站或者一个平台上的一个搜索,是人工方式或者半自动方式收集起来的,按目录分类的网站链接列表,虽然有搜索功能,但严格意义上并不能称他为真正的搜索引擎;垂直搜索引擎:是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是根据用户的特定搜索请求,对网站(页)库中的某类专门信息进行深度挖掘与整合后,再以某种形式将结果返回给用户。垂直搜索引擎也常常被称为专业搜索引擎、专题搜索引擎。
什么是垂直搜索?
(1)垂直网站:
和第一代大而全的水平网站(又称综合性网站)不同,垂直网站注意力集中在某些特定的领域或某种特定的需求,提供有关这个领域或需求的全部深度信息和相关服务,作为互连网的新亮点,垂直网站正引起越来越多人的关注。在越来越多的网络吸引老百姓的誉伏注意力时,网民却逐渐走出时髦、好奇的初级阶段,不断在网上寻找着实际、实用和实惠。正因为认识到这一点,赛诺爱在目前开通的5个频道:房频道、缘频道、职频道、PC频道和车频道中,提供的服务都是实实在在的,就如同他所提出的口号“真实的乱虚卜网络、实在的生活”一样,SINOi强调服务的深入、具体、全面、实用,对老百姓的服务体贴入微,这也是垂直网站的好处.
(2)垂直搜索:
垂直搜索对于消费者的意义是显而易见的。随着互联网用户和网上的内容急剧增长,通用信息源向专用信息源的过渡是很自然的。利用Baidu、Goole寻找一辆二手车就象是在玻璃花瓶中寻找一粒沙子,那么有没有单刀直入,一招中的的方法呢?这就要寄希望于新兴起来的垂直搜索。搜索领域有句明言:就是用户无法描哗穗述道他要找什么,除非让他看到想找的东西。这个过程有点像找对象,“碰运气”是用户搜索行为的最大的特征。而垂直搜索引擎就是帮助用户提升“运气”。