(一)优化采集策略和数据来源
对于垂直搜索引擎的采集策略来说,必须不同于通用搜索引擎的采集策略。从互联网中准确快速提取出本行业的数据,关键词是一个很关键的因素,所以必须和该行业的专业人士进行沟通,由他们提供基于本行业的关键词。另外,用户也可以向搜索引擎提交关键词,在管理员审核通过的情况下,也添加进入关键词序列,定期对关键词整理,去除使用频率低的关键词,并添加新近出来的新词。在有一个维护良好的新词表的基础上,优化策略就有了一个好的开始。由于现在网页html语言越来越规范化,这也给采集带来了方便。根据研究发现,一个网页的主题决定了一个网页的内容,也就是在之间的部分,只要通过网络蜘蛛先抓部分的内容,之后再将抓取的部分和关键词列表进行对比,如果主题里含有关键词超过规定的阈值,就继续抓取,否则,就放弃抓取。这种改进的抓取策略可以有效地改善抓取的效率和准确度。
(二)搜索排名与搜索结果的用户满意度不一致
垂直搜索引擎广告收入是其收入的巨大来源,而竞价排名方案是其广告的主要模式,但是竞价排名模式是根据广告客户购买关键词的出价多少来决定该关键词的查询结果的排列顺序,这就带来了一系列问题。出价高的网页就排列在前,出价少或没有出价的网页就必然会被排列在后。根据统计研究表明,一般用户使用搜索引擎的习惯是只看到第三页,后面的搜索结果对用户来说是没有意义的,这就可能导致用户搜索后无法得到他想要的结果,或者要经过更多次的翻页才能找到需要的网页,而排列在前面的那些出价很高的网页对他的价值不一定高于那些出价少排列在后的网页。这就极大地破坏了用户体验,干扰了用户的信息获取。如果无法在广告和信息准确度做出均衡,一味地根据广告费用来决定页面的排列方式,这将会带来用户的不信任,进而用户会大量流失,失去用户的互联网企业,是没有生存空间的,但是没有广告收入,对垂直搜索行业也是无法承受的。所以,如何对广告和用户体验综合调整,尽可能让广告客户获得广告效益,又使得用户获得满意的搜索结果是亟待解决的问题。
(三)与相关行业联系度低
垂直搜索引擎发展至今,对通用搜索引擎的模式进行了大量克隆。但是,因为通用搜索引擎面向的是所有行业,各种行业在通用搜索引擎看来,没有高下之分,而对于垂直搜索引擎,这方面就完全不同于通用搜索引擎。如果垂直搜索引擎不能和所面向的行业进行紧密结合,就无法获得与通用搜索引擎的差异化优势。目前垂直搜索引擎的数据采集还是通过网络蜘蛛在互联网上进行爬行,抓取页面,进而分析关键词,获取行业数据,还是停留在传统的搜索引擎抓取数据的方式,这就导致最后的用户查询和在通用搜索引擎上的查询效果并无二致,这种情况肯定无法吸引用户,也无法发挥自己专业查询的优势。而且由于对该行业的了解无法深入,和该行业的从业人员也不能进行有效的沟通,自然无法了解该行业的真正需求。虽然表面看来有模有样,但只是一个披着行业外皮的通用搜索引擎,无法设计出行业需求的功能模块,自然无法吸引行业客户投入广告或者分享数据。
促进垂直搜索引擎发展的对策
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。