1、抓取网页:每个独立的搜索引擎都有自己的网页抓取程序(spider,即通常所说的“蜘蛛”程序)。Spider顺着网页中的超链接,连续地抓取网页。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的无锡网站优化,它会自动提取网站的信息和网址加入自己的数据库。 另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定期向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。
2、处理网页:搜索引擎抓优化到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他的操作还包括去除重复网页、分析超链接、计算网页的重要度等等。
3、提供检索服务:用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息等。
二、搜索引擎优化(SEO)简介
SEO是英文Search Engine Optimization的缩写,中文意思即是搜索引擎优化。SEO的主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。
三、国内各搜索引擎的使用率分析
百度搜索:72.25% GOOGLE搜索:17.05%
QQ搜索:4.36% 雅虎搜索:3.31%
搜狐-搜狗:1.81% 其它搜索引擎:1.22%
四、针对搜索引擎的优化方案
1、源代码分析:对整个网站做如下检查:(1)是否在整个网站的首要关键词上面使用了<H1>标签;(2)在<Title>标签里是否包括了与网站内容相关性较大的关键词;(3)是否利用了加粗、下划线或斜体等来突显关键词;(4)是否使用了图片注释<Alt>属性来有效地说明图片内容;(5)在文章开始的地方和结束的地方是否使用了关键字。这些分析将帮我们了解我们的网站建设在搜索引擎经常收录的地方是否完善,以便于我们进进下步的优化操作。
2、关键词短语选择:(1)使用一个容易被搜索到的关键词,不一定非要是热门关键词,确保这个关键词与网页内容具有相关性。(2)在文本中添加与关键词相近的关键词短语。(3)在title中放置关键词,如:<title>关键词</title>。(4)在页面开始处放置一个<h1>关键词</h1>,关键词相近的短语可以放在<h2><h3>中,<h1><h2><h3>中所用的主要关键词在title中最好都有,如果有很多关键词需要优化,建议分成多个页面优化,如果关键词比较热门,建议一个页面最多优化2~3个主要关键词。
3、<Title>标签优化:网页<Title>标签里的内容对搜索引擎的收录来说非常关键,因此,<Title>是优化关键词最重要的一部分,每一个页面应该有2-3个不同的主要关键词,这几个关键词最好在该网页中位置越靠前越好,一般情况下建议<Title>不超过75个字符。