搜索引擎爬虫眼中的网站

发布时间:2014-11-11 14:08:16 来源:   编辑:baidu-sh 浏览:1567次
我们平时花了大量的时间来优化我们的网站,但是如果不按照搜索引擎制定的规则来优化我们的网站,即使再细致入微的优化,也不一定能够保证我们的网站会有好的搜索排名,搜索引擎经常会无视我们辛辛苦苦的努力成果。在这里我们提供一种检测SEO是否有效的方法,那就是使用搜索引擎模拟器。
   蜘蛛行为解释
    近乎所有的搜索引擎蜘蛛的功能都遵循着相同的原则–他们爬行网站、索引页面,然后将爬取的内容存放到数据库里,之后用不同的算法决定这这些被爬回页面的pagerank, 相关度等等信息。各搜索引擎在计算pagerank和相关时,采用的算法不尽相同,但是他们索引和爬行网站的方式基本是一致的。对于我们来说,我们需要知道什么内容是蜘蛛感兴趣的,什么内容蜘蛛完全无视。
    搜索引擎蜘蛛是一种机器人程序,它们不会像人类一样阅读网页,而是被设计成只能看见一类内容,而对于其它内容则完全视而不见(例如Flash,JavaScript脚本)。
    因为蜘蛛决定了人们是否能够找到你的网站,所以了解蜘蛛的喜好是很值得的,而哪些内容会被搜索蜘蛛无视呢?
    蜘蛛的喜好
    搜索引擎蜘蛛无法识别Flash ,JavaScript以及图片中的文字。而Frames完全是SEO的一场灾难。上面这些元素对于实现网页的设计效果非常有用,但是从搜索引擎的角度来看使用它们是完完全全是错的。一个最常见的错误,人们喜欢用一个Flash作为网站的介绍界面,并且关键词被埋葬在动画里。当你使用搜索引擎模拟器工具去爬行一个带有Flash或者图片的网站的时候,你会发现它爬回的内容几乎是空白的。
    通过使用模拟器去爬行你的网站,你会发现实际上Flash和JavaScript不是受蜘欢迎的。蜘蛛就像一个纯文字的浏览器,它几乎看不到任何文字以外的东西。所以蜘蛛会完全无视图片中的文字,这些文字对于蜘蛛来说没有任何意义。一个变通的方式是把图片的有意义的描述信息放到<IMG>标签的ALT属性里,但是千万不要在里面放太多的关键词,否则会遭受到处罚。你也可以用ALT文字描述一个Flash电影,但是切记,不要放太多关键词。
    你的链接能被蜘蛛爬到吗?
    搜索引擎模拟器对于你识别链接是否被放在正确的位置非常有帮助。例如,在做链接交换时,很多网站会使用javascript放一个虚假链接指向你的网站(通过鼠标悬浮事件,这会让链接看起来很好看)但是实际上,这些链接搜索引擎是看不到的。通过蜘蛛模拟器爬取,你会发现无法显示出这些链接的,你会发现其实这些链接是错误的。
    我们推荐您使用<noscript>标签,而不是使用javascript基于的菜单。原因在于javascript基于的菜单,不能被蜘蛛很好的识别,它内部的所有链接会被识别为页面文字,而不是链接。解决方法是把所有的菜单项链接放到<noscript>标签里。但请不要把它用在别的SEO操作上。
    寻找你的关键词
    搜索引擎模拟器可以帮助你以蜘蛛的角度查看关键词在一个页面文本中的位置。为什么这么重要呢?因为一个网页中处于第一段中的关键字的权重要高于处于中间或者结尾段中的关键词的权重。一个在于我们眼中处于网页顶端的关键词,在html代码中,也许未必处于最开始的位置。
    在过去,<META>标签中的关键字与描述,对于决定页面的相关性至关重要,但是现在的搜索引擎采用了其它替换的机制来决定相关性了。所以你完全可以忽略掉<META>标签中的关键词及描述。
    动态页面
    动态网页也不是搜索引擎喜爱的,虽然有些搜索引擎被设计为可以抓取动态网页,但是我们并不确定一个动态页面被搜索引擎接受的程度,使用模拟器可以让我们更好的了解这一点。



上海百度推广-由上海企垣网络科技有限公司主办,只在提供良好的网站服务,网站培训和一站式电子商务平台, 欢迎洽谈咨询电话:138-1857-8692 上海网站推广



Copyright © 2000 - 2015 上海网站建设,为您提供良好的网站服务.联系方式 QQ 108612998 为您打造精品企业网络平台.www.baidu-sh.com 上海网站建设