1、不包括:
首先看网站的质量,也是蜘蛛对你网站的友好程度,其次是高重复率(判断:随机复制一段文章,百度搜索,然后再看红色率),如果是比较好的原创。比较直接的方式是查看百度蜘蛛IP部分的网站日志,下面是优帮云小编整理的供大家参考:
二、分层目录优化
url层次结构是网站的链接地址结构。一条代表一层。层次太深,无法优化,蜘蛛抓不住。通常,建议url层次结构不应超过第三级结构。例如,www,home page.com/column/details.html。
三、如何使主页在搜索时抓取图片(在新站点抓取徽标的提示)
建议:
1、抓取首页图片具有查看原始网页的功能,主要是查看首页3:2比例图片是否具有alt属性,有助于蜘蛛识别图片。
2、一般情况下,网站头部左侧会有网站标志。对于想直接抓取logo的新网站,尽量不要把网站头部左侧的logo和头部中间或右侧的logo连接成一张完整的图片。在建立一个新的网站时,我会要求程序员将左边的标志从中间和右边分开(即三个平行的布局,有些网站左边有lo)。右边是联系信息(两列中间为空),大小比为3:2或1:1。在这种情况下,蜘蛛在入口处遇到的比较好的一张图片是网站徽标,可以直接抓取到徽标(蜘蛛抓取页面的顺序是左上右下循环的顺序),因为这是蜘蛛进入网站(体验它))。本站的logo、首页快照在接下来的几个月内经过n次更新抓拍到首页上的其他图片,)这样做的目的是让新站上线后很快就可以依靠人为因素和标签属性来抓取网站logo,当然,在后期R做好网站内容的时候,标志权自然会来的。
为了避免快照更新后期更换站点徽标的问题,我们可以在徽标外部添加一个h1标记,这样更方便直接用新站点抓取站点徽标搜索显示,不会因为快照更新而被其他图片替换。
四、谈网站不包括的问题
1、虽然有些网站耗时较长,但页面内容的质量却很差,也就是说,它们是被别人复制粘贴的。百度蜘蛛判断他们是垃圾。(建议:不要在别人的网站上复制过多的页面,多可以复制两句话,然后重复几句话形成一篇文章,可以尝试用伪原创的工具来弥补,然后稍微修改开头和结尾)
2、不收录在内,如果网站没有其他问题,主要原因是网站的内容都是收藏的,即使是伪原创也没有。怎么可能包括你,要复制粘贴的原始版本可以排名。别人主次写原创作品对别人有多不公平?所以不要想什么都不付,因为如果你不前进,你就会倒退。
3、网站的服务器在海外使用,这也是禁忌。一般建议使用国产服务器。
五、图片优化
一般3:2就可以了,比如:600*400,还有alt属性描述。因为搜索引擎不知道图片。alt是蜘蛛对图片名称的判断和识别,尽量让蜘蛛在你的文章中识别图片,这样你的图片在百度图片中就能更好的显示和识别,有利于图片优化,对于一些喜欢直接看图片的用户来说可以也可以直接点击图片输入原始图片。