网站页面收录分析
无论是使用site:命令,还是使用搜索引擎的统计工具获得的页面收录数据的精确性都是有待考证的,但是却可以作为网站分析的一个参考数据,从现象看本质。根据”网站SEO优化诊断之准备篇“文中所分享的方法,我们使用模拟工具Screamingfrog/Xenu’s Link Sleuth或者通过网站的XML地图都能大概的知道网站所包含的实际页面数量。(当然啦,如果方便直接问技术最好啦!)对比网站的实际页面数量以及网站被搜索引擎收录数量,可能遇到以下三种情形:a) 网站实际页面数量与收录量基本相同。
这是最理想的情况,如果出现以上情况则说明搜索引擎能很好的爬行并抓取网站上的所有信息。
b) 网站实际页面数量远大于收录量。
如果收录量远小于网站的实际页面数量,说明网站必然存在这样或者那样的问题导致有价值无法被正确收录。(排除网站被K或者搜索引擎大更新)这时在“网站SEO优化诊断之网站抓取分析”中提到的分析网站抓取情况的数据就能为我们所用了,我们能快速找出问题原因:是网站重点内容使用JS还是被robots等屏蔽了搜索引擎蜘蛛。
c) 网站实际页面数量远小于收录量。
如果网站的收录量远大于网站的实际页面数量,说明网站存在严重的重复页面问题。了解问题所在,便能在优化过程中有的放矢,有针对性的对网站进行优化。
如何确认是否网站真的存在重复问题?我们可以通过修改site:命令的结果URL中的参数,(百度修改为“pn=结果数建议改为990”,谷歌修改参数“start=结果数建议改为990”)直接跳转到最后一个搜索结果页面。
内容很有深度,不是表面功夫,值得细细品味 这个思路很新颖,打开了新世界的大门,谢谢分享 这个方法简单实用,性价比很高,推荐尝试 分析全面,方方面面都考虑到了,很用心 这个问题值得好好讨论下 看完很有启发,以后遇到类似情况就知道怎么处理了 内容很接地气,普通人都能轻松理解和应用 楼主说的太对了 刚好遇到类似问题,看完这个帖子心里有底了 我也来分享下我的经验,和楼主的方法可以互补 关注这个话题很久,看过不少相关内容,你的总结算是最全面、最贴合实际的之一。
页:
[1]