Google不收录,四个不能躺入影响收录的雷区

对于SEO优化人员来讲最头疼的事莫过于网站不收录,从某种意义上收录等于流量,如果网页不收录代表用户无法通过搜索引擎发现其内容和信息,相反没有流量的网站将毫无意义。网站排名是一项系统计算的复杂化工作流程,而收录是决定排名的重要条件,如果网站出现不收录问题请参考以下分析的原因,相信只要加以修正,收录量一定蹭蹭涨。

Google不收录,四个不能躺入影响收录的雷区

一、网站内容原创度低

内容原创度是搜索引擎判断质量的依据之一,内容输出一直都是SEO工作人员的难题,毕竟长年累月坐在电脑前写作是一件非常消耗精力的事情,有的人为了省时省力复制网络摘抄采用掐头去尾的方式更新文章,或者截取其中一段,剩下的内容伪原创,这样的生产内容方式不可取,都会被Google认定为低质量内容,根据以往经验得出的结论,通常文章原创度最低限度需要达到75%。

如果网站大幅内容原创度低于75%,经过Google内部算法筛选认为内容重复度高,不能给用户带来更多搜索价值,因此网站会出现不收录或者收录没有排名的情况,因此创造独一无二的内容才会受搜索引擎的青睐。

Google不收录,四个不能躺入影响收录的雷区

二、网站采集内容

采集属于黑帽优化的范畴,Google反作弊算法技术在同行中名列前茅,请不要妄图使用采集同行网站获取自然排名,否则轻则降权,重则K站,相当于把网站列为数据库黑名单,因为网站已经有了前科,即便后期网站做出整改想恢复原初是一件很困难的事情。对于恶略的采集行为甚至连收录都不会用,发布即提示“已排除”,同时会把网站拉入底层数据库,即垃圾站。

网站的用途是搭建与用户沟通的桥梁,重在为用户提供价值的信息,如果彼此互相采集,搜索引擎呈现出来的全部都是重复内容,对于搜索用户而言毫无体验度,则失去搜索引擎存在的价值,如果连搜索引擎的生态环境都逐渐破坏,网站的前途又该何去何从?因此Google非常注重用户搜索体验度,对待违规网站向来强势打击。

Google不收录,四个不能躺入影响收录的雷区

三、网站内容更新频率

至于更新频率是否会影响网页收录的问题网上众说纷纭,从实践上考虑Google抓取频率确实影响收录的速度,Google通过智能蜘蛛程序抓取网页,提高网站更新频率会增加蜘蛛程序抓取网页的次数,即蜘蛛访问网页的频次或数量。一般形容为培养蜘蛛,如果蜘蛛每天访问网站的频次高,发布网页的URL被抓取的几率就会增大。

通常建议网站每天更新最佳,至少保证每周更新一次,实践证明网站长时间不更新,收录会出现停滞状态,这是因为蜘蛛更新访问网站的次数减少,可以查看网站日志分析蜘蛛抓取的频次判断影响收录的因素。

Google不收录,四个不能躺入影响收录的雷区
198.11.137.36 - - [07/Jan/2022:09:39:57 +0800] "POST //xmlrpc.php HTTP/1.1" 200 414 "http://www.google.com.hk" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36"
198.11.137.17 - - [07/Jan/2022:09:40:44 +0800] "GET /atom.xml HTTP/1.1" 404 8586 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"
163.181.32.185 - - [07/Jan/2022:09:41:07 +0800] "POST /wp-login.php HTTP/1.1" 200 2786 "-" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Safari/537.36"
198.11.137.42 - - [07/Jan/2022:09:41:38 +0800] "POST //xmlrpc.php HTTP/1.1" 200 414 "http://www.google.com.hk" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36"
163.181.32.171 - - [07/Jan/2022:09:41:51 +0800] "POST /wp-admin/admin-ajax.php HTTP/1.1" 200 109 "https://www.zb-2.com/wp-admin/post.php?post=5075&action=edit" "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36"
198.11.137.28 - - [07/Jan/2022:09:41:58 +0800] "POST //xmlrpc.php HTTP/1.1" 200 414 "http://www.google.com.hk" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36"

四、确认robots文件是否屏蔽收录

robots是搜索引擎与网站之间的抓取协议,通常网站后台,会员等隐私页面为了提高安全性,减少Google抓取的配额会选择屏蔽搜索引擎抓取,把收录规则写在robots文件。搜索引擎会先访问robots文件,按照robots规则开始抓取工作。

很多新手容易犯的低级错误,robots协议禁止搜索引擎抓取,网站自然不会有收录,或者之前因为某种原因禁止收录,后面忘记更改,如果网站没有收录应该排查robots文件的写法是否存在错误。

//WordPress robots txt的正确写法

User-Agent: *
Allow: /wp-content/uploads/
Disallow: /wp-content/plugins/
Disallow: /wp-admin/
 
Sitemap: https://example.com/sitemap_index.xml
//通用的robots txt的正确写法,允许所有搜索引擎访问任何资源

User-agent: *
Allow: /

根据多年的网站优化经验分析,网站不收录的原因80%原因都出自内容,如果想提高自己网站的收录,应该把重点放在内容创作上面,内容是一个网站的灵魂,就像人的灵魂一样,要有自己的主见,内涵代表着智慧,拥有智慧的网站才能给你创造价值。

原创文章,作者:谷歌小杨,如若转载,请注明出处:https://www.zb-2.com/5075.html

(0)
上一篇 2022年1月7日 上午9:04
下一篇 2022年1月8日 上午10:43

相关推荐

发表评论

您的电子邮箱地址不会被公开。