谷歌如何收录出海独立站
随着经济环境变化,企业出海,变成了一个不可逃避的话题,随之而来的独立站运营也就显得尤为重要,下面文章我们来分析下,全球最大搜索引擎谷歌,如何收取你的独立站,并且呈现给全球的客户,知其所以然,你才能更好的进行搜索引擎优化,打造“赚钱的核动力机器”
抓取
其实谷歌理解你的网页没有多神秘,就和你自己看网页是一样的,他通过一个叫做爬虫的脚本,使用get方法获取到你的网页,对比理解就是你打开了网页,然后切记,他会通过代码获取你的html源代码,所以这里有一个大坑,如果你是前端渲染,比如vue、react这种,因为它们是通过js渲染出页面内容,简单说html代码是空的,所以搜索引擎什么内容都抓不到,也就谈不上收录和排名了
解析
获取到html代码后,谷歌内部进行数据解析,提取到征文、页头、页尾、Meat等数据,切记,页面上所有链接都会被提取出来。
索引
将解析出来的数据进行分词、抽取主题、易于理解、建立正反索引,这一步就是通过页面信息理解你的网页是做什么的,并且根据解析出的内容进行打分
链接处理
遍历抓取链接,判断是否为爬取过链接,如果没有爬取过的放入待爬列表,进入待爬列表中链接,重复上面操作,通过这种方式,爬虫就建立了关于你的网站所有涉及的链接的关系网。
根据这一点 ,一个小技巧就是,想让谷歌快速收录你,去谷歌爬虫频繁爬取的地方,发送你的外链,是常用手段。
内链与外链
内链,是站内链接的简称,是指向到当前网站其它页面的链接。
外链,是站外链接的简称,又名出站链接,是指向到别的网站的链接。
Sitemap
简单来说,为了表示你对爬虫的欢迎,和方便爬虫快速收录你,就不麻烦他老人家自己一个个去爬了,你写好了一个你自己网站的所有链接的列表,让他只关注这一个文件就快速爬取完。
当然,这个是你的好意,谷歌不一定这么做,或者全这么做,他可能只是自己去爬取所有链接。
页面深度
页面深度的意思就是从首页开始点击,要点击多少次才能看到最终的页面。市面上给的官方建议是不超过5层,但我们建议不超过3层,也就是你保证你的所有页面一定不要超过3次点击就一定能让人看到。
如果遇到就是很多很深的页面,常规解法是,在你的页脚独立给出链接入口
权重传递
权重,其实就是谷歌对你这个页面,这个网站的重视程度,程度越高,收录越好。这种重视,会在站内传递,也在网站间传递。
一般站内链接都是 do follow 的,也就是会完全传递权重,而外链则为了不传递太多权重出去,我们会设置为 no follow 。
谷歌有自己的一套复杂的算法,会综合各种情况去计算每一个链接能够传递的权重到底是多少。
本文 zblog模板 原创,转载保留链接!网址:http://fsxxzx.com/post/52.html
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。