Post by account_disabled on Jan 23, 2024 1:32:50 GMT -8
星期五| 白板 搜索引擎优化基础知识 作者的观点完全是他们自己的(不包括催眠这一不太可能发生的事件),并且可能并不总是反映 Moz 的观点。 在本周的《Whiteboard Friday》节目中,主持人 Jes Scholz 深入探讨了搜索引擎爬行的基础。她将向您展示为什么没有索引问题并不一定意味着根本没有问题,以及在爬行时质量如何比数量更重要。 概述 SEO 爬行基础知识的信息图 单击上面的白板图像可在新选项卡中打开高分辨率版本! 视频转录 美好的一天,Moz 粉丝们,欢迎来到另一期 Whiteboard Friday。我叫 Jes Scholz,今天我们要讨论所有爬行的东西。重要的是要理解,抓取对于每个网站都至关重要,因为如果您的内容没有被抓取,那么您就没有机会在 Google 搜索中获得任何真正的可见性。 因此,当你认真思考时,就会发现爬行是基础,而这一切都基于 Googlebot 有点善变的关注。很多时候人们说如果你有爬行问题的话真的很容易理解。
您登录到 Google Search Console,转到排除报告,然后查看是否处于已发 目标电话号码或电话营销数据 现但当前未编入索引的状态。 如果你这样做,你就会遇到爬行问题,如果你不这样做,你就没有爬行问题。在某种程度上,这是事实,但事情并不那么简单,因为这告诉您的是,您的新内容是否存在抓取问题。但这不仅仅是让您的新内容被抓取。您还希望确保您的内容在显着更新时被抓取,而这不是您在 Google Search Console 中看到的情况。 但是,假设您已经刷新了一篇文章,或者您已经完成了重大的技术 SEO 更新,那么只有在 Google 抓取并处理该页面后,您才会看到这些优化的好处。或者另一方面,如果您进行了重大的技术优化,但它没有被抓取,并且您实际上已经损害了您的网站,那么在 Google 抓取您的网站之前,您不会看到损害。 因此,从本质上讲,如果 Googlebot 爬行缓慢,您就无法快速失败。因此,现在我们需要讨论以一种真正有意义的方式测量抓取,因为,当您登录 Google Search Console 时,您现在会进入抓取统计报告。您会看到爬网总数。 我对任何说你需要最大化爬行量的人都抱有很大的异议,因为爬行总数绝对只是一个虚荣指标。如果我的爬行量增加了 10 倍,这并不一定意味着我对我关心的内容的索引增加了 10 倍。 它与我的服务器上的重量增加有关,这会花费你更多的钱。
所以这与爬行的数量无关。这是关于爬行的质量。这就是我们需要开始测量抓取的方式,因为我们需要做的是查看创建或更新内容之间的时间以及 Googlebot 抓取该内容所需的时间。 创建或更新与第一次 Googlebot 抓取之间的时间差,我称之为抓取效率。所以衡量爬行效率应该是比较简单的。您进入数据库并导出创建时间或更新时间,然后进入日志文件并获取下一次 Googlebot 抓取,并计算时间差。 但让我们面对现实吧。对于我们很多人来说,访问日志文件和数据库并不是最容易的事情。所以你可以有一个代理。您可以做的是,您可以从 XML 站点地图中查看您从 SEO 角度来看您关心的 的上次修改日期时间,这是唯一应该出现在 XML 站点地图中的 URL,您可以去从 URL 检查 API 查看上次抓取时间。 我真正喜欢 URL 检查 API 的是,对于您正在主动查询的 URL,您还可以在索引状态发生变化时获取索引状态。因此,有了这些信息,您实际上也可以开始计算索引功效分数。 因此,看看您何时完成重新发布或何时完成第一次发布,Google 需要多长时间才能对该页面建立索引?因为,实际上,没有相应索引的爬行并没有真正的价值。因此,当我们开始研究这一点并计算出实时时间时,您可能会发现从您创建或更新网址到 Googlebot 抓取它的时间在几分钟内,可能是几小时,可能是几天,也可能是几周。 如果这是一个很长的时间段,我们实际上能做些什么呢?嗯,搜索引擎及其合作伙伴在过去几年中一直在谈论他们如何帮助我们作为 SEO 更有效地抓取网络。地被抓取和索引。
您登录到 Google Search Console,转到排除报告,然后查看是否处于已发 目标电话号码或电话营销数据 现但当前未编入索引的状态。 如果你这样做,你就会遇到爬行问题,如果你不这样做,你就没有爬行问题。在某种程度上,这是事实,但事情并不那么简单,因为这告诉您的是,您的新内容是否存在抓取问题。但这不仅仅是让您的新内容被抓取。您还希望确保您的内容在显着更新时被抓取,而这不是您在 Google Search Console 中看到的情况。 但是,假设您已经刷新了一篇文章,或者您已经完成了重大的技术 SEO 更新,那么只有在 Google 抓取并处理该页面后,您才会看到这些优化的好处。或者另一方面,如果您进行了重大的技术优化,但它没有被抓取,并且您实际上已经损害了您的网站,那么在 Google 抓取您的网站之前,您不会看到损害。 因此,从本质上讲,如果 Googlebot 爬行缓慢,您就无法快速失败。因此,现在我们需要讨论以一种真正有意义的方式测量抓取,因为,当您登录 Google Search Console 时,您现在会进入抓取统计报告。您会看到爬网总数。 我对任何说你需要最大化爬行量的人都抱有很大的异议,因为爬行总数绝对只是一个虚荣指标。如果我的爬行量增加了 10 倍,这并不一定意味着我对我关心的内容的索引增加了 10 倍。 它与我的服务器上的重量增加有关,这会花费你更多的钱。
所以这与爬行的数量无关。这是关于爬行的质量。这就是我们需要开始测量抓取的方式,因为我们需要做的是查看创建或更新内容之间的时间以及 Googlebot 抓取该内容所需的时间。 创建或更新与第一次 Googlebot 抓取之间的时间差,我称之为抓取效率。所以衡量爬行效率应该是比较简单的。您进入数据库并导出创建时间或更新时间,然后进入日志文件并获取下一次 Googlebot 抓取,并计算时间差。 但让我们面对现实吧。对于我们很多人来说,访问日志文件和数据库并不是最容易的事情。所以你可以有一个代理。您可以做的是,您可以从 XML 站点地图中查看您从 SEO 角度来看您关心的 的上次修改日期时间,这是唯一应该出现在 XML 站点地图中的 URL,您可以去从 URL 检查 API 查看上次抓取时间。 我真正喜欢 URL 检查 API 的是,对于您正在主动查询的 URL,您还可以在索引状态发生变化时获取索引状态。因此,有了这些信息,您实际上也可以开始计算索引功效分数。 因此,看看您何时完成重新发布或何时完成第一次发布,Google 需要多长时间才能对该页面建立索引?因为,实际上,没有相应索引的爬行并没有真正的价值。因此,当我们开始研究这一点并计算出实时时间时,您可能会发现从您创建或更新网址到 Googlebot 抓取它的时间在几分钟内,可能是几小时,可能是几天,也可能是几周。 如果这是一个很长的时间段,我们实际上能做些什么呢?嗯,搜索引擎及其合作伙伴在过去几年中一直在谈论他们如何帮助我们作为 SEO 更有效地抓取网络。地被抓取和索引。