How to enable Crawler Hints – IndexNow for my website

每天都有大量的网站被生产出来。因此,想要在最新内容刚一发布上线,就将这些内容索引下来的搜索引擎有必要更新下他们获取索引的方式。 Cloudflare 很高兴地宣布他们已和微软必应以及 Yandex 合作来支持 IndexNow.

Cloudflare 的支持从他们在第一个 Impact Week 宣布的 Crawler Hints initiative 而开始。 Crawler Hints 这项服务旨在提高网络爬虫的运行效率,这些爬虫的流量大约占了互联网流量的45%. Cloudflare 通过确保爬虫能够知道他们之前爬取到了什么,以及再次爬取某个网站的内容是否有意义,而达到了前面所述的效率改进。

Cloudflare 最近宣布了针对 Crawler Hints 的两个令人兴奋的更新: Crawler Hints 现已支持 IndexNow, IndexNow 这项协议可以让网站在每次产生了新内容,有更新或者内容被删的时候通知搜索引擎。通过和微软、Yandex 合作,Cloudflare 可以大幅改善他们搜索引擎的基础设施、客户的源服务器和互联网的效率。

现在,所有的 Cloudflare 用户都可免费使用 Crawler Hints. 用户点一下鼠标,就可获得这些更有效率的爬虫带来的好处。如果你想要开启 Crawler Hints, 可以在控制面板里的 Cache Tab 来实现。

Crawler Hints 解决了什么问题:

爬虫帮互联网运作起来。为了提供更好的依赖于全网内容建立索引的搜索体验,搜索引擎操控爬虫网络去爬取互联网,找出和用户的查询最相关的内容。但因为网上内容一直在变,并且没有“中央结算中心”来通知这些变化发生的时间,搜索引擎爬虫的工作成了西西弗斯的任务 ( Sisyphean task). 他们必须在网上不停得徘徊,找出究竟多久应该检查下某个给定网站,看看有没更新。

运营搜索引擎的公司很努力的想要让这个过程尽量的高效,“推动”最先进的爬取节奏和基础设施效率。但仍旧有明显的浪费:多余的爬取。

Cloudflare 的流量来自于各大主流搜索的爬虫,过去两年也在研究这些爬虫在网页没有更新之后多久会再次爬取。每次爬取都是浪费。不幸的是我们的观察表明,53%的爬虫流量都被浪费了。Crawler Hints 旨在提高相关爬取的比例,限制那些找不到新内容的爬取,改善用户体验并且减少重复的爬取。

想要了解更多 Crawler Hints, 看 Cloudflare 的原文

什么是 IndexNow?

IndexNow 是微软和 Yandex 写得新协议。 标准旨在提供一个高效的方式来通知搜索引擎和爬虫,何时应该爬取内容。

用最简单的方式,IndexNow 是一个简单的 Ping, 让搜索引擎知道某个 URL 和它的内容被添加、更新或者删除了,让搜索引擎可以快速的在搜索结果中体现出这些变化。

简单地按下按钮为你的网站开启 Crawler Hints, Cloudflare 就会通过 IndexNow 协议去通知这些搜索引擎何时网站内容发生了更新。其他的你什么都不需要做。

这对搜索引擎的运营者意味着什么呢?你将能收到几乎是即时的,推送过来的网站事件更新。这不仅能大大改善搜索结果,还能提高爬虫的能量使用效率。

怎么给网站开启 Crawler Hints - IndexNow

  1. 登录 Cloudflare 账号,(选择对应网站)
  2. 找到 Caching tab
  3. 点击 配置 configuration 区域
  4. 找到 Crawler Hints, 开启

enable crawler hints in cloudflare

注:

  • 如果你的网站没有使用 Cloudflare 做解析的话,这篇文章不适用。
  • 这是一个翻译练习,原文链接:https://blogs.bing.com/webmaster/november-2021/Cloudflare-Supports-IndexNow-via-one-click-Integration

评论

看看别的

在 Book Depository 上买书的曲折经历

夜爬华山

卖保险的电话