Google Adsense 确保您的 ads.txt 文件可被抓取

一旦您的网域上设置了 ads.txt 文件,Google 抓取工具就会执行以下操作:

  • 尝试抓取该文件。

  • 解析该文件的内容,以确定有权通过您的广告资源获利的卖家 ID。

注意:ads.txt 更改可能需要过几天才能应用到 AdSense 中。如果您的网站提交的广告请求较少,则最多可能需要一个月的时间。

为确保您的 ads.txt 文件能够被抓取,我们建议您完成以下问题排查步骤。

确认文件未出现暂时不可用的情况

如果先前看到的 ads.txt 文件在后续重新抓取时不可用,则先前看到的条目将会出现以下情况:

  • 如果响应为硬 404 错误(网页实际不存在;HTTP 404 状态),将被完全清除。

  • 如果响应为软 404 错误(针对实际不存在的网址返回实际网页;HTTP 200 状态)或服务器错误 500,将被保留最多 5 天。

确认文件可以通过根域访问

从 domain.com/ads.txt 到 www.domain.com/ads.txt 的重定向相当常见。Ads.txt 的抓取将从根域开始,而根域需要从 ads.txt 文件返回或重定向到 ads.txt 文件。

www.domain.com/ads.txt 上的 ads.txt 文件只有在 domain.com/ads.txt 重定向到它时才会被抓取。

确保抓取操作不被 robots.txt 禁止

如果某个网域中的 robots.txt 文件不允许以下任意一项,则抓取工具可能会忽略该网域的 ads.txt 文件:

  • 抓取用于发布 ads.txt 文件的网址路径。

  • 抓取工具的用户代理。

确保返回的文件具备 HTTP 200 OK 状态代码

虽然对 ads.txt 文件的请求可能会在响应正文中返回文件内容,但是如果响应标头中的状态代码指示未找到该文件(例如状态代码 404),则:

  • 系统将会忽略该响应。

  • 该文件将被视为不存在。

确保该文件具备 HTTP 200 OK 状态代码。

确保文件中没有格式错误或无效字符

格式错误(例如无效的空白字符)可能难以检测,但却会使 ads.txt 文件难以被抓取工具解析,从而可能导致文件被忽略。请避免从富文本编辑器复制和粘贴 ads.txt 条目;我们推荐使用纯文本编辑器。

创建通过 HTTP 和 HTTPS 均可访问的 ads.txt 文件

无论在 HTTP 上还是 HTTPS 上,Google 抓取工具都会尝试抓取所有 ads.txt 文件。但是,即使通过 HTTP 对 ads.txt 文件进行抓取,404(或 40X)响应也会导致先前被抓取的条目被完全清除。因此,如果通过 HTTPS 实施的抓取返回 404(或 40X),那么:

  • 之前抓取的条目将会被完全清除。

请确保 ads.txt 通过 HTTP 和 HTTPS 均能够被访问。


作者头像
萧萧一风创始人

做一个积极主动热情的人,为了想要完成的事情和实现的目标,拼命投入力量。

上一篇:Google AdSense Ads.txt 指南
下一篇:Linux系统防CC攻击自动拉黑IPShell脚本

发表评论

×
选择打赏方式:

打赏

打赏

打赏

×
选择分享方式: