/etc/ssh/sshd_config.d/ 目录下的文件顺序很重要 (可能超出你的预期)
由于你的浏览器版本过旧或被识别为爬虫,你可能无法访问作者的博客。作者为了减轻服务器负载,阻止了使用旧版浏览器和恶意爬虫的行为,特别是那些使用旧 Chrome User-Agent 的爬虫。如果误判,请联系作者提供浏览器信息。同时,作者建议使用 archive.org 而非 archive.* 进行页面存档,因为后者抓取行为难以区分,且可能伪装成 googlebot。
你正在使用一个可疑的老旧浏览器
你之所以看到这个页面,可能是因为你尝试访问我的博客 (Wandering Thoughts) 或者 CSpace 的某些部分,它是博客的一部分。不幸的是,你使用的浏览器版本被我的反爬虫机制认为是可疑的,通常是因为它太旧了(这通常适用于某些 Chrome 版本)。截至 2025 年初,大量爬虫涌现(显然部分原因是收集数据用于 LLM 训练),它们使用各种旧的浏览器 User-Agent,尤其是 Chrome User-Agent。为了减轻 Wandering Thoughts 的负载,我正在尝试(试图)阻止所有这些爬虫,而你遇到了这个问题。
如果这是一个错误,并且你正在使用最新版本的浏览器,你可以通过我在大学的当前位置 联系我(你应该能够从那里找到电子邮件地址)。如果可能,请告诉我你使用的浏览器等等,最好提供其确切的 User-Agent 字符串。
给使用 archive.* 的用户的特别提示
你可能通过 archive.today, archive.ph, archive.is 等服务看到此消息。不幸的是,archive.* 以一种无法与恶意行为者区分的方式抓取页面以进行存档。他们使用旧的 Chrome User-Agent 值,从广泛分布且未明确标识为他们的 IP 地址块进行爬取,并且他们的一些 IP 地址具有伪造的反向 DNS 条目,声称它们是 googlebot IP 地址(这通常只由非常糟糕的行为者完成)。我建议你使用 archive.org,这是一个行为更好的存档爬虫,可以爬取我的博客 (Wandering Thoughts)。
Chris Siebenmann, 2025-02-17