参数造成资源巨大浪费

ahbappy · Post by **ahbappy** » Sat Dec 21, 2024 10:21 am

扫描重复和低价值的页面会浪费大量资源（抓取预算）并使服务器超载。事实上，爬虫可能不确定哪些是要索引的正确页面。谷歌本身对此表示：

过于复杂的 URL（尤其是包含多个参数的 URL）可能会创建不必要的大量指向网站上相同或相似内容的 URL，从而给爬网程序带来问题。因此，Googlebot 可能会消耗比所需更多的带宽，或者可能无法圣卢西亚电子邮件列表完全索引您网站上的所有内容。

— 谷歌网站管理员指南

网络爬虫如何查看您的网站？

了解搜索引擎机器人的工作原理

尝试日志文件分析器 →
ADS 插图
3、参数影响点击率
根据统计，静态 URL 和对话 URL 似乎可以提高点击率。另一方面，动态地址可能会影响点击率：想想看，它们“令人不愉快”且“难以阅读”，对用户来说可能显得不可靠，因此用户可能会决定不打开它们，并且在他的社交渠道、博客或论坛上分享它们。

静态 URL 与动态 URL

4、部分代理缓存服务器不缓存参数
您是否尝试过使用 Gt Metrix 等工具测试您的网站速度？然后您将看到消息“从静态资源中删除查询字符串”。

事实上，某些代理缓存服务器不会将查询字符串存储在缓存中，因此当用户加载站点时它们不会静态返回。

考虑到这些问题，真的有必要使用 URL 参数吗？是的，正如已经提到的，它们被网站管理员和开发人员用于各种目的：让我们看看是哪些！

查询字符串的SEO参数主要功能
搜索字符串的 SEO 参数

排序(?sort=)：参数可用于对列表页面上的结果进行排序。
一个例子是按价格对产品进行排序：。电子商务的类别，无论有或没有按价格排序的产品，始终包含相同的元素。这些页面没有增加任何价值，它们是规范页面的重复。

限制 (? Producer=)：参数的另一个功能是通过特定特征限制结果，例如尺寸、颜色、尺寸、重量：。如果生成的页面与频繁的在线搜索一致，我更喜欢使用文件夹 URL 结构，而不是参数，例如。或者，必须正确管理将创建的参数 URL 以避免重复。

指定 (?id=)：参数的另一个常见用途是指定要显示的元素，可以是产品表、博客文章、类别、用户个人资料，例如 .指定搜索的参数必须建立索引，但前提是它们定义了唯一元素。

分页 (?p=)：参数化 URL 也用于管理分页，例如。从我的角度来看，分页应该使用 rel=prev/next 属性（即使已弃用）进行管理，或者使用“查看全部”页面的规范进行管理。

跟踪 (?utm_source)：这些参数还用于跟踪Web 分析平台内的访问来源渠道，例如。跟踪参数不会更改规范页面的内容，因此这些参数化 URL 不应被搜索引擎索引。

翻译 (?lang=)：使用 URL 参数代表专用 ccTLD 或 gTLD 的替代方案，例如。老实说，我的网站从未使用过这种翻译方法，但我遇到过使用这种方法的竞争对手。也就是说，管理 SEO 翻译参数的最佳方法是什么？显然，如果您希望在搜索结果中找到该网站，则必须保留翻译参数的索引！