参数造成资源巨大浪费

Exchange insights, tools, and strategies for canada dataset.
Post Reply
ahbappy
Posts: 22
Joined: Sat Dec 21, 2024 5:32 am

参数造成资源巨大浪费

Post by ahbappy »

扫描重复和低价值的页面会浪费大量资源(抓取预算)并使服务器超载。事实上,爬虫可能不确定哪些是要索引的正确页面。谷歌本身对此表示:


过于复杂的 URL(尤其是包含多个参数的 URL)可能会创建不必要的大量指向网站上相同或相似内容的 URL,从而给爬网程序带来问题。因此,Googlebot 可能会消耗比所需更多的带宽,或者可能无法 圣卢西亚电子邮件列表 完全索引您网站上的所有内容。

— 谷歌网站管理员指南

网络爬虫如何查看您的网站?

了解搜索引擎机器人的工作原理

尝试日志文件分析器 →
ADS 插图
3、参数影响点击率
根据统计, 静态 URL 和对话 URL 似乎可以提高点击率。 另一方面,动态地址可能会影响点击率:想想看,它们“令人不愉快”且“难以阅读”,对用户来说可能显得不可靠,因此用户可能会决定不打开它们,并且在他的社交渠道、博客或论坛上分享它们。

静态 URL 与动态 URL

4、部分代理缓存服务器不缓存参数
您是否尝试过使用 Gt Metrix 等工具测试您的网站速度?然后您将看到消息“从静态资源中删除查询字符串”。

事实上,某些代理缓存服务器不会将查询字符串存储在缓存中,因此当用户加载站点时它们不会静态返回。

考虑到这些问题,真的有必要使用 URL 参数吗?是的,正如已经提到的,它们被网站管理员和开发人员用于各种目的:让我们看看是哪些!

查询字符串的SEO参数主要功能
搜索字符串的 SEO 参数

排序(?sort=):参数可用于对列表页面上的结果进行排序。
一个例子是按价格对产品进行排序:。电子商务的类别,无论有或没有按价格排序的产品,始终包含相同的元素。这些页面没有增加任何价值,它们是规范页面的重复。

限制 (? Producer=):参数的另一个功能是通过特定特征限制结果,例如尺寸、颜色、尺寸、重量:。如果生成的页面与频繁的在线搜索一致,我更喜欢使用文件夹 URL 结构,而不是参数,例如。或者,必须正确管理将创建的参数 URL 以避免重复。

指定 (?id=):参数的另一个常见用途是指定要显示的元素,可以是产品表、博客文章、类别、用户个人资料,例如 .指定搜索的参数必须建立索引,但前提是它们定义了唯一元素。

Image


分页 (?p=):参数化 URL 也用于管理分页,例如。从我的角度来看,分页应该使用 rel=prev/next 属性(即使已弃用)进行管理,或者使用“查看全部”页面的规范进行管理。

跟踪 (?utm_source):这些参数还用于跟踪Web 分析平台内的访问来源渠道,例如。跟踪参数不会更改规范页面的内容,因此这些参数化 URL 不应被搜索引擎索引。

翻译 (?lang=):使用 URL 参数代表专用 ccTLD 或 gTLD 的替代方案,例如。老实说,我的网站从未使用过这种翻译方法,但我遇到过使用这种方法的竞争对手。也就是说,管理 SEO 翻译参数的最佳方法是什么?显然,如果您希望在搜索结果中找到该网站,则必须保留翻译参数的索引!
Post Reply