有每周的模式吗

Exchange insights, tools, and strategies for canada dataset.
Post Reply
rakibhasan
Posts: 40
Joined: Thu Dec 26, 2024 3:29 am

有每周的模式吗

Post by rakibhasan »

也许我们无法预测下一次更新的确切日期,但这种模式有规律吗?诚然,从本文开头的图表来看,这有点难以判断。分析不规则的时间序列(峰值之间的周期和峰值的强度都会发生变化)需要一些非常复杂的数学运算,所以我决定从简单一点的开始。

我首先假设存在一个规律 博蒂姆数据库 并寻找一种基于该假设消除部分噪音的方法。产生结果的最简单的分析涉及取 3 天移动平均值并计算平均标准误差 (MSE)。换句话说,对于每个温度(每个温度都是一天),取当天和其两侧的一天(3 天窗口)的平均值,然后计算当天温度与 3 天平均值之间的差值的平方。这会夸大独立峰值,并平滑一些噪声较大的序列,从而得到以下图表:

这篇文章的灵感部分来自 2016 年 2 月,当时的信噪比异常高。因此,让我们放大图表,看看过去 90 天的情况:
看到第 2 到第 6 个峰值(从 1 月 21 日开始)了吗?它们之间的间隔分别是 6 天、7 天、7 天和 8 天。然后,与下一个较小的峰值(3 月 3 日)之间有 2 周的间隔,与再下一个峰值之间又有 8 天的间隔。虽然这很难证明存在明确的规律,但考虑到我们对算法更新审批流程的了解,很难相信每周的节奏完全是巧合。

在其他月份,这种模式不太明显,我并不是说每周更新周期就是全部情况。我们知道 Google 也会进行大规模数据更新(包括 Penguin),有时会在几天(甚至几周)内推出更新。2015 年 4 月(12 个月 MSE 图的第一部分)也存在类似的模式,尽管噪音更大。2015 年圣诞节前后的活动水平也很有趣:



尽管我们有很多阴谋论,但 2015 年圣诞节期间 Google 的活动似乎确实出现了短暂的低迷,持续了大约 4 周,随后出现了一个相当大的高峰,这可能反映了一些追赶更新。工程师们也去度假了。请注意,1 月份的第一个高峰之后是大约 2 周的空白,然后是两个 1 周的空白。
Post Reply