我有一个关于太阳活动统计预测的问题。我必须马上说,预测领域的知识很少。假设有一个时间序列,其中清楚地追踪了每日和每年的季节性,也有与季节相关的季节性,这里是该系列的一部分:
没有趋势。这一切都是因为时间序列的值直接取决于日照。也可以识别急剧下降(上图中的红色圆圈)。我想仅根据它提前 24 小时预测给定的系列。最初,我尝试使用参考方法 - 季节性恒定法进行预测:
预测很好地遵循了形状,但平滑度令人困惑。我还尝试了高阶自回归:
显然,结果有所改善。指数霍尔特平滑的所有变化都显示出较差的结果。ARIMA 也没有季节。带有季节性分配的 ARIMA 甚至一天都没有出来。我从 facebook 尝试过先知,但显然不是这样的行,或者我没有弄清楚。
你能推荐适用于这个系列的方法或模型吗?还是专注于参考方法而不是寻找复杂的模型更好?总的来说,对天气相关序列进行统计预测的想法是否可行?在仅存在具有一个参数的系列(例如,日照)的情况下是否可行,或者是否需要引入其他预测变量?
使用 Holt(更准确地说,使用 Holt-Winters,当然,因为你有季节性)和 SARIMA,你总是要玩 - 选择参数,寻找最佳选择。此外,排放物应进行预清洁。目前尚不清楚为什么第一个钟声比其他钟声更平滑。接下来,您需要决定将用于分析预测的度量。不一定 rms 是最合适的。这就是我所说的“令人困惑的平滑度”——不是答案,你需要以某种方式通过分析来支持它。另外 - 我希望你没有忘记做交叉验证?好吧,900 级的自回归在某种程度上是神秘的。
我还不能说关于先知的任何事情,我还没有时间去尝试它。
Вообще, осуществима ли идея статистического прогнозирования рядов, связанных с погодой?
- 这取决于你的期望。100% 没有。但或多或少是足够的近似值 - 是的。请记住,预测不是预测,而是概率产物。Осуществима ли она при наличии только ряда с одним параметром (допустим, инсоляцией) или требуется ввод других предикторов?
如果您有更多预测变量,那么当然最好尝试使用它们。我再重复一遍,永远不会有 100% 的预测,你“在岸上”需要决定什么是适当的预测。因此,在时间序列中预测太阳活动的任务在 ML 研究中非常流行。网上有几十个例子,看一下。它可能会有所帮助。