Chronos-2 时序大模型

本文介绍亚马逊最新发布的开源权重模型—— Chronos-2 ,并展示它如何基于历史销售数据和温度作为协变量来预测产品需求。

Chronos-2 时序大模型

虽然大语言模型(LLMs)和AI代理正在抢尽风头,并被应用于实际的商业用例,但支撑它们的基础模型架构正在悄然扩展到数据科学的新领域。

除了生成文本、图像或音频外,这一代人工智能现在被应用于不同类型的数据——例如时间序列(销售、需求、现金流)、生物数据或网络数据——从而开辟了理解随时间变化的模式和动态的新方法。在幕后,一场“新一波”已经形成。最令人期待的发展之一:时间序列基础模型(TSFMs)。就像大型语言模型(LLMs)对语言有深入理解一样,TSFMs 对时间也有深入理解。LLMs 理解的是语言的概念;TSFMs 理解的是时间的概念

它们学习业务指标随时间的变化方式——捕捉季节性、趋势、转折点以及像黑色星期五这样的事件对人员配置、库存或收入的影响。它们不仅仅孤立地查看你的历史数据,而是从跨行业的数百万时间序列中学习,并利用这些知识对未来做出更准确、更稳健的预测。

今天,我们将向您介绍亚马逊最新发布的开源权重模型—— Chronos-2 ,并展示它如何基于历史销售数据和温度作为协变量来预测产品需求。

你可能会想:“预测?我们不是已经做了几十年了吗?

是的——但这里有个转折。⚙️过去,你需要一个专门的数据科学团队、几个月的特征工程和无尽的模型调优才能得到半好的结果。

现在,有了像 Chronos-2 这样的基础模型,开发者可以在几分钟内部署几乎即插即用的预测流程,通常在无需重新训练的情况下超越传统方法。

下面,我们将通过一个虚构的实验来预测短裤和手套的需求——利用天气数据作为外部因素——来展示基础模型是如何重塑预测格局的。因此,我们生成了一个合成数据集来说明模型输入。

1、模型输入:历史销售记录和气温数据

上面的组合图展示了气温如何驱动两种截然不同的产品的需求——手套(顶部)和短裤(底部)。在手套面板中,需求(蓝色线)在气温(橙色虚线)低于冰点时出现峰值。气温越低,手套销量越高——这是反向相关性的经典例子。

相比之下,短裤面板显示了相反的情况:随着气温升高,销量增加,在每天平均气温超过 25°C 的夏季达到高峰。在两种产品中,注意11 月下旬和 12 月的急剧上升——这些代表了黑色星期五圣诞节购物期,短期促销暂时使需求超出正常季节性模式。

这些图表共同描绘了天气 + 日历事件如何共同塑造零售行为,为像Chronos-2这样的模型提供了丰富的时空结构进行学习。

2、运行 Chronos-2

只需几行代码,Chronos-2 就能端到端处理整个预测流程——从加载预训练的基础模型到生成准确且具有不确定性的预测。不需要特征工程、超参数调优或重新训练——只需提供您的历史数据,模型就能直接交付生产级的预测。

# 导入 chronos 库  
from chronos import BaseChronosPipeline, Chronos2Pipeline  

# 1. 包含温度作为协变量的输入 DataFrame  
dataset.head()  
-------out--------  
  timestamp item_id     target  temperature  
0 2021-01-01  Gloves  40.483571     5.755654  
1 2021-01-02  Gloves  43.318678     6.158658  
2 2021-01-03  Gloves  47.258443     6.637955  
3 2021-01-04  Gloves  45.645149     7.130894  
...  
-------out--------  
# 2. 在本地下载 Chronos 2 模型  
pipeline: Chronos2Pipeline = BaseChronosPipeline.from_pretrained(  
        "s3://autogluon/chronos-2/", device_map="cpu"  
    )  
# 3. 获取预测结果  
predictions = pipeline.predict_df(  
    dataset, # 我们的产品销售和温度数据集  
    prediction_length=365, # 我们希望预测未来多少天  
    quantile_levels=[0.1, 0.5, 0.9], # 分位数估计  
    id_column="item_id",  
    timestamp_column="timestamp",  
    target="target",  
)  
# 4. 显示预测结果  
predictions.head()  
-------out--------  
 item_id  timestamp target_name  predictions        0.1        0.5        0.9  
0  Gloves 2024-01-01      target    48.997105  42.216095  48.997105  56.395256  
1  Gloves 2024-01-02      target    47.422070  40.716419  47.422070  54.569496  
....  
-------out--------  
注意:对于每个预测的时间步,模型返回分位数估计(例如,第 10/50/90 百分位)。使用这些,您可以构建预测区间(例如,10–90%)来表示预测的不确定性。

3、使用 Chronos-2 预测 2024 年的测试年份

下图比较了Chronos-2 的预测(红色)两种产品的实际 2024 年需求(蓝色)

灰色虚线标记了模型停止看到历史数据(2023 年底)并开始预测未来的位置

Chronos-2 几乎完美地跟踪了未见的一年:

  • 它再现了手套的冬季增长短裤的夏季高峰
  • 它预见了节假日销售激增,与观察到的数据高度一致。
  • 90% 置信区间(红色阴影)在黑色星期五等高波动时期自然扩大,然后在稳定月份收紧。

从视觉上看,预测线和实际线几乎完美的重叠,展示了 Chronos-2 在零样本模式下的准确性和可靠性,在不重新训练的情况下捕捉了长期季节性和短期波动。

4、结束语

这个实验突显了时间序列基础模型Chronos-2如何将预测从一个复杂、特定领域的过程转变为一种快速、数据驱动的能力,任何开发人员都可以轻松访问。

  • Chronos-2 理解时间——它自动学习季节性、趋势和异常模式,而无需显式的特征工程。
  • 零样本预测有效——只需几行代码,我们就实现了对未见过的数据的高精度预测。
  • 真实世界模式被捕捉——模型准确再现了冬夏周期,并甚至检测到了黑色星期五和圣诞节的销售激增。
  • 从几个月到几分钟——曾经需要定制模型和手动调优的事情,现在几乎可以开箱即用。

Chronos-2 展示了基础模型如何悄然重塑应用数据科学,将 transformer 革命从文本和图像扩展到时间本身的语言


原文链接:From LLMs to Time Series — The Next Wave of AI Foundation Models

汇智网翻译整理,转载请标明出处