Chronos-2 时序大模型
本文介绍亚马逊最新发布的开源权重模型—— Chronos-2 ,并展示它如何基于历史销售数据和温度作为协变量来预测产品需求。
虽然大语言模型(LLMs)和AI代理正在抢尽风头,并被应用于实际的商业用例,但支撑它们的基础模型架构正在悄然扩展到数据科学的新领域。
除了生成文本、图像或音频外,这一代人工智能现在被应用于不同类型的数据——例如时间序列(销售、需求、现金流)、生物数据或网络数据——从而开辟了理解随时间变化的模式和动态的新方法。在幕后,一场“新一波”已经形成。最令人期待的发展之一:时间序列基础模型(TSFMs)。就像大型语言模型(LLMs)对语言有深入理解一样,TSFMs 对时间也有深入理解。LLMs 理解的是语言的概念;TSFMs 理解的是时间的概念。
它们学习业务指标随时间的变化方式——捕捉季节性、趋势、转折点以及像黑色星期五这样的事件对人员配置、库存或收入的影响。它们不仅仅孤立地查看你的历史数据,而是从跨行业的数百万时间序列中学习,并利用这些知识对未来做出更准确、更稳健的预测。
今天,我们将向您介绍亚马逊最新发布的开源权重模型—— Chronos-2 ,并展示它如何基于历史销售数据和温度作为协变量来预测产品需求。
你可能会想:“预测?我们不是已经做了几十年了吗?
是的——但这里有个转折。⚙️过去,你需要一个专门的数据科学团队、几个月的特征工程和无尽的模型调优才能得到半好的结果。
现在,有了像 Chronos-2 这样的基础模型,开发者可以在几分钟内部署几乎即插即用的预测流程,通常在无需重新训练的情况下超越传统方法。
下面,我们将通过一个虚构的实验来预测短裤和手套的需求——利用天气数据作为外部因素——来展示基础模型是如何重塑预测格局的。因此,我们生成了一个合成数据集来说明模型输入。
1、模型输入:历史销售记录和气温数据

上面的组合图展示了气温如何驱动两种截然不同的产品的需求——手套(顶部)和短裤(底部)。在手套面板中,需求(蓝色线)在气温(橙色虚线)低于冰点时出现峰值。气温越低,手套销量越高——这是反向相关性的经典例子。
相比之下,短裤面板显示了相反的情况:随着气温升高,销量增加,在每天平均气温超过 25°C 的夏季达到高峰。在两种产品中,注意11 月下旬和 12 月的急剧上升——这些代表了黑色星期五和圣诞节购物期,短期促销暂时使需求超出正常季节性模式。
这些图表共同描绘了天气 + 日历事件如何共同塑造零售行为,为像Chronos-2这样的模型提供了丰富的时空结构进行学习。
2、运行 Chronos-2
只需几行代码,Chronos-2 就能端到端处理整个预测流程——从加载预训练的基础模型到生成准确且具有不确定性的预测。不需要特征工程、超参数调优或重新训练——只需提供您的历史数据,模型就能直接交付生产级的预测。
# 导入 chronos 库
from chronos import BaseChronosPipeline, Chronos2Pipeline
# 1. 包含温度作为协变量的输入 DataFrame
dataset.head()
-------out--------
timestamp item_id target temperature
0 2021-01-01 Gloves 40.483571 5.755654
1 2021-01-02 Gloves 43.318678 6.158658
2 2021-01-03 Gloves 47.258443 6.637955
3 2021-01-04 Gloves 45.645149 7.130894
...
-------out--------
# 2. 在本地下载 Chronos 2 模型
pipeline: Chronos2Pipeline = BaseChronosPipeline.from_pretrained(
"s3://autogluon/chronos-2/", device_map="cpu"
)
# 3. 获取预测结果
predictions = pipeline.predict_df(
dataset, # 我们的产品销售和温度数据集
prediction_length=365, # 我们希望预测未来多少天
quantile_levels=[0.1, 0.5, 0.9], # 分位数估计
id_column="item_id",
timestamp_column="timestamp",
target="target",
)
# 4. 显示预测结果
predictions.head()
-------out--------
item_id timestamp target_name predictions 0.1 0.5 0.9
0 Gloves 2024-01-01 target 48.997105 42.216095 48.997105 56.395256
1 Gloves 2024-01-02 target 47.422070 40.716419 47.422070 54.569496
....
-------out--------
注意:对于每个预测的时间步,模型返回分位数估计(例如,第 10/50/90 百分位)。使用这些,您可以构建预测区间(例如,10–90%)来表示预测的不确定性。
3、使用 Chronos-2 预测 2024 年的测试年份
下图比较了Chronos-2 的预测(红色)与两种产品的实际 2024 年需求(蓝色)。

Chronos-2 几乎完美地跟踪了未见的一年:
- 它再现了手套的冬季增长和短裤的夏季高峰。
- 它预见了节假日销售激增,与观察到的数据高度一致。
- 90% 置信区间(红色阴影)在黑色星期五等高波动时期自然扩大,然后在稳定月份收紧。
从视觉上看,预测线和实际线几乎完美的重叠,展示了 Chronos-2 在零样本模式下的准确性和可靠性,在不重新训练的情况下捕捉了长期季节性和短期波动。
4、结束语
这个实验突显了时间序列基础模型如Chronos-2如何将预测从一个复杂、特定领域的过程转变为一种快速、数据驱动的能力,任何开发人员都可以轻松访问。
- Chronos-2 理解时间——它自动学习季节性、趋势和异常模式,而无需显式的特征工程。
- 零样本预测有效——只需几行代码,我们就实现了对未见过的数据的高精度预测。
- 真实世界模式被捕捉——模型准确再现了冬夏周期,并甚至检测到了黑色星期五和圣诞节的销售激增。
- 从几个月到几分钟——曾经需要定制模型和手动调优的事情,现在几乎可以开箱即用。
Chronos-2 展示了基础模型如何悄然重塑应用数据科学,将 transformer 革命从文本和图像扩展到时间本身的语言。
原文链接:From LLMs to Time Series — The Next Wave of AI Foundation Models
汇智网翻译整理,转载请标明出处