这是 2025 年 4 月 3 日在荷兰鹿特丹举办的 EuroSys 2025 上,由 Artjom Joosen 报告的 “Serverless Cold Starts and Where to Find Them”。
本文分析了已开源的来自华为生产级无服务器云平台的数据。该分析基于数 TB(太字节)级的日志,数据可用于机器学习、大数据分析、仿真等多种研究与工程场景。
作者:Artjom Joosen, Ahmed Hassan, Martin Asenov, Rajkarn Singh, Luke Darlow, Jianfeng Wang, Qiwen Deng, Adam Barker
GitHub(数据与代码仓库):https://github.com/sir-lab/data-release
ACM 图书馆:https://dl.acm.org/doi/10.1145/3689031.3696073
arXiv:https://arxiv.org/abs/2410.06145
本报告介绍了数据集的来源与构成、日志的规模与字段、以及从这些生产环境日志中可以提取出的关键洞见(例如冷启动的出现位置与模式、性能与资源消耗的分布特征等)。研究结果对理解真实生产环境中无服务器函数的行为差异、改进冷启动缓解策略、以及为基于日志的预测与调度算法提供训练数据具有重要参考价值。