介绍

已完成

Azure CycleCloud 允许自定义和管理 Azure 中的高性能计算(HPC)群集。

情景

Contoso 是一家总部位于德克萨斯州休斯顿的海洋和气象服务公司。 Contoso 的研究团队严重依赖其本地 HPC 群集来运行基于 Slurm 的作业。

有一个新启动的项目涉及多项模拟,这些模拟将跟踪飓风季穿过美国墨西哥湾海岸的风暴。 遗憾的是,初始评估确定现有的本地 HPC 群集没有足够的计算容量来运行模拟。

作为首席研究工程师,你已使用 Contoso 的现有 Azure 订阅在 Azure 中预配了新的 HPC 群集。 为了简化预配过程,你实现了 Azure CycleCloud,并使用它来部署新群集。

现在,你必须自定义部署,以便针对新项目进行优化。 你已在本地 HPC 环境中使用了现有的自定义映像和脚本。 在预配计划程序和计算节点时,需要重复使用这些映像和脚本。 你还将探索简化部署过程的选项,因为计划配置匹配的开发群集和生产群集。 你计划使用 Azure CycleCloud 的功能来实现这些目标。

我们将做什么?

你将通过测试使用自定义的 Azure CycleCloud 模板实现群集的过程来启动此模块。 为此,你将从 Azure CycleCloud 模板 GitHub 存储库下载现有模板,更改模板中的存储配置定义,导入新修改的模板,并使用 Azure CycleCloud 图形界面创建群集。

接下来,你将使用相同的模板在群集定义中添加额外的节点数组和分区,确保通过 Azure CycleCloud Web 界面配置相应的群集资源,导出新部署的群集的属性,使用新配置的设置更新它,并导入修改后的模板以将其配置应用到现有群集。

最后,你将实现用于 Azure CycleCloud 的 cloud-init 脚本。 首先将脚本添加到调度器和计算节点,然后启动群集以验证 cloud-init 配置已生效。

主要目标是什么?

在本模块结束时,你将详细了解如何使用 Azure CycleCloud 模板自定义在 Azure 中运行的 HPC 群集的体系结构。 你还将了解如何使用 cloud-init 脚本修改群集节点的配置。