使用 Azure 机器学习工作室

已完成

可以使用基于浏览器的门户 Azure 机器学习工作室来管理机器学习资源和作业,以访问许多类型的机器学习功能。

在 Azure 机器学习工作室中,可以(等等):

  • 导入和浏览数据。
  • 创建和使用计算资源。
  • 在笔记本中运行代码。
  • 使用可视化工具创建任务和流程。
  • 使用自动化机器学习训练模型。
  • 查看已训练模型的详细信息,包括评估指标、负责任的 AI 信息和训练参数。
  • 部署已训练的模型进行按需和批量推理。
  • 从综合模型目录导入和管理模型。

Azure 机器学习工作区的屏幕截图。

预配 Azure 机器学习资源

Azure 机器学习所需的主要资源是 Azure 机器学习工作区,可在 Azure 订阅中进行预配。 其他支持资源(包括存储帐户、容器注册表、虚拟机和其他资源)会根据需要自动创建。 可以在 Azure 门户中创建 Azure 机器学习工作区。

在计算选项之间决定

使用 Azure 机器学习训练模型时,需要选择 计算。 计算是指执行训练过程所需的计算资源。 每次训练模型时,都应监视训练模型所需的时间以及用于执行代码的计算量。 通过监视计算利用率,你将知道是纵向扩展还是缩减计算。

选择使用 Azure 而不是在本地设备上训练模型时,可以访问可缩放且经济高效的计算。

计算选项 注意事项
中心处理单元 (CPU) 或图形处理单元 (GPU) 对于较小的表格数据集,CPU 就足够了,而且性价比高。 对于图像或文本等非结构化数据,GPU 功能更强大且效率更高。 如果 CPU 计算能力不足,GPU 也可用于处理较大的表格数据集。
常规用途或内存优化 使用常规用途以获得均衡的 CPU 与内存比率,这非常适合使用较小数据集进行测试和开发的情况。 使用内存优化来获得较高的内存与 CPU 比率。 非常适合内存中分析,非常适合有较大数据集或在笔记本中工作时使用。

哪种计算选项最符合你的需求,往往需要反复试验。 运行代码时,你应监视计算利用率,以了解正在使用多少计算资源。 如果在使用最大计算大小的情况下,训练模型花费的时间仍然太长,可以使用 GPU 而不是 CPU。 或者,可以选择使用 Spark 计算来分发模型训练,这需要重写训练脚本。

Azure 自动化机器学习

使用 Azure 机器学习的自动化机器学习功能时,会自动分配计算资源。 Azure 自动化机器学习 自动执行机器学习模型开发的耗时迭代任务。

在 Azure 机器学习工作室中,可以使用自动化机器学习通过本模块中所述的相同步骤设计和运行训练试验,而无需编写代码。 Azure 自动化机器学习提供了一个分步向导,可帮助你运行机器学习训练作业。 自动化训练可用于许多机器学习任务,包括回归、时序预测、分类、计算机视觉和自然语言处理任务。 在 AutoML 中,可以访问自己的数据集。 训练的机器学习模型可以部署为服务。

接下来,让我们看看模型部署选项。