builder 模块

定义用于生成 Azure 机器学习管道的类。

管道图由管道步骤(PipelineStep)、每个步骤中生成或使用的可选管道数据(PipelineData)和可选的步骤执行序列(StepSequence)组成。

PipelineData

表示 Azure 机器学习管道中的中间数据。

管道中使用的数据可以由一个步骤生成,另一个步骤是提供 PipelineData 对象作为一个步骤的输出,以及一个或多个后续步骤的输入。

请注意 ,如果使用管道数据,请确保使用的目录已存在。

为确保目录存在 python 示例,假设在一个管道步骤中有一个名为output_folder的输出端口,需要将此文件夹中的某些数据写入相对路径。


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData 使用不再推荐用于数据访问和传递的 DataReference 基础,请改用 OutputFileDatasetConfig ,可在此处找到示例: 使用 OutputFileDatasetConfig 的管道

初始化 PipelineData。

PipelineStep

表示 Azure 机器学习管道中的执行步骤。

管道是从多个管道步骤构造的,这些步骤是管道中的不同计算单元。 每个步骤都可以独立运行并使用独立的计算资源。 每个步骤通常都有自己的命名输入、输出和参数。

PipelineStep 类是基类,其他专为常见方案设计的内置步骤类继承,例如 PythonScriptStepDataTransferStepHyperDriveStep

有关 Pipelines 和 PipelineSteps 关联方式的概述,请参阅 什么是 ML 管道

初始化 PipelineStep。

StepSequence

表示步骤 Pipeline 列表以及执行步骤的顺序。

初始化管道时使用 StepSequence 创建包含按特定顺序运行的步骤的工作流。

初始化 StepSequence。