Partager via


OutputPortBinding Classe

Définit une sortie nommée d’une étape de pipeline.

OutputPortBinding peut être utilisé pour spécifier le type de données qui sera généré par une étape et la façon dont les données seront produites. Il peut être utilisé pour InputPortBinding spécifier que la sortie de l’étape est une entrée requise d’une autre étape.

Initialisez OutputPortBinding.

Constructeur

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Paramètres

Nom Description
name
Obligatoire
str

Nom de l’objet OutputPortBinding, qui ne peut contenir que des lettres, des chiffres et des traits de soulignement.

datastore

Magasin de données sur lequel réside PipelineData.

Valeur par défaut: None
output_name
str

Nom de la sortie, si aucun nom n’est utilisé. Peut contenir uniquement des lettres, des chiffres et des traits de soulignement.

Valeur par défaut: None
bind_mode
str

Spécifie si l’étape de production utilise la méthode « upload » ou « mount » ou « hdfs » pour accéder aux données.

Valeur par défaut: mount
path_on_compute
str

Pour le mode « charger », le chemin d’accès dans lequel le module écrit la sortie.

Valeur par défaut: None
is_directory

Indique si la sortie est un répertoire ou un fichier unique.

Valeur par défaut: None
overwrite

Pour le mode « chargement », indiquez s’il faut remplacer les données existantes.

Valeur par défaut: None
data_type
str

Optionnel. Le type de données peut être utilisé pour spécifier le type attendu de la sortie et pour détailler la façon dont les étapes consommatrices doivent utiliser les données. Peut être n’importe quelle chaîne définie par l’utilisateur.

Valeur par défaut: None
pipeline_output_name
str

Si cette sortie est fournie, vous pouvez utiliser PipelineRun.get_pipeline_output(). Les noms de sortie du pipeline doivent être uniques dans le pipeline.

Valeur par défaut: None
training_output

Définit la sortie pour le résultat d’entraînement. Cela est nécessaire uniquement pour des formations spécifiques qui entraînent différents types de sorties, tels que les métriques et le modèle. Par exemple, AutoMLStep les métriques et le modèle sont obtenus. Vous pouvez également définir une itération d’entraînement ou une métrique spécifique utilisée pour obtenir le meilleur modèle. Pour HyperDriveStep, vous pouvez également définir les fichiers de modèle spécifiques à inclure dans la sortie.

Valeur par défaut: None
dataset_registration

Optionnel. Il s’agit d’un paramètre interne. Vous devez utiliser PipelineData.as_dataset à la place.

Valeur par défaut: None
dataset_output

Optionnel. Il s’agit d’un paramètre interne. Vous devez utiliser OutputFileDatasetConfig intead.

Valeur par défaut: None
name
Obligatoire
str

Nom de l’objet OutputPortBinding, qui ne peut contenir que des lettres, des chiffres et des traits de soulignement.

datastore
Obligatoire

Magasin de données sur lequel réside PipelineData.

output_name
Obligatoire
str

Nom de la sortie, si aucun nom n’est utilisé. Ne peut contenir que des lettres, des chiffres et des traits de soulignement.

bind_mode
Obligatoire
str

Spécifie si l’étape de production utilise la méthode « upload » ou « mount » ou « hdfs » pour accéder aux données.

path_on_compute
Obligatoire
str

Pour le mode « charger », le chemin d’accès dans lequel le module écrit la sortie.

is_directory
Obligatoire

si la sortie est un répertoire

overwrite
Obligatoire

Pour le mode « chargement », indiquez s’il faut remplacer les données existantes.

data_type
Obligatoire
str

Optionnel. Le type de données peut être utilisé pour spécifier le type attendu de la sortie et pour détailler la façon dont les étapes consommatrices doivent utiliser les données. Peut être n’importe quelle chaîne définie par l’utilisateur.

pipeline_output_name
Obligatoire
str

Si cette sortie est fournie, vous pouvez utiliser PipelineRun.get_pipeline_output(). Les noms de sortie du pipeline doivent être uniques dans le pipeline.

training_output
Obligatoire

Définit la sortie pour le résultat d’entraînement. Cela est nécessaire uniquement pour des formations spécifiques qui entraînent différents types de sorties, tels que les métriques et le modèle. Par exemple, AutoMLStep les métriques et le modèle sont obtenus. Vous pouvez également définir une itération d’entraînement ou une métrique spécifique utilisée pour obtenir le meilleur modèle. Pour HyperDriveStep, vous pouvez également définir les fichiers de modèle spécifiques à inclure dans la sortie.

dataset_registration
Obligatoire

Optionnel. Il s’agit d’un paramètre interne. Vous devez utiliser PipelineData.as_dataset à la place.

dataset_output
Obligatoire

Optionnel. Il s’agit d’un paramètre interne. Vous devez utiliser OutputFileDatasetConfig intead.

Remarques

OutputPortBinding peut être utilisé de la même façon que PipelineData lors de la création d’un pipeline pour spécifier des entrées et des sorties d’étape. La différence est OutputPortBinding à utiliser InputPortBinding pour être consommé en tant qu’entrée à une autre étape.

Voici un exemple de construction d’un pipeline avec OutputPortBinding :


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Cela crée un pipeline en deux étapes. L’étape de processus sera exécutée en premier, puis une fois terminée, l’étape d’apprentissage sera exécutée. Azure ML fournit la sortie produite par l’étape de processus, comme décrit par l’objet OutputPortBinding, à l’étape d’apprentissage.

Attributs

bind_mode

Obtenez le mode (« chargement » ou « montage » ou « hdfs ») que l’étape de production utilisera pour créer les données.

Retours

Type Description
str

Mode de liaison.

data_type

Obtenez le type de données qui sera généré.

Retours

Type Description
str

Nom du type de données.

dataset_registration

Obtenez les informations d’inscription du jeu de données.

Retours

Type Description

Informations d’inscription du jeu de données.

datastore

Magasin de données sur lequel réside PipelineData.

Retours

Type Description

Objet Magasin de données.

is_directory

Indique si la sortie est un répertoire.

Retours

Type Description

is_directory

name

Nom de l’objet OutputPortBinding.

Retours

Type Description
str

Nom.

overwrite

Pour le mode « charger », indiquez s’il faut remplacer les données existantes.

Retours

Type Description

_écraser

path_on_compute

Pour le mode « charger », le chemin d’accès dans lequel le module écrit la sortie.

Retours

Type Description
str

path_on_compute

pipeline_output_name

Obtenez le nom de la sortie du pipeline correspondant à ce OutputPortBinding.

Retours

Type Description
str

Nom de sortie du pipeline.

training_output

Obtenez une sortie d’entraînement.

Retours

Type Description

Sortie d’entraînement