OutputPortBinding Classe
Définit une sortie nommée d’une étape de pipeline.
OutputPortBinding peut être utilisé pour spécifier le type de données qui sera généré par une étape et la façon dont les données seront produites. Il peut être utilisé pour InputPortBinding spécifier que la sortie de l’étape est une entrée requise d’une autre étape.
Initialisez OutputPortBinding.
Constructeur
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
Paramètres
Nom | Description |
---|---|
name
Obligatoire
|
Nom de l’objet OutputPortBinding, qui ne peut contenir que des lettres, des chiffres et des traits de soulignement. |
datastore
|
Magasin de données sur lequel réside PipelineData. Valeur par défaut: None
|
output_name
|
Nom de la sortie, si aucun nom n’est utilisé. Peut contenir uniquement des lettres, des chiffres et des traits de soulignement. Valeur par défaut: None
|
bind_mode
|
Spécifie si l’étape de production utilise la méthode « upload » ou « mount » ou « hdfs » pour accéder aux données. Valeur par défaut: mount
|
path_on_compute
|
Pour le mode « charger », le chemin d’accès dans lequel le module écrit la sortie. Valeur par défaut: None
|
is_directory
|
Indique si la sortie est un répertoire ou un fichier unique. Valeur par défaut: None
|
overwrite
|
Pour le mode « chargement », indiquez s’il faut remplacer les données existantes. Valeur par défaut: None
|
data_type
|
Optionnel. Le type de données peut être utilisé pour spécifier le type attendu de la sortie et pour détailler la façon dont les étapes consommatrices doivent utiliser les données. Peut être n’importe quelle chaîne définie par l’utilisateur. Valeur par défaut: None
|
pipeline_output_name
|
Si cette sortie est fournie, vous pouvez utiliser PipelineRun.get_pipeline_output(). Les noms de sortie du pipeline doivent être uniques dans le pipeline. Valeur par défaut: None
|
training_output
|
Définit la sortie pour le résultat d’entraînement. Cela est nécessaire uniquement pour des formations spécifiques qui entraînent différents types de sorties, tels que les métriques et le modèle. Par exemple, AutoMLStep les métriques et le modèle sont obtenus. Vous pouvez également définir une itération d’entraînement ou une métrique spécifique utilisée pour obtenir le meilleur modèle. Pour HyperDriveStep, vous pouvez également définir les fichiers de modèle spécifiques à inclure dans la sortie. Valeur par défaut: None
|
dataset_registration
|
Optionnel. Il s’agit d’un paramètre interne. Vous devez utiliser PipelineData.as_dataset à la place. Valeur par défaut: None
|
dataset_output
|
Optionnel. Il s’agit d’un paramètre interne. Vous devez utiliser OutputFileDatasetConfig intead. Valeur par défaut: None
|
name
Obligatoire
|
Nom de l’objet OutputPortBinding, qui ne peut contenir que des lettres, des chiffres et des traits de soulignement. |
datastore
Obligatoire
|
Magasin de données sur lequel réside PipelineData. |
output_name
Obligatoire
|
Nom de la sortie, si aucun nom n’est utilisé. Ne peut contenir que des lettres, des chiffres et des traits de soulignement. |
bind_mode
Obligatoire
|
Spécifie si l’étape de production utilise la méthode « upload » ou « mount » ou « hdfs » pour accéder aux données. |
path_on_compute
Obligatoire
|
Pour le mode « charger », le chemin d’accès dans lequel le module écrit la sortie. |
is_directory
Obligatoire
|
si la sortie est un répertoire |
overwrite
Obligatoire
|
Pour le mode « chargement », indiquez s’il faut remplacer les données existantes. |
data_type
Obligatoire
|
Optionnel. Le type de données peut être utilisé pour spécifier le type attendu de la sortie et pour détailler la façon dont les étapes consommatrices doivent utiliser les données. Peut être n’importe quelle chaîne définie par l’utilisateur. |
pipeline_output_name
Obligatoire
|
Si cette sortie est fournie, vous pouvez utiliser PipelineRun.get_pipeline_output(). Les noms de sortie du pipeline doivent être uniques dans le pipeline. |
training_output
Obligatoire
|
Définit la sortie pour le résultat d’entraînement. Cela est nécessaire uniquement pour des formations spécifiques qui entraînent différents types de sorties, tels que les métriques et le modèle. Par exemple, AutoMLStep les métriques et le modèle sont obtenus. Vous pouvez également définir une itération d’entraînement ou une métrique spécifique utilisée pour obtenir le meilleur modèle. Pour HyperDriveStep, vous pouvez également définir les fichiers de modèle spécifiques à inclure dans la sortie. |
dataset_registration
Obligatoire
|
Optionnel. Il s’agit d’un paramètre interne. Vous devez utiliser PipelineData.as_dataset à la place. |
dataset_output
Obligatoire
|
Optionnel. Il s’agit d’un paramètre interne. Vous devez utiliser OutputFileDatasetConfig intead. |
Remarques
OutputPortBinding peut être utilisé de la même façon que PipelineData lors de la création d’un pipeline pour spécifier des entrées et des sorties d’étape. La différence est OutputPortBinding à utiliser InputPortBinding pour être consommé en tant qu’entrée à une autre étape.
Voici un exemple de construction d’un pipeline avec OutputPortBinding :
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
Cela crée un pipeline en deux étapes. L’étape de processus sera exécutée en premier, puis une fois terminée, l’étape d’apprentissage sera exécutée. Azure ML fournit la sortie produite par l’étape de processus, comme décrit par l’objet OutputPortBinding, à l’étape d’apprentissage.
Attributs
bind_mode
Obtenez le mode (« chargement » ou « montage » ou « hdfs ») que l’étape de production utilisera pour créer les données.
Retours
Type | Description |
---|---|
Mode de liaison. |
data_type
dataset_registration
Obtenez les informations d’inscription du jeu de données.
Retours
Type | Description |
---|---|
Informations d’inscription du jeu de données. |
datastore
Magasin de données sur lequel réside PipelineData.
Retours
Type | Description |
---|---|
Objet Magasin de données. |
is_directory
name
overwrite
Pour le mode « charger », indiquez s’il faut remplacer les données existantes.
Retours
Type | Description |
---|---|
_écraser |
path_on_compute
Pour le mode « charger », le chemin d’accès dans lequel le module écrit la sortie.
Retours
Type | Description |
---|---|
path_on_compute |
pipeline_output_name
Obtenez le nom de la sortie du pipeline correspondant à ce OutputPortBinding.
Retours
Type | Description |
---|---|
Nom de sortie du pipeline. |