HDInsightCompute 类
管理 Azure 机器学习中的 HDInsight 群集计算目标。
Azure HDInsight 是用于大数据分析的热门平台。 该平台提供的 Apache Spark 可用于训练模型。 有关详细信息,请参阅 什么是 Azure 机器学习中的计算目标?
类 ComputeTarget 构造函数。
检索与提供的工作区关联的计算对象的云表示形式。 返回与检索的计算对象的特定类型对应的子类的实例。
构造函数
HDInsightCompute(workspace, name)
参数
名称 | 说明 |
---|---|
workspace
必需
|
包含要检索的 HDInsightCompute 对象的工作区对象。 |
name
必需
|
要检索的 HDInsightCompute 对象的名称。 |
workspace
必需
|
包含要检索的 Compute 对象的工作区对象。 |
name
必需
|
要检索的 Compute 对象的名称。 |
注解
以下示例演示如何在 Azure 中创建适用于 HDInsight 群集的 Spark。
from azureml.core.compute import ComputeTarget, HDInsightCompute
from azureml.exceptions import ComputeTargetException
import os
try:
# If you want to connect using SSH key instead of username/password you can provide parameters private_key_file and private_key_passphrase
# Attaching a HDInsight cluster using the public address of the HDInsight cluster is no longer supported.
# Instead, use resourceId of the HDInsight cluster.
# The resourceId of the HDInsight Cluster can be constructed using the following string format:
# /subscriptions/<subscription_id>/resourceGroups/<resource_group>/providers/Microsoft.HDInsight/clusters/<cluster_name>.
# You can also use subscription_id, resource_group and cluster_name without constructing resourceId.
attach_config = HDInsightCompute.attach_configuration(resource_id='<resource_id>',
ssh_port=22,
username=os.environ.get('hdiusername', '<ssh_username>'),
password=os.environ.get('hdipassword', '<my_password>'))
hdi_compute = ComputeTarget.attach(workspace=ws,
name='myhdi',
attach_configuration=attach_config)
except ComputeTargetException as e:
print("Caught = {}".format(e.message))
hdi_compute.wait_for_completion(show_output=True)
方法
attach |
荒废的。 请改用该方法 将现有 HDI 资源与提供的工作区相关联。 |
attach_configuration |
创建用于附加 HDInsight 计算目标的配置对象。 不再支持使用 HDInsight 群集的公共地址附加 HDInsight 群集。 请改用 HDInsight 群集的 resourceId。 可以使用以下字符串格式构造 HDInsight 群集的 resourceId:“/subscriptions/subscription_id/resourceGroups/<>resource_group<>/ providers/Microsoft.HDInsight/clusters/<cluster_name>”。 还可以在不构造 resourceId 的情况下使用subscription_id、resource_group和cluster_name。 有关更多详细信息: https://aka.ms/azureml-compute-hdi |
delete |
HDInsightCompute 对象不支持删除。 请改用 detach。 |
deserialize |
将 JSON 对象转换为 HDInsightCompute 对象。 |
detach |
从其关联的工作区中分离 HDInsightCompute 对象。 基础云对象不会被删除,只会删除关联。 |
get_credentials |
检索 HDInsightCompute 目标的凭据。 |
refresh_state |
对对象的属性执行就地更新。 此方法根据相应云对象的当前状态更新属性。 这主要用于手动轮询计算状态。 |
serialize |
将此 HDInsightCompute 对象转换为 JSON 序列化字典。 |
attach
荒废的。 请改用该方法 attach_configuration
。
将现有 HDI 资源与提供的工作区相关联。
static attach(workspace, name, username, address, ssh_port='22', password='', private_key_file='', private_key_passphrase='')
参数
名称 | 说明 |
---|---|
workspace
必需
|
要与计算资源关联的工作区对象。 |
name
必需
|
要与提供的工作区中的计算资源关联的名称。 不必与要附加的计算资源的名称匹配。 |
username
必需
|
访问资源所需的用户名。 |
address
必需
|
要附加的资源的地址。 |
ssh_port
|
资源的公开端口。 默认值为 22。 默认值: 22
|
password
必需
|
访问资源所需的密码。 |
private_key_file
必需
|
包含资源的私钥的文件的路径。 |
private_key_passphrase
必需
|
访问资源所需的私钥短语。 |
返回
类型 | 说明 |
---|---|
计算对象的 HDInsightCompute 对象表示形式。 |
例外
类型 | 说明 |
---|---|
attach_configuration
创建用于附加 HDInsight 计算目标的配置对象。
不再支持使用 HDInsight 群集的公共地址附加 HDInsight 群集。 请改用 HDInsight 群集的 resourceId。 可以使用以下字符串格式构造 HDInsight 群集的 resourceId:“/subscriptions/subscription_id/resourceGroups/<>resource_group<>/ providers/Microsoft.HDInsight/clusters/<cluster_name>”。
还可以在不构造 resourceId 的情况下使用subscription_id、resource_group和cluster_name。 有关更多详细信息: https://aka.ms/azureml-compute-hdi
static attach_configuration(username, subscription_id=None, resource_group=None, cluster_name=None, resource_id=None, address=None, ssh_port='22', password='', private_key_file='', private_key_passphrase='')
参数
名称 | 说明 |
---|---|
username
必需
|
访问资源所需的用户名。 |
subscription_id
|
Azure 订阅 ID 默认值: None
|
resource_group
|
HDI 群集所在的资源组的名称。 默认值: None
|
cluster_name
|
HDI 群集名称 默认值: None
|
resource_id
|
要附加的资源的 Azure 资源管理器(ARM)资源 ID。 默认值: None
|
address
|
要附加的资源的地址。 默认值: None
|
ssh_port
|
资源的公开端口。 默认值为 22。 默认值: 22
|
password
必需
|
访问资源所需的密码。 |
private_key_file
必需
|
包含资源的私钥的文件的路径。 |
private_key_passphrase
必需
|
访问资源所需的私钥短语。 |
返回
类型 | 说明 |
---|---|
附加计算对象时要使用的配置对象。 |
delete
deserialize
将 JSON 对象转换为 HDInsightCompute 对象。
static deserialize(workspace, object_dict)
参数
名称 | 说明 |
---|---|
workspace
必需
|
与 HDInsightCompute 对象关联的工作区对象。 |
object_dict
必需
|
要转换为 HDInsightCompute 对象的 JSON 对象。 |
返回
类型 | 说明 |
---|---|
提供的 JSON 对象的 HDInsightCompute 表示形式。 |
例外
类型 | 说明 |
---|---|
注解
如果提供的工作区不是计算与之关联的工作区,则引发该 ComputeTargetException 工作区。
detach
get_credentials
检索 HDInsightCompute 目标的凭据。
get_credentials()
返回
类型 | 说明 |
---|---|
HDInsightCompute 目标的凭据 |
例外
类型 | 说明 |
---|---|
refresh_state
对对象的属性执行就地更新。
此方法根据相应云对象的当前状态更新属性。 这主要用于手动轮询计算状态。
refresh_state()