Note
此信息适用于 Databricks CLI 版本 0.205 及更高版本。 The Databricks CLI is in Public Preview.
Databricks CLI use is subject to the Databricks License and Databricks Privacy Notice, including any Usage Data provisions.
The serving-endpoints
command group within the Databricks CLI allows you to create, update, and delete model serving endpoints. 请参阅管理模型服务的端点。
databricks service-endpoints build-logs
检索与所提供的服务模型关联的生成日志。
databricks serving-endpoints build-logs NAME SERVED_MODEL_NAME [flags]
Arguments
NAME
服务模型所属的服务终结点的名称。 此字段为必需字段。
SERVED_MODEL_NAME
将为其检索生成日志的已服务模型的名称。 此字段为必需字段。
选项
databricks 服务终结点创建
创建新的服务终结点。
databricks serving-endpoints create NAME [flags]
Arguments
NAME
服务终结点的名称。 此字段是必需的,并且必须在 Databricks 工作区中是唯一的。 终结点名称可以包含字母数字字符、短划线和下划线。
选项
--budget-policy-id string
要应用于服务终结点的预算策略。
--json JSON
内联 JSON 字符串或 @path 包含请求正文的 JSON 文件的 JSON 文件。
--no-wait
不要等待到达NOT_UPDATING状态
--route-optimized
为服务终结点启用路由优化。
--timeout duration
达到NOT_UPDATING状态的最大时间(默认为 20m0s)
databricks 服务终结点删除
删除服务终结点。
databricks serving-endpoints delete NAME [flags]
Arguments
NAME
要删除的服务终结点的名称。
选项
databricks 服务终结点导出指标
使用 Prometheus 或 OpenMetrics 解释格式检索与提供的服务终结点关联的指标。
databricks serving-endpoints export-metrics NAME [flags]
Arguments
NAME
要为其检索指标的服务终结点的名称。 此字段为必需字段。
选项
databricks 服务终结点获取
检索单个服务终结点的详细信息。
databricks serving-endpoints get NAME [flags]
Arguments
NAME
服务终结点的名称。 此字段为必需字段。
选项
databricks service-endpoints get-open-api
获取 OpenAPI 格式的服务终结点的查询架构。 该架构包含支持的路径、输入和输出格式和数据类型的信息。
databricks serving-endpoints get-open-api NAME [flags]
Arguments
NAME
服务模型所属的服务终结点的名称。 此字段为必需字段。
选项
databricks 服务终结点列表
获取所有服务终结点。
databricks serving-endpoints list [flags]
Arguments
None
选项
databricks 服务终结点日志
检索与所提供的服务模型关联的服务日志。
databricks serving-endpoints logs NAME SERVED_MODEL_NAME [flags]
Arguments
NAME
服务模型所属的服务终结点的名称。 此字段为必需字段。
SERVED_MODEL_NAME
将为其检索日志的已服务模型的名称。 此字段为必需字段。
选项
databricks 服务终结点修补程序
添加或删除服务终结点的标记。
databricks serving-endpoints patch NAME [flags]
Arguments
NAME
要修补的标记的服务终结点的名称。 此字段为必需字段。
选项
--json JSON
内联 JSON 字符串或 @path 包含请求正文的 JSON 文件的 JSON 文件。
databricks 服务终结点放置
服务终结点的更新速率限制。
Note
已弃用:请改用 AI 网关来管理速率限制。
databricks serving-endpoints put NAME [flags]
Arguments
NAME
正在更新速率限制的服务终结点的名称。 此字段为必需字段。
选项
--json JSON
内联 JSON 字符串或 @path 包含请求正文的 JSON 文件的 JSON 文件。
databricks service-endpoints put-ai-gateway
更新服务终结点的 AI 网关。 完全支持外部模型、预配吞吐量和按令牌付费终结点;代理终结点目前仅支持推理表。
databricks serving-endpoints put-ai-gateway NAME [flags]
Arguments
NAME
正在更新其 AI 网关的服务终结点的名称。 此字段为必需字段。
选项
--json JSON
内联 JSON 字符串或 @path 包含请求正文的 JSON 文件的 JSON 文件。
databricks 服务终结点查询
查询服务终结点。
databricks serving-endpoints query NAME [flags]
Arguments
NAME
服务终结点的名称。 此字段为必需字段。
选项
--json JSON
内联 JSON 字符串或 @path 包含请求正文的 JSON 文件的 JSON 文件。
--max-tokens int
The max tokens field used ONLY for completions and chat external & foundation model serving endpoints.
--n int
The n (number of candidates) field used ONLY for completions and chat external & foundation model serving endpoints.
--stream
The stream field used ONLY for completions and chat external & foundation model serving endpoints.
--temperature float
The temperature field used ONLY for completions and chat external & foundation model serving endpoints.
databricks service-endpoints update-config
更新服务终结点的服务实体、这些服务实体的计算配置和终结点的流量配置的任何组合。在当前更新完成或失败之前,无法更新已有更新的终结点。
databricks serving-endpoints update-config NAME [flags]
Arguments
NAME
要更新的服务终结点的名称。 此字段为必需字段。
选项
--json JSON
内联 JSON 字符串或 @path 包含请求正文的 JSON 文件的 JSON 文件。
--no-wait
不要等待到达NOT_UPDATING状态
--timeout duration
达到NOT_UPDATING状态的最大时间(默认为 20m0s)
databricks 服务终结点 get-permission-levels
获取服务终结点权限级别。
databricks serving-endpoints get-permission-levels SERVING_ENDPOINT_ID [flags]
Arguments
SERVING_ENDPOINT_ID
要为其获取或管理权限的服务终结点。
选项
databricks service-endpoints get-permissions
获取服务终结点权限。
获取服务终结点的权限。 服务终结点可以从其根对象继承权限。
databricks serving-endpoints get-permissions SERVING_ENDPOINT_ID [flags]
Arguments
SERVING_ENDPOINT_ID
要为其获取或管理权限的服务终结点。
选项
databricks service-endpoints set-permissions
设置服务终结点权限。
databricks serving-endpoints set-permissions SERVING_ENDPOINT_ID [flags]
Arguments
SERVING_ENDPOINT_ID
要为其获取或管理权限的服务终结点。
选项
--json JSON
内联 JSON 字符串或 @path 包含请求正文的 JSON 文件的 JSON 文件。
databricks service-endpoints update-permissions
更新服务终结点的权限。 服务终结点可以从其根对象继承权限。
databricks serving-endpoints update-permissions SERVING_ENDPOINT_ID [flags]
Arguments
SERVING_ENDPOINT_ID
要为其获取或管理权限的服务终结点。
选项
--json JSON
内联 JSON 字符串或 @path 包含请求正文的 JSON 文件的 JSON 文件。
Global flags
--debug
是否启用调试日志记录。
-h
或 --help
显示 Databricks CLI、相关命令组或相关命令的帮助。
--log-file
字符串
一个字符串,表示要将输出日志写入到的文件。 如果未指定此标志,则默认会将输出日志写入到 stderr。
--log-format
格式
日志格式类型或 text
json
。 默认值是 text
。
--log-level
字符串
一个表示日志格式级别的字符串。 如果未指定,则禁用日志格式级别。
-o, --output
类型
命令输出类型或 text
json
。 默认值是 text
。
-p, --profile
字符串
用于运行命令的文件中配置文件 ~/.databrickscfg
的名称。 如果未指定此标志,则如果存在,则使用命名 DEFAULT
的配置文件。
--progress-format
格式
显示进度日志的格式: default
、 append
、 inplace
或 json
-t, --target
字符串
如果适用,要使用的捆绑包目标