Note
此信息适用于 Databricks CLI 版本 0.205 及更高版本。 Databricks CLI 目前处于公共预览阶段。
Databricks CLI 的使用须遵守 Databricks 许可和 Databricks 隐私声明,包括任何数据使用规定。
Databricksfs
CLI 中的命令组允许对 Unity 目录中的卷和 Databricks 文件系统(DBFS)执行文件系统作。
fs
命令需要卷路径以dbfs:/Volumes
开头,并且需要 DBFS 中的目录和文件路径以dbfs:/
开头。
若要对目录中的 /Workspace
工作区文件执行作,请使用 databricks workspace
命令。 请参阅 workspace
命令组。
Important
不支持对启用了防火墙的存储容器使用 Databricks CLI 或 REST API。 Databricks 建议使用 Databricks Connect 或 az storage。
databricks fs cat
输出文件的内容。 指定 DBFS 中文件的路径。
databricks fs cat FILE_PATH [flags]
Arguments
FILE_PATH
要输出的文件
选项
Examples
以下示例输出了在指定卷的根中或 DBFS 根的 babynames.csv
目录中找到的名为 tmp
的文件的内容:
databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv
以下示例返回错误,因为它们尝试输出目录的内容而不是文件:
databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp
databricks fs cp
复制目录或文件。 指定指向要复制的源目录或文件的路径及其目标。 可以在本地系统文件和 DBFS 之间复制目录和文件,还可以在 DBFS 路径之间复制目录和文件。
如果省略 cp
,则 file:/
命令将采用 file:/
。
databricks fs cp SOURCE_PATH TARGET_PATH [flags]
Arguments
SOURCE_PATH
源目录或文件路径
TARGET_PATH
目标目录或文件路径
选项
--overwrite
覆盖现有文件
-r, --recursive
以递归方式复制目录中的文件
Examples
以下示例将名为 squirrel-data
的目录及其内容从本地文件系统路径复制到指定卷的根中或 DBFS 根中的 squirrels
目录。
databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r
以下示例将名为 squirrels.csv
的文件从本地文件系统路径复制到指定卷的根中或 DBFS 根中名为 squirrel-data
的目录。 如果目标中已存在该文件,则会覆盖该文件。
databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite
databricks fs ls
列出卷或 DBFS 中指定目录的内容。
databricks fs ls DIR_PATH [flags]
Arguments
DIR_PATH
目录路径
选项
--absolute
显示绝对路径。
--long, -l
显示自 Epoch 以来的大小、文件类型和修改时间(以毫秒为单位)的完整信息。
Examples
以下示例列出了在指定卷的根中或 DBFS 根中找到的对象的名称:
databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/
以下示例列出在指定卷的根目录或DBFS根目录内的tmp
目录中找到的对象的详细信息(完整信息):
databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l
以下示例列出了在指定卷的根中或 DBFS 根的 tmp
目录中找到的对象的完整信息以及对象的完整路径:
databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute
databricks fs mkdir
创建目录。 指定要在卷或 DBFS 中创建的目录的路径。 如果该目录已存在,则不会执行任何操作。
databricks fs mkdir DIR_PATH [flags]
Arguments
DIR_PATH
要创建的目录路径
选项
Examples
以下示例在指定卷的根中或 DBFS 根的名为 squirrel-data
的目录中创建名为 tmp
的目录:
databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data
databricks fs rm
删除目录。 指定 DBFS 中现有目录的路径。
如果目录存在但不是空的,则返回错误。 如果目录不存在,则不会发生任何动作。
databricks fs rm PATH [flags]
Arguments
PATH
DBFS 中现有目录的路径
选项
-r, --recursive
删除所有内容
Examples
以下示例从指定卷的根中或 DBFS 根的 squirrel-data
目录中删除名为 tmp
的目录:
databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data
以下示例从指定卷的根中或 DBFS 根的 squirrel-data
目录中删除名为 tmp
的非空目录:
databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r
全局标志
--debug
是否启用调试日志记录。
-h
或 --help
显示 Databricks CLI、相关命令组或相关命令的帮助。
--log-file
字符串
一个字符串,表示要将输出日志写入到的文件。 如果未指定此标志,则默认会将输出日志写入到 stderr。
--log-format
格式
日志格式类型,text
或 json
。 默认值是 text
。
--log-level
字符串
一个表示日志格式级别的字符串。 如果未指定,则禁用日志格式级别。
-o, --output
类型
命令输出类型为text
或json
。 默认值是 text
。
-p, --profile
字符串
~/.databrickscfg
文件中用于运行命令的配置文件的名称。 如果未指定此标志,则如果存在,将使用名为 DEFAULT
的配置文件。
--progress-format
格式
显示进度日志的格式: default
、 append
、 inplace
或 json
-t, --target
字符串
如适用,要使用的捆绑包目标