fs 命令组

Note

此信息适用于 Databricks CLI 版本 0.205 及更高版本。 Databricks CLI 目前处于公共预览阶段。

Databricks CLI 的使用须遵守 Databricks 许可Databricks 隐私声明,包括任何数据使用规定。

Databricksfs CLI 中的命令组允许对 Unity 目录中的Databricks 文件系统(DBFS)执行文件系统作。

fs命令需要卷路径以dbfs:/Volumes开头,并且需要 DBFS 中的目录和文件路径以dbfs:/开头。

若要对目录中的 /Workspace 工作区文件执行作,请使用 databricks workspace 命令。 请参阅 workspace 命令组

Important

不支持对启用了防火墙的存储容器使用 Databricks CLI 或 REST API。 Databricks 建议使用 Databricks Connectaz storage

databricks fs cat

输出文件的内容。 指定 DBFS 中文件的路径。

databricks fs cat FILE_PATH [flags]

Arguments

FILE_PATH

    要输出的文件

选项

全局标志

Examples

以下示例输出了在指定卷的根中或 DBFS 根的 babynames.csv 目录中找到的名为 tmp 的文件的内容:

databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv

以下示例返回错误,因为它们尝试输出目录的内容而不是文件:

databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp

databricks fs cp

复制目录或文件。 指定指向要复制的源目录或文件的路径及其目标。 可以在本地系统文件和 DBFS 之间复制目录和文件,还可以在 DBFS 路径之间复制目录和文件。

如果省略 cp,则 file:/ 命令将采用 file:/

databricks fs cp SOURCE_PATH TARGET_PATH [flags]

Arguments

SOURCE_PATH

    源目录或文件路径

TARGET_PATH

    目标目录或文件路径

选项

--overwrite

    覆盖现有文件

-r, --recursive

    以递归方式复制目录中的文件

全局标志

Examples

以下示例将名为 squirrel-data 的目录及其内容从本地文件系统路径复制到指定卷的根中或 DBFS 根中的 squirrels 目录。

databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r

以下示例将名为 squirrels.csv 的文件从本地文件系统路径复制到指定卷的根中或 DBFS 根中名为 squirrel-data 的目录。 如果目标中已存在该文件,则会覆盖该文件。

databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite

databricks fs ls

列出卷或 DBFS 中指定目录的内容。

databricks fs ls DIR_PATH [flags]

Arguments

DIR_PATH

    目录路径

选项

--absolute

    显示绝对路径。

--long, -l

    显示自 Epoch 以来的大小、文件类型和修改时间(以毫秒为单位)的完整信息。

全局标志

Examples

以下示例列出了在指定卷的根中或 DBFS 根中找到的对象的名称:

databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/

以下示例列出在指定卷的根目录或DBFS根目录内的tmp目录中找到的对象的详细信息(完整信息):

databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l

以下示例列出了在指定卷的根中或 DBFS 根的 tmp 目录中找到的对象的完整信息以及对象的完整路径:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute

databricks fs mkdir

创建目录。 指定要在卷或 DBFS 中创建的目录的路径。 如果该目录已存在,则不会执行任何操作。

databricks fs mkdir DIR_PATH [flags]

Arguments

DIR_PATH

    要创建的目录路径

选项

全局标志

Examples

以下示例在指定卷的根中或 DBFS 根的名为 squirrel-data 的目录中创建名为 tmp 的目录:

databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data

databricks fs rm

删除目录。 指定 DBFS 中现有目录的路径。

如果目录存在但不是空的,则返回错误。 如果目录不存在,则不会发生任何动作。

databricks fs rm PATH [flags]

Arguments

PATH

    DBFS 中现有目录的路径

选项

-r, --recursive

    删除所有内容

全局标志

Examples

以下示例从指定卷的根中或 DBFS 根的 squirrel-data 目录中删除名为 tmp 的目录:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data

以下示例从指定卷的根中或 DBFS 根的 squirrel-data 目录中删除名为 tmp 的非空目录:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r

全局标志

--debug

  是否启用调试日志记录。

-h--help

    显示 Databricks CLI、相关命令组或相关命令的帮助。

--log-file 字符串

    一个字符串,表示要将输出日志写入到的文件。 如果未指定此标志,则默认会将输出日志写入到 stderr。

--log-format 格式

    日志格式类型,textjson。 默认值是 text

--log-level 字符串

    一个表示日志格式级别的字符串。 如果未指定,则禁用日志格式级别。

-o, --output 类型

    命令输出类型为textjson。 默认值是 text

-p, --profile 字符串

     ~/.databrickscfg 文件中用于运行命令的配置文件的名称。 如果未指定此标志,则如果存在,将使用名为 DEFAULT 的配置文件。

--progress-format 格式

    显示进度日志的格式: defaultappendinplacejson

-t, --target 字符串

    如适用,要使用的捆绑包目标