このページでは、Azure Databricks で Notebooks をインポートおよびエクスポートする方法と、Azure Databricks でサポートされている Notebooks 形式について説明します。
サポートされている Notebooks 形式
Databricks では Notebooks を次の形式でインポートおよびエクスポートできます。
- ソース ファイル: 拡張子が
.scala
、.py
、.sql
、または.r
のソース コード ステートメントのみを含むファイル。 - HTML: 拡張子が
.html
の Azure Databricks Notebooks。 - Databricks
.dbc
アーカイブ。 - IPython Notebook: 拡張子が
.ipynb
の Jupyter Notebook。 - RMarkdown: 拡張子が
.Rmd
の R Markdown ドキュメント。
Notebooks をインポートする
URL またはファイルから外部 Notebooks をインポートできます。 Azure Databricks ワークスペースから一括エクスポートされた Notebooks の ZIP アーカイブをインポートすることもできます。
- サイドバーで、
[ワークスペース] をクリックします。 次のいずれかの操作を行います。
- フォルダーを右クリックし、[インポート] を選択します。
- 現在のワークスペース フォルダーの最上位レベルにある Notebooks をインポートするには、右上にある kebab メニューをクリックし、[インポート] を選択します。
- URL を指定するか、サポートされている外部形式、または Azure Databricks ワークスペースからエクスポートされた Notebooks の ZIP アーカイブを含むファイルを参照します。
- [インポート] をクリックします。
- 1 つの Notebooks を選択すると、現在のフォルダーにエクスポートされます。
- DBC または ZIP アーカイブを選択すると、そのフォルダー構造が現在のフォルダーに再作成され、各 Notebooks がインポートされます。
ファイルをノートブックに変換する
ワークスペース内の資産は、 .ipynb
拡張子を持つ場合、または最初の行のコメントに文字列 Databricks notebook source
が含まれており、 .py
、 .r
、 .scala
、 .sql
のいずれかの拡張子を持つ場合、ノートブックとして識別されます。 これらの条件を変更するノートブックまたはファイルの書き込みまたは名前変更は、ノートブックまたはファイルの種類も変更します。 たとえば、1 行目が myfile.txt
である # Databricks notebook source
ファイルがある場合、そのファイルの名前を myfile.py
に変更すると、Notebooks に変換されます。
Note
ノートブックの IPYNB またはソース形式が特定の場合、ファイルとノートブックの種類を変換すると、予期しない結果が生じる可能性があります。 「ノートブックの形式」を参照してください。
Python、SQL、Scala、R スクリプトを単一セルノートブックに変換するには、ファイルの最初のセルにコメントを追加します。
Python
# Databricks notebook source
SQL
-- Databricks notebook source
スカラ (プログラミング言語)
// Databricks notebook source
R
# Databricks notebook source
スクリプトでセルを定義するには、次に示す特別なコメントを使用します。 スクリプトを Databricks にインポートすると、示されている COMMAND
行でマークされたセルが作成されます。
Python
# COMMAND ----------
SQL
-- COMMAND ----------
スカラ (プログラミング言語)
// COMMAND ----------
R
# COMMAND ----------
ノートブックをエクスポートする
Note
Notebooks を HTML、IPython Notebooks (.ipynb)、またはアーカイブ (DBC) としてエクスポートし、コマンド出力を消去していない場合は、その出力がエクスポートに含まれます。
Notebooks をエクスポートするには、Notebooks ツール バーの [ファイル] > [エクスポート] を選び、エクスポート形式を選びます。
ワークスペース フォルダー内のすべてのフォルダーを ZIP アーカイブとしてエクスポートするには:
サイドバーで、
[ワークスペース] をクリックします。
フォルダーを右クリックし、 [エクスポート] を選択します。
エクスポート形式を選択します。
- DBC アーカイブ: Databricks アーカイブをエクスポートします。これは、メタデータと Notebooks コマンドの出力を含むバイナリ形式です。
- ソース ファイル: ノートブック ソース ファイルの ZIP アーカイブをエクスポートします。これは、Azure Databricks ワークスペースにインポートしたり、CI/CD パイプラインで使用したり、各ノートブックの既定の言語でソース ファイルとして表示したりできます。 Notebooks コマンドの出力は含まれません。
- HTML アーカイブ: HTML ファイルの ZIP アーカイブをエクスポートします。 各ノートブックの HTML ファイルは、Azure Databricks ワークスペースにインポートすることも、HTML として表示することもできます。 Notebooks コマンドの出力が含まれています。