在开始数据科学端到端教程系列之前,请先了解先决条件、如何导入笔记本以及如何将湖屋附加到这些笔记本。
先决条件
获取 Microsoft Fabric 订阅。 或者,注册免费的 Microsoft Fabric 试用版。
登录 Microsoft Fabric。
使用主页左下侧的体验切换器切换到 Fabric。
- 如果没有 Microsoft Fabric 湖屋,请按照在 Microsoft Fabric 中创建湖屋中的步骤创建一个。
创建笔记本
Get Started 端到端系列中的每个教程都可用作 GitHub 中的 Jupyter 笔记本文件。 其他许多教程也可用作数据科学工作负载中的示例。 使用以下方法之一访问教程:
创建新笔记本,然后复制并粘贴本教程中的代码。
-
在左窗格中,选择 工作负载。
选择 数据科学。
在“浏览示例”卡片中,选择“选择”。
选择相应的示例:
- 默认情况下,如果示例是针对 Python 教程,请从 端到端工作流(Python) 选项卡开始。
- 如果示例对应的是 R 教程,则从“端到端工作流(R)”选项卡中进行选择。
- 如果示例对应的是快速教程,则从“快速教程”选项卡中进行选择。
将湖屋附加到笔记本
为了演示 Fabric Lakehouse 的功能,许多教程都需要将默认的 Lakehouse 附加到笔记本中。 以下步骤显示如何将湖屋添加到已启用 Fabric 的工作区中的笔记本中。
注意
在执行每个笔记本之前,需要在该笔记本上执行这些步骤。
在工作区中打开笔记本。
在左窗格中选择“添加湖屋”。
创建新的湖屋或使用现有的湖屋。
- 若要创建新的湖屋,请选择“新建”。 为湖屋命名并选择 创建。
- 若要使用现有的湖仓,请选择 现有的湖仓 打开 数据枢纽 对话框。 选择要使用的湖屋,然后选择“添加”。
添加湖屋后,它将显示在湖屋窗格中,你可以查看存储在 Lakehouse 中的表和文件。
下一步
第 1 部分:使用 Apache Spark 将数据引入 Fabric Lakehouse