笔记本是用于在 Azure Databricks 上创建数据科学和机器学习工作流的主要工具。 Databricks 笔记本提供多种语言的实时共同创作、自动版本控制以及用于开发代码和呈现结果的内置数据可视化效果。
笔记本入门
获取分步教程的实践体验,这些教程指导你完成常见用例。
主题 | DESCRIPTION |
---|---|
从笔记本查询和可视化数据 | 使用笔记本查询和可视化使用 SQL、Python、Scala 和 R 存储在 Unity 目录中的示例数据,了解数据科学基础知识。 |
从笔记本导入和可视化 CSV 数据 | 将数据从 CSV 文件导入 Unity 目录,将数据加载到数据帧中,并使用 Python、Scala 和 R 将数据可视化。 |
使用 Databricks 笔记本的 EDA 技术 | 了解在笔记本中使用 Python 进行探索数据分析(EDA)的基础知识,从加载数据到生成见解。 |
端到端经典 ML 模型 | 有关训练经典机器学习模型的完整教程,包括数据加载、可视化、超参数优化和 MLflow 集成。 |
开发和运行笔记本
了解在 Databricks 工作区中创建和使用笔记本的基础知识。
主题 | DESCRIPTION |
---|---|
基本编辑 | 了解有关如何有效使用和编辑笔记本的基础知识,包括单元格类型、键盘快捷方式和基本编辑功能。 |
在笔记本中开发代码 | 使用 Python、SQL、Scala 和 R 编写并执行代码,实现语法高亮和 IntelliSense 功能。 |
运行笔记本 | 使用灵活的计算选项和执行控件执行笔记本和单个单元格。 |
协作和共享工作
与团队协作并有效地共享结果。
主题 | DESCRIPTION |
---|---|
导入和导出笔记本 | 以各种格式导出笔记本,并从外部源导入笔记本。 |
使用笔记本进行协作 | 与团队成员实时共享笔记本、使用批注和协作。 |
笔记本中的仪表板 | 直接从笔记本结果生成和共享交互式仪表板。 |
调试和优化代码
确保笔记本运行顺利且高效。
主题 | DESCRIPTION |
---|---|
使用 Databricks 助手进行代码协助 | 获取 AI 辅助编码帮助,通过智能建议和说明更快地调试和编写更好的代码。 |
调试笔记本 | 使用交互式调试器排查和修复笔记本代码中的问题。 |
单元测试 | 实施单元测试策略来验证笔记本代码并确保可靠性。 |
热门页面
浏览常见的主题和高级功能,以便更好地使用笔记本。
主题 | DESCRIPTION |
---|---|
Databricks 小组件 | 使用小组件可将交互式输入参数添加到笔记本和仪表板。 |
笔记本输出和结果 | 管理单元格输出、处理结果表、应用筛选器以及从笔记本结果下载数据。 |
协调笔记本并模块化代码 | 了解用于协调笔记本工作流和模块化代码的技术。 |
最佳做法 | 遵循建议的做法进行高效且可维护的笔记本开发。 |