获取数据概述

Power Query 可以连接到许多不同的数据源,以便处理所需的数据。 本文指导你完成在 Power Query Desktop 或 Power Query Online 中将数据引入 Power Query 的步骤。

使用 Power Query 连接到数据源时,会遵循一组标准步骤,然后将数据传输到目标位置。 本文介绍每个阶段。

重要

在某些情况下,连接器可能具有获取数据体验的所有阶段,在其他情况下,连接器可能只包含其中的一些阶段。 有关特定连接器体验的详细信息,请在Power Query 文章中搜索相应的连接器,以找到文档。

Power Query Desktop 体验

在 Power Query Desktop 体验中获取数据的阶段包括:

  1. 连接设置

  2. 身份验证

  3. 数据预览

  4. 查询目标

说明获取数据的四个阶段的流程图。

1.连接设置

大多数连接器最初至少需要一个参数来初始化与数据源的连接。 例如,SQL Server 连接器至少需要主机名才能与 SQL Server 数据库建立连接。

SQL Server 连接器参数的屏幕截图。

相比之下,尝试连接到 Excel 文件时,Power Query 要求使用文件路径查找要连接到的文件。

连接器参数通常用于建立与数据源的连接,它们与使用的连接器一起定义 数据源路径

注释

某些连接器根本不要求输入任何参数。 这些连接器被称为singleton 连接器,每个环境仅有一个数据源路径可用。 一些示例包括 Adobe Analytics、MailChimp 和 Google Analytics。

2. 身份验证

在 Power Query 中建立的每个连接都必须进行身份验证。 身份验证方法因连接器到连接器而异,某些连接器可能提供多种身份验证方法。

Power Query 目前可用的身份验证方法包括:

  • 匿名:通常用于连接到不需要用户身份验证的数据源,例如通过公共 HTTP 提供的网页或文件。
  • API 密钥:接受单个 API 密钥进行身份验证。
  • 基本:接受以 base64 编码发送的用户名和密码进行身份验证。
  • 数据库:此方法仅在某些数据库连接器中可用。
  • 组织帐户Microsoft帐户:此方法也称为 OAuth 2.0
  • 服务主体:使用 Microsoft Entra ID 进行身份验证。
  • Windows:可以是隐式或显式的。

例如,SQL Server 数据库连接器的可用身份验证方法是 Windows、数据库和Microsoft帐户。

SQL Server 数据库连接器身份验证方法的屏幕截图。

3. 数据预览

数据预览阶段的目标是为你提供用户友好的预览和选择数据的方式。

根据所使用的连接器,可以使用以下任一方法预览数据:

  • 导航器窗口
  • “表预览”对话框

导航器窗口由两个主要部分组成:

  • 对象选择窗格显示在窗口左侧。 用户可以与这些对象进行交互并选择这些对象。

    注释

    对于 Excel 中的 Power Query,请从导航窗口左上角选择 多个项目 选项,在对象选择窗格中一次选择多个对象。

    注释

    Power Query Desktop 中的对象列表限制为 10,000 项。 Power Query Online 中不存在此限制。 有关 Power Query Desktop 中的解决方法,请转到 对象限制解决方法

  • 窗口右侧的数据预览窗格显示所选对象的数据的预览。

    Power Query Desktop 中 SQL Server 连接器导航器窗口的屏幕截图。

对象限制解决方法

Power Query Desktop 中的 导航器 中存在 10,000 个对象的固定限制。 Power Query Online 中不会发生此限制。 Power Query Online UI 最终将替换桌面中的 UI。

在此期间,可以使用以下解决方法:

  1. 右键单击 导航器的根节点,然后选择“ 转换数据”。

    导航器的屏幕截图,其中突出显示了下拉菜单中的数据转换。

  2. 然后,Power Query 编辑器将在表预览区域中打开完整的导航表。 此视图对对象数没有限制,可以使用筛选器或任何其他 Power Query 转换来浏览列表并查找所需的行(例如,基于 “名称 ”列)。

  3. 找到所需的项后,可以通过选择数据链接(如下图中的 链接)来获取内容。

    选择“表”链接以查看内容。

“表预览”对话框

“表预览”对话框仅包含数据预览的一个部分。 提供此体验和窗口的连接器示例是 文件夹 连接器。

文件夹连接器表预览对话框的屏幕截图。

4. 查询目标

在此阶段,请指定加载查询的位置。 这些选项因集成而异,但始终可用的一个选项是 转换数据,将数据加载到 Power Query 编辑器以进一步转换和扩充查询。

导航器窗口和表预览中获取数据加载目标的屏幕截图。

Power Query Online 体验

在 Power Query Online 中获取数据的阶段包括:

  1. 连接设置和身份验证

  2. 数据预览

  3. 查询编辑器

在 Power Query Online 中获取数据的三个阶段的流程图。

1.连接设置和身份验证

在 Power Query Online 体验中,从 “连接到数据源 ”页开始,可在两个不同的部分中输入值:

  • 连接设置

  • 连接凭据

    使用 SQL Server 数据库连接器连接到数据源页的屏幕截图。

连接设置

在“连接设置”部分中,定义与数据源建立连接所需的信息。 根据连接器,该信息可以是服务器的名称、数据库的名称、文件夹路径、文件路径或连接器建立与数据源的连接所需的其他信息。 某些连接器还启用特定的子部分或高级选项,以便在连接到数据源时提供更多控制和选项。

“连接到数据源”对话框的屏幕截图,其中展开了“高级选项”部分。

连接凭据

首次使用 Power Query 连接到特定数据源时,需要创建与该数据源关联的新连接。 连接是指网关、凭据、隐私级别和其他特定于连接器的字段的完整定义,这些元素共同构成了与数据源建立连接所需的凭据。

注释

某些连接器在连接凭据部分提供特定字段,用于启用或定义与需要建立的连接相关的任何类型的安全性。 例如,Amazon Redshift 连接器提供 “使用加密连接 ”字段。

在连接到数据源的对话框中输入所有信息,用于创建新的连接。

定义连接所需的主要信息由所有连接器提供:

  • 连接名称: 可以定义以唯一标识连接的名称。 不能在您的环境中重复使用连接名称。
  • 数据网关: 如果数据源需要数据网关,请使用此字段中的下拉列表选择网关。
  • 身份验证类型和凭据: 根据连接器,你会看到多个可用于建立连接的身份验证类型选项,以及在其中输入凭据的字段。 例如,如果选择了 Windows 身份验证类型,则会显示需要填写以建立连接的用户名和密码字段。
  • 隐私级别:可以为数据源定义“无”、“专用”、“组织”或“公共”的隐私级别。

注释

若要详细了解数据网关是什么以及如何为环境或租户注册新网关,请转到 使用本地数据网关

重要

某些 Power Query 集成当前暂不启用定义的连接或隐私级别。 但是,所有 Power Query Online 体验都提供了定义数据网关、身份验证种类和与数据源建立连接所需的凭据的方法。

定义 Power Query Online 中的连接后,可以在以后重复使用同一连接,而无需再次重新输入所有这些信息。 “ 连接” 字段提供一个下拉菜单,可在其中选择已定义的连接。 选择已定义的连接后,无需在选择 “下一步”之前输入任何其他详细信息。

用于连接数据源的对话框,其中连接名称是从连接字段中的下拉菜单中选择的。

从此菜单中选择连接后,您还可以在项目中更改数据源的凭据、隐私级别、数据网关以及其他连接器特定字段。 选择 “编辑连接”,然后在“ 连接”下,选择“ 创建新连接”。 然后更改提供的任何字段。

连接到数据源的对话框,其中连接名称是从连接字段中的下拉菜单中选择的。

2. 数据预览

数据预览阶段的目标是为你提供用户友好的预览和选择数据的方式。

根据所使用的连接器,可以使用以下任一方法预览数据:

  • 导航器窗口
  • “表预览”对话框

导航器窗口由两个主要部分组成:

  • 对象选择窗格显示在窗口左侧。 用户可以与这些对象进行交互并选择这些对象。

  • 窗口右侧的数据预览窗格显示所选对象的数据的预览。

    Power Query Online 中 SQL Server 连接器导航器窗口的屏幕截图。

Power Query Online 中的“表预览”对话框

“表预览”对话框仅包含数据预览的一个部分。 提供此体验和窗口的连接器示例是 文件夹 连接器。

表预览对话框的屏幕截图。

3. 查询编辑器

对于 Power Query Online,需要将数据加载到 Power Query 编辑器中。 在编辑器中,可以选择进一步转换和扩充查询。

加载到 Power Query 编辑器中的示例查询的屏幕截图

其他信息

若要更好地了解如何使用 Power Query 的不同产品集成获取数据,请转到 “获取数据的位置”。