Поделиться через


Краткое руководство. Создание бессерверного пула Apache Spark с помощью портала Azure

Azure Synapse Analytics предлагает различные аналитические механизмы, которые помогут вам загрузить, преобразовать, моделировать, проанализировать и распространить данные. Пул Apache Spark предоставляет возможности вычислений больших данных с открытым исходным кодом. После создания пула Apache Spark в рабочей области Synapse данные можно загружать, моделировать, обрабатывать и распространять для ускорения анализа.

Из этого краткого руководства вы узнаете, как использовать портал Azure для создания пула Apache Spark в рабочей области Synapse.

Это важно

Экземпляры Spark оплачиваются пропорционально за каждую минуту, независимо от того, используете вы их или нет. Не забудьте завершить работу экземпляра Spark после его использования или задайте короткое время ожидания. Дополнительные сведения см. в разделе Очистка ресурсов этой статьи.

Если у вас нет подписки Azure, создайте бесплатную учетную запись, прежде чем приступить к работе.

Предпосылки

Войдите на портал Azure

Войдите на портал Azure

  1. Перейдите к рабочей области Synapse, в которой будет создан пул Apache Spark, введя имя службы (или напрямую имя ресурса) в строке поиска. Снимок экрана панели поиска на портале Azure с введёнными рабочими областями Synapse.

  2. В списке рабочих областей введите имя (или часть имени) рабочей области, которую нужно открыть. В этом примере используется рабочая область с именем contosoanalytics. Снимок экрана с портала Azure списка рабочих областей Synapse, отфильтрованных для отображения тех, которые содержат имя Contoso.

Создание пула Apache Spark

  1. В рабочей области Synapse, в которой требуется создать пул Apache Spark, выберите новый пул Apache Spark. Снимок экрана портала Azure, на котором рабочая область Synapse с красным выделением вокруг команды создания нового пула Apache Spark.

  2. Введите следующие сведения на вкладке Основные сведения:

    Настройки Предлагаемое значение Описание
    Имя пула Apache Spark Допустимое имя пула, например contosospark Это имя, которое будет у пула Apache Spark.
    Размер узла "Small (4 vCPU / 32 GB)" (Малый (4 виртуальных ЦП / 32 ГБ)) Задайте минимальный размер, чтобы сократить затраты для этого быстрого начала.
    Автомасштабирование Нетрудоспособный Для этого краткого руководства не требуется автомасштабирование
    Количество узлов 5 Используйте небольшой размер, чтобы ограничить затраты для этого быстрого старта.

    Снимок экрана из портала Azure, где показан процесс создания пула Apache Spark — вкладка

    Это важно

    Существуют определенные ограничения для имен, которые могут использовать пулы Apache Spark. Имя должно содержать только буквы и цифры, его длина не должна превышать 15 символов. Имя должно начинаться с буквы, быть уникальными в рабочей области, но не должно содержать зарезервированные слова.

  3. Нажмите кнопку "Далее": дополнительные параметры и просмотрите параметры по умолчанию. Не изменяйте параметры по умолчанию. Снимок экрана: портал Azure, на котором показана страница

  4. Нажмите кнопку "Далее": теги. Рассмотрите возможность использования тегов Azure. Например, тег "Владелец" или "CreatedBy", чтобы определить, кто создал ресурс, и тег "Среда", чтобы определить, находится ли этот ресурс в рабочей среде, разработке и т. д. Дополнительные сведения см. в статье "Разработка стратегии именования и тегов для ресурсов Azure". Снимок экрана из портала Azure, показывающий процесс создания пула Apache Spark — вкладка дополнительных настроек.

  5. Выберите Review + create.

  6. Убедитесь, что сведения выглядят правильно на основе введенных ранее сведений и нажмите кнопку "Создать". Скриншот из портала Azure с процессом создания пула Apache Spark — вкладка «Обзор параметров».

  7. На этом этапе начнется процесс выделения ресурсов, сигнализируя о своем завершении. Снимок экрана: портал Azure, на котором показана страница

  8. После завершения подготовки переход к рабочей области отобразит новую запись для созданного пула Apache Spark. Снимок экрана из портала Azure, показывающий процесс создания пула Apache Spark — выделение ресурсов.

  9. На этом этапе нет ресурсов, не взимается плата за Spark, вы создали метаданные о экземплярах Spark, которые вы хотите создать.

Очистка ресурсов

Ниже описано, как удалить пул Apache Spark из рабочей области.

Предупреждение

Удаление пула Apache Spark приведет к удалению подсистемы аналитики из рабочей области. Больше не удастся подключиться к пулу, а все запросы, конвейеры и записные книжки, использующие этот пул Apache Spark, больше не будут работать.

Если вы хотите удалить пул Apache Spark, сделайте следующее:

  1. Перейдите к области пулов Apache Spark в рабочей области.
  2. Выберите пул Apache Spark для удаления (в данном случае contosospark).
  3. Выберите команду Удалить. Снимок экрана из портала Azure, показывающий список пулов Apache Spark, с недавно созданным пулом, выбранным из этого списка.
  4. Подтвердите удаление и нажмите кнопку "Удалить ". Снимок экрана в портале Azure диалогового окна подтверждения удаления выбранного пула Apache Spark.
  5. После успешного завершения процесса пул Apache Spark больше не будет указываться в ресурсах рабочей области.