Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Azure Synapse Analytics предлагает различные аналитические механизмы, которые помогут вам загрузить, преобразовать, моделировать, проанализировать и распространить данные. Пул Apache Spark предоставляет возможности вычислений больших данных с открытым исходным кодом. После создания пула Apache Spark в рабочей области Synapse данные можно загружать, моделировать, обрабатывать и распространять для ускорения анализа.
Из этого краткого руководства вы узнаете, как использовать портал Azure для создания пула Apache Spark в рабочей области Synapse.
Это важно
Экземпляры Spark оплачиваются пропорционально за каждую минуту, независимо от того, используете вы их или нет. Не забудьте завершить работу экземпляра Spark после его использования или задайте короткое время ожидания. Дополнительные сведения см. в разделе Очистка ресурсов этой статьи.
Если у вас нет подписки Azure, создайте бесплатную учетную запись, прежде чем приступить к работе.
Предпосылки
- Вам понадобится подписка Azure. При необходимости создайте бесплатную учетную запись Azure.
- Вы будете использовать Synapse рабочую область.
Войдите на портал Azure
Войдите на портал Azure
Перейдите в рабочую область Synapse
Перейдите к рабочей области Synapse, в которой будет создан пул Apache Spark, введя имя службы (или напрямую имя ресурса) в строке поиска.
В списке рабочих областей введите имя (или часть имени) рабочей области, которую нужно открыть. В этом примере используется рабочая область с именем contosoanalytics.
Создание пула Apache Spark
В рабочей области Synapse, в которой требуется создать пул Apache Spark, выберите новый пул Apache Spark.
Введите следующие сведения на вкладке Основные сведения:
Настройки Предлагаемое значение Описание Имя пула Apache Spark Допустимое имя пула, например contosospark
Это имя, которое будет у пула Apache Spark. Размер узла "Small (4 vCPU / 32 GB)" (Малый (4 виртуальных ЦП / 32 ГБ)) Задайте минимальный размер, чтобы сократить затраты для этого быстрого начала. Автомасштабирование Нетрудоспособный Для этого краткого руководства не требуется автомасштабирование Количество узлов 5 Используйте небольшой размер, чтобы ограничить затраты для этого быстрого старта. Это важно
Существуют определенные ограничения для имен, которые могут использовать пулы Apache Spark. Имя должно содержать только буквы и цифры, его длина не должна превышать 15 символов. Имя должно начинаться с буквы, быть уникальными в рабочей области, но не должно содержать зарезервированные слова.
Нажмите кнопку "Далее": дополнительные параметры и просмотрите параметры по умолчанию. Не изменяйте параметры по умолчанию.
Нажмите кнопку "Далее": теги. Рассмотрите возможность использования тегов Azure. Например, тег "Владелец" или "CreatedBy", чтобы определить, кто создал ресурс, и тег "Среда", чтобы определить, находится ли этот ресурс в рабочей среде, разработке и т. д. Дополнительные сведения см. в статье "Разработка стратегии именования и тегов для ресурсов Azure".
Выберите Review + create.
Убедитесь, что сведения выглядят правильно на основе введенных ранее сведений и нажмите кнопку "Создать".
На этом этапе начнется процесс выделения ресурсов, сигнализируя о своем завершении.
После завершения подготовки переход к рабочей области отобразит новую запись для созданного пула Apache Spark.
На этом этапе нет ресурсов, не взимается плата за Spark, вы создали метаданные о экземплярах Spark, которые вы хотите создать.
Очистка ресурсов
Ниже описано, как удалить пул Apache Spark из рабочей области.
Предупреждение
Удаление пула Apache Spark приведет к удалению подсистемы аналитики из рабочей области. Больше не удастся подключиться к пулу, а все запросы, конвейеры и записные книжки, использующие этот пул Apache Spark, больше не будут работать.
Если вы хотите удалить пул Apache Spark, сделайте следующее:
- Перейдите к области пулов Apache Spark в рабочей области.
- Выберите пул Apache Spark для удаления (в данном случае contosospark).
- Выберите команду Удалить.
- Подтвердите удаление и нажмите кнопку "Удалить ".
- После успешного завершения процесса пул Apache Spark больше не будет указываться в ресурсах рабочей области.