Поделиться через


Интеграция DBeaver с Azure Databricks

Примечание.

В этой статье описывается инструмент DBeaver, который не предоставляется и не поддерживается Databricks. Чтобы связаться с поставщиком, воспользуйтесь страницей Проблемы репозитория dbeaver/dbeaver на сайте GitHub.

DBeaver — это локальный многоплатформенный инструмент для работы с базами данных для разработчиков, администраторов баз данных, аналитиков данных, инженеров данных и других специалистов, которые работают с базами данных. DBeaver поддерживает Azure Databricks, а также другие популярные базы данных.

В этой статье описывается, как использовать локальный компьютер разработки для установки, настройки и использования бесплатной версии DBeaver Community Edition (CE) с открытым исходным кодом для работы с базами данных в Azure Databricks.

Примечание.

Эта статья была протестирована с помощью macOS, Databricks JDBC Driver версии 2.6.36 и DBeaver CE версии 23.3.0.

Требования

Перед установкой DBeaver убедитесь, что локальный компьютер разработки соответствует следующим требованиям.

  • 64-разрядная ОС Linux, macOS или 64-разрядная ОС Windows. (32-разрядная ОС Linux поддерживается, но не рекомендуется к использованию).
  • Скачайте драйвер Databricks JDBC на локальный компьютер разработки и извлеките файл DatabricksJDBC42.jar из скачанного файла DatabricksJDBC42-<version>.zip.

Для подключения к DBeaver необходимо также использовать кластер Azure Databricks или хранилище SQL.

Шаг 1. Установите DBeaver

Загрузите и установите DBeaver CE:

  • Linux: загрузите и запустите один из установщиков Linux на странице Загрузка на веб-сайте DBeaver. Кроме того, на этой странице доступны параметры установки snap и flatpak.
  • macOS: используйте Homebrew для запуска brew install --cask dbeaver-community или используйте MacPorts для запуска sudo port install dbeaver-community. Установщик macOS также доступен на странице Загрузка веб-сайта DBeaver.
  • Windows: используйте Chocolatey для запуска choco install dbeaver. Установщик Windows также доступен на странице Загрузка веб-сайта DBeaver.

Шаг 2. Настройка драйвера JDBC Azure Databricks для DBeaver

Укажите в DBeaver сведения о драйвере Databricks JDBC, который вы скачали ранее.

  1. Запустите DBeaver.
  2. Если появится запрос на создание новой базы данных, нажмите кнопку Нет.
  3. Если отобразится запрос на подключение к базе данных или ее выбор, нажмите кнопку Отмена.
  4. Нажмите База данных > Диспетчер драйверов.
  5. В диалоговом окне Диспетчер драйверов выберите Создать.
  6. В диалоговом окне Создание нового драйвера перейдите на вкладку Библиотеки.
  7. Щелкните Добавить файл.
  8. Перейдите к папке, в которую вы извлекли драйвер JDBC Azure Databricks.
  9. Перейдите на один уровень ниже, чтобы найти .jar файл.
  10. .jar Выделите файл и нажмите кнопку "Открыть".
  11. на вкладке Параметры в поле Имя драйвера введите Databricks.
  12. На вкладке Параметры в поле Имя класса введите com.databricks.client.jdbc.Driver.
  13. Щелкните OK.
  14. В диалоговом окне Диспетчер драйверов выберите Закрыть.

Шаг 3. Подключение DBeaver к базам данных Azure Databricks

Используйте DBeaver для подключения к кластеру или хранилищу SQL, чтобы получить доступ к базам данных в рабочей области Azure Databricks.

  1. В DBeaver щелкните База данных >Создать подключение к базе данных.

  2. В диалоговом окне Подключение к базе данных на вкладке Все щелкните Databricks, а затем нажмите кнопку Далее.

  3. Щелкните вкладку Main и введите значение в поле URL-адреса JDBC для ресурса Azure Databricks. Синтаксис поля URL-адреса JDBC см. в параметрах проверки подлинности драйвера JDBC Databricks.

  4. Нажмите кнопку Проверить подключение.

    Совет

    Перед тестированием подключения необходимо запустить ресурс Azure Databricks. В противном случае выполнение теста может занять несколько минут, принимая во внимание запуск ресурса.

  5. Если соединение установлено успешно, в диалоговом окне Проверка соединения нажмите кнопку ОК.

  6. В диалоговом окне Подключение к базе данных нажмите кнопку Готово.

В окне Навигатор базы данных отображается запись Databricks. Чтобы изменить имя подключение для упрощенной идентификации, выполните следующие действия:

  1. Щелкните правой кнопкой мыши Databricks и выберите Изменить подключение.
  2. В диалоговом окне Настройка подключения нажмите кнопку Общие.
  3. В поле Имя соединения замените Databricks на другое имя.
  4. Щелкните OK.

Повторите инструкции этого шага для каждого ресурса, который должен быть доступен для DBeaver.

Шаг 4. Использование DBeaver для просмотра объектов данных

Используйте DBeaver для доступа к объектам данных в рабочей области Azure Databricks, таким как таблицы и свойства таблиц, представления, индексы, типы данных и другие типы объектов данных.

  1. В окне Навигатора базы данных в DBeaver щелкните правой кнопкой мыши подключение, которое нужно использовать.

  2. Если параметр Подключение активен, щелкните его. (Если параметр Подключение неактивен, значит вы уже подключены).

    Совет

    Прежде чем пытаться подключиться к ресурсу, его необходимо запустить. В противном случае подключение может занять несколько минут, принимая во внимание запуск ресурса.

  3. Разверните подключение, к которому вы только что подключились.

  4. Разверните и просмотрите доступные объекты данных. Дважды щелкните объект данных, чтобы просмотреть дополнительные сведения о нем.

Повторите инструкции этого шага, чтобы получить доступ к дополнительным объектам данных.

шаг 5. Использование DBeaver для выполнения инструкций SQL

Используйте DBeaver, чтобы загрузить пример trips таблицы из samples схемы каталога nyctaxi .

  1. В окне Навигатора базы данных в DBeaver щелкните правой кнопкой мыши подключение, которое нужно использовать.

  2. Если параметр Подключение активен, щелкните его. (Если параметр Подключение неактивен, значит вы уже подключены).

    Совет

    Прежде чем пытаться подключиться к ресурсу, его необходимо запустить. В противном случае подключение может занять несколько минут, принимая во внимание запуск ресурса.

  3. Щелкните Редактор SQL>Создать сценарий SQL.

  4. На вкладке Скрипт-1 (имя подключения) введите следующую инструкцию SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Щелкните "Редактор > SQL Execute SQL Script" (Выполнить скрипт SQL).

Следующие шаги

Дополнительные ресурсы