Интеграция DBeaver с Azure Databricks
Примечание.
В этой статье описывается инструмент DBeaver, который не предоставляется и не поддерживается Databricks. Чтобы связаться с поставщиком, воспользуйтесь страницей Проблемы репозитория dbeaver/dbeaver на сайте GitHub.
DBeaver — это локальный многоплатформенный инструмент для работы с базами данных для разработчиков, администраторов баз данных, аналитиков данных, инженеров данных и других специалистов, которые работают с базами данных. DBeaver поддерживает Azure Databricks, а также другие популярные базы данных.
В этой статье описывается, как использовать локальный компьютер разработки для установки, настройки и использования бесплатной версии DBeaver Community Edition (CE) с открытым исходным кодом для работы с базами данных в Azure Databricks.
Примечание.
Эта статья была протестирована с помощью macOS, Databricks JDBC Driver версии 2.6.36 и DBeaver CE версии 23.3.0.
Требования
Перед установкой DBeaver убедитесь, что локальный компьютер разработки соответствует следующим требованиям.
- 64-разрядная ОС Linux, macOS или 64-разрядная ОС Windows. (32-разрядная ОС Linux поддерживается, но не рекомендуется к использованию).
- Скачайте драйвер Databricks JDBC на локальный компьютер разработки и извлеките файл
DatabricksJDBC42.jar
из скачанного файлаDatabricksJDBC42-<version>.zip
.
Для подключения к DBeaver необходимо также использовать кластер Azure Databricks или хранилище SQL.
Шаг 1. Установите DBeaver
Загрузите и установите DBeaver CE:
- Linux: загрузите и запустите один из установщиков Linux на странице Загрузка на веб-сайте DBeaver. Кроме того, на этой странице доступны параметры установки
snap
иflatpak
. - macOS: используйте Homebrew для запуска
brew install --cask dbeaver-community
или используйте MacPorts для запускаsudo port install dbeaver-community
. Установщик macOS также доступен на странице Загрузка веб-сайта DBeaver. - Windows: используйте Chocolatey для запуска
choco install dbeaver
. Установщик Windows также доступен на странице Загрузка веб-сайта DBeaver.
Шаг 2. Настройка драйвера JDBC Azure Databricks для DBeaver
Укажите в DBeaver сведения о драйвере Databricks JDBC, который вы скачали ранее.
- Запустите DBeaver.
- Если появится запрос на создание новой базы данных, нажмите кнопку Нет.
- Если отобразится запрос на подключение к базе данных или ее выбор, нажмите кнопку Отмена.
- Нажмите База данных > Диспетчер драйверов.
- В диалоговом окне Диспетчер драйверов выберите Создать.
- В диалоговом окне Создание нового драйвера перейдите на вкладку Библиотеки.
- Щелкните Добавить файл.
- Перейдите к папке, в которую вы извлекли драйвер JDBC Azure Databricks.
- Перейдите на один уровень ниже, чтобы найти
.jar
файл. .jar
Выделите файл и нажмите кнопку "Открыть".- на вкладке Параметры в поле Имя драйвера введите
Databricks
. - На вкладке Параметры в поле Имя класса введите
com.databricks.client.jdbc.Driver
. - Щелкните OK.
- В диалоговом окне Диспетчер драйверов выберите Закрыть.
Шаг 3. Подключение DBeaver к базам данных Azure Databricks
Используйте DBeaver для подключения к кластеру или хранилищу SQL, чтобы получить доступ к базам данных в рабочей области Azure Databricks.
В DBeaver щелкните База данных >Создать подключение к базе данных.
В диалоговом окне Подключение к базе данных на вкладке Все щелкните Databricks, а затем нажмите кнопку Далее.
Щелкните вкладку Main и введите значение в поле URL-адреса JDBC для ресурса Azure Databricks. Синтаксис поля URL-адреса JDBC см. в параметрах проверки подлинности драйвера JDBC Databricks.
Нажмите кнопку Проверить подключение.
Совет
Перед тестированием подключения необходимо запустить ресурс Azure Databricks. В противном случае выполнение теста может занять несколько минут, принимая во внимание запуск ресурса.
Если соединение установлено успешно, в диалоговом окне Проверка соединения нажмите кнопку ОК.
В диалоговом окне Подключение к базе данных нажмите кнопку Готово.
В окне Навигатор базы данных отображается запись Databricks. Чтобы изменить имя подключение для упрощенной идентификации, выполните следующие действия:
- Щелкните правой кнопкой мыши Databricks и выберите Изменить подключение.
- В диалоговом окне Настройка подключения нажмите кнопку Общие.
- В поле Имя соединения замените
Databricks
на другое имя. - Щелкните OK.
Повторите инструкции этого шага для каждого ресурса, который должен быть доступен для DBeaver.
Шаг 4. Использование DBeaver для просмотра объектов данных
Используйте DBeaver для доступа к объектам данных в рабочей области Azure Databricks, таким как таблицы и свойства таблиц, представления, индексы, типы данных и другие типы объектов данных.
В окне Навигатора базы данных в DBeaver щелкните правой кнопкой мыши подключение, которое нужно использовать.
Если параметр Подключение активен, щелкните его. (Если параметр Подключение неактивен, значит вы уже подключены).
Совет
Прежде чем пытаться подключиться к ресурсу, его необходимо запустить. В противном случае подключение может занять несколько минут, принимая во внимание запуск ресурса.
Разверните подключение, к которому вы только что подключились.
Разверните и просмотрите доступные объекты данных. Дважды щелкните объект данных, чтобы просмотреть дополнительные сведения о нем.
Повторите инструкции этого шага, чтобы получить доступ к дополнительным объектам данных.
шаг 5. Использование DBeaver для выполнения инструкций SQL
Используйте DBeaver, чтобы загрузить пример trips
таблицы из samples
схемы каталога nyctaxi
.
В окне Навигатора базы данных в DBeaver щелкните правой кнопкой мыши подключение, которое нужно использовать.
Если параметр Подключение активен, щелкните его. (Если параметр Подключение неактивен, значит вы уже подключены).
Совет
Прежде чем пытаться подключиться к ресурсу, его необходимо запустить. В противном случае подключение может занять несколько минут, принимая во внимание запуск ресурса.
Щелкните Редактор SQL>Создать сценарий SQL.
На вкладке Скрипт-1 (имя подключения) введите следующую инструкцию SQL:
SELECT * FROM samples.nyctaxi.trips;
Щелкните "Редактор > SQL Execute SQL Script" (Выполнить скрипт SQL).
Следующие шаги
- Используйте Редактор объектов базы данных для работы со свойствами объектов базы данных, данными и схемами отношений сущностей.
- Используйте Редактор данных для просмотра и редактирования данных в таблице или представлении базы данных.
- Используйте Редактор SQL для работы со сценариями SQL.
- Работа со схемами отношений сущностей (ERD) в DBeaver.
- Импорт и экспорт данных в DBeaver.
- Перенос данных с помощью DBeaver.
- Устранение проблем с драйвером JDBC в DBeaver.