DataGrip と Azure Databricks との統合
注意
この記事では、Databricks によって提供もサポートもされていない DataGrip について説明します。 プロバイダーに問い合わせるには、DataGrip のサポートをご覧ください。
DataGrip は、データベース開発者向けの統合開発環境 (IDE) です。クエリ コンソール、スキーマ ナビゲーション、explain プラン、スマート コード補完、リアルタイム分析とクイック修正、リファクタリング、バージョン管理の統合などの機能が用意されています。
この記事では、ローカルの開発マシンを使用して、Azure Databricks でデータベースを操作するために DataGrip をインストール、構成、使用する方法について説明します。
Note
この記事は、macOS、Databricks JDBC ドライバー バージョン 2.6.36、DataGrip バージョン 2023.3.1 でテストされました。
要件
DataGrip をインストールする前に、ローカル開発マシンが次の要件を満たしている必要があります。
- Linux、macOS、または Windows オペレーティング システム。
- Databricks JDBC ドライバーをローカル開発マシンにダウンロードし、ダウンロードした
DatabricksJDBC42-<version>.zip
ファイルからDatabricksJDBC42.jar
ファイルを抽出します。 - DataGrip と接続する Azure Databricks クラスターまたは SQL ウェアハウス。
手順 1: DataGrip をインストールする
DataGrip をダウンロードしてインストールします。
- Linux:
.zip
ファイルをダウンロードし、その内容を抽出して、Install-Linux-tar.txt
ファイルの指示に従います。 - macOS:
.dmg
ファイルをダウンロードして実行します。 - Windows:
.exe
ファイルをダウンロードして実行します。
詳細については、DataGrip Web サイトの DataGrip のインストールに関するページを参照してください。
手順 2: DataGrip 用に Databricks JDBC ドライバーを構成する
前にダウンロードした Databricks JDBC ドライバーに関する情報を使用して DataGrip を設定します。
- DataGrip を起動します。
- [ファイル] > [データ ソース] の順にクリックします。
- [データソースとドライバー] ダイアログボックスで、[ドライバー] タブをクリックします。
- ドライバーを追加するには、+ ([ドライバー]) ボタンをクリックします。
- 名前には、
Databricks
を入力します。 - [全般] タブの [ドライバー ファイル] 一覧で、+ ([追加]) ボタンをクリックします。
- [カスタム JAR] タイルをクリックします。
- 先ほど抽出した
DatabricksJDBC42.jar
ファイルを参照して選択し、[開く] をクリックします。 - クラス には
com.databricks.client.jdbc.Driver
を選択します。 - [OK] をクリックします。
手順 3: DataGrip を Azure Databricks データベースに接続する
DataGrip で、[ファイル] > [データ ソース] の順にクリックします。
[データ ソース] タブで、+ ([追加]) ボタンをクリックします。
前の手順で追加した Databricks ドライバーを選択します。
[全般] タブの [URL] に、Azure Databricks リソースの [JDBC URL] フィールドの値を入力します。 JDBC URL フィールド構文については、「Databricks JDBC ドライバーの認証設定」を参照してください。
Note
ConnCatalog
ドライバー機能の設定は JDBC URL で指定する必要があります。それ以外の場合はスキーマを識別できません。[接続テスト]をクリックします。
ヒント
接続をテストする前に、リソースを起動する必要があります。 このようにしないと、リソースが起動する時間のために、テストが完了するまでに数分かかる場合があります。
接続に成功した場合は、[スキーマ] タブで、アクセスを可能にするスキーマのチェック ボックスをオンにします ([All schemas] (すべてのスキーマ) など)。
OK をクリックします。
DataGrip でアクセスするリソースごとに、この手順の指示を繰り返します。
手順 4: DataGrip を使用してテーブルを参照する
DataGrip を使用して、Azure Databricks ワークスペースのテーブルにアクセスします。
- DataGrip の [データベース] ウィンドウで、リソース ノードを展開し、参照するスキーマを展開して、[テーブル] を展開します。
- テーブルをダブルクリックします。 テーブルの最初の行セットが表示されます。
この手順の指示を繰り返して、その他のテーブルにアクセスします。
他のスキーマのテーブルにアクセスするには、[データベース] ウィンドウのツールバーで、[データ ソースのプロパティ] アイコンをクリックします。 [データソースとドライバー] ダイアログ ボックスの [スキーマ] タブで、アクセスするその他のスキーマそれぞれのチェック ボックスをオンにし、[OK] をクリックします。
手順 5: DataGrip を使用して SQL ステートメントを実行する
DataGrip を使用して、samples
カタログの nyctaxi
スキーマからサンプル trips
テーブルを読み込みます。
DataGrip で、[ファイル] > [新規作成] > [SQL ファイル] の順にクリックします。
ファイルの名前を入力します (例:
select_trips
)。select_trips.sql
ファイル タブで、次の SQL ステートメントを入力します。SELECT * FROM samples.nyctaxi.trips;
SELECT
ステートメントを選択します。[ファイル] タブのツールバーで、[実行] アイコンをクリックします。
次のステップ
- DataGrip のクエリ コンソールの詳細について確認します。
- DataGrip のデータ エディターの詳細について確認します。
- DataGrip でのさまざまなツール ウィンドウの詳細について確認します。
- DataGrip で検索する方法について確認します。
- DataGrip でデータをエクスポートする方法について確認します。
- DataGrip で正規表現を使用してテキストを検索および置換する方法について確認します。