參數標記

發行項
12/27/2024

參數標記名為或未命名的型別佔位符變數，用來從叫用 SQL 語句的 API 提供 values。

使用參數標記可保護您的程式代碼免於遭受 SQL 插入式攻擊，因為它會明確地將提供的 values 與 SQL 語句分開。

您無法在相同的 SQL 語句中混合具名和未命名的參數標記。

您不得參考 DDL 語句中的參數標記，例如產生的 column 或 DEFAULT 定義、檢視或 SQL 函式。

例外是針對 IDENTIFIER 子句中的參數標記的參考，這些參考可用於將某些 DDL 語句中的 table 或 column 名稱參數化。請參閱 IDENTIFIER 子句。

參數標記可以透過：

Python 使用其 pyspark.sql.SparkSession.sql（） API。
Scala 使用其 org.apache.spark.sql.SparkSession.sql（） API。
Java 使用其 org.apache.spark.sql.SparkSession.sql（） API。

具名參數標記

適用於： Databricks Runtime 已勾選為是 12.1 以上

具名參數標記是具類型的佔位符變數。叫用 SQL 語句的 API 必須提供名稱/值組，讓每個參數標記與值產生關聯。

語法

 :parameter_name

Parameters

named_parameter_name

所提供參數標記的參考，格式為不合格的 identifier。

筆記

您可以在相同的 SQL 語句內多次參考相同的參數標記。如果沒有值系結至參數標記，就會引發 UNBOUND_SQL_PARAMETER 錯誤。您不需要參考所有提供的參數標記。

必須的 : (冒號) 用於區分具名參數標記的命名空間與 column 名稱及 SQL parameters的命名空間。

例子

下列範例會定義兩個參數標記：

後來：一個值為 3 的 INTERVAL HOUR。
x：值為 15.0 的 DOUBLE

x 被多次引用，而 later 則被引用一次。

SQL

> DECLARE stmtStr = 'SELECT current_timestamp() + :later, :x * :x AS square';
> EXECUTE IMMEDIATE stmtStr USING INTERVAL '3' HOURS AS later, 15.0 AS x;
  2024-01-19 16:17:16.692303  225.00

Scala

import org.apache.spark.sql.SparkSession

val spark = SparkSession
  .builder()
  .appName("Spark named parameter marker example")
  .getOrCreate()

val argMap = Map("later" -> java.time.Duration.ofHours(3), "x" -> 15.0)
spark.sql(
  sqlText = "SELECT current_timestamp() + :later, :x * :x AS square",
  args = argMap).show()
// +----------------------------------------+------+
// |current_timestamp() + INTERVAL '03' HOUR|square|
// +----------------------------------------+------+
// |                    2023-02-27 17:48:...|225.00|
// +----------------------------------------+------+

爪哇島

import org.apache.spark.sql.*;
import static java.util.Map.entry;

SparkSession spark = SparkSession
  .builder()
  .appName("Java Spark named parameter marker example")
  .getOrCreate();

Map<String, String> argMap = Map.ofEntries(
  entry("later", java.time.Duration.ofHours(3)),
  entry("x", 15.0)
);

spark.sql(
  sqlText = "SELECT current_timestamp() + :later, :x * :x AS square",
  args = argMap).show();
// +----------------------------------------+------+
// |current_timestamp() + INTERVAL '03' HOUR|square|
// +----------------------------------------+------+
// |                    2023-02-27 17:48:...|225.00|
// +----------------------------------------+------+

Python

spark.sql("SELECT :x * :y * :z AS volume", args = { "x" : 3, "y" : 4, "z"  : 5 }).show()
// +------+
// |volume|
// +------+
// |    60|
// +------+

未命名的參數標記

適用於： Databricks Runtime 勾選是 13.3 及以上

未命名的參數標記是已定義類型的佔位元變數。叫用 SQL 語句的 API 必須提供自變數陣列，以便讓每個參數標記與其出現的順序產生關聯。

語法

Parameters

?：以問號形式提供之參數標記的參考。

筆記

未命名的參數標記每次出現時，會依序取用由 API 叫用的 SQL 語句中提供的值。如果沒有值系結至參數標記，則會引發 UNBOUND_SQL_PARAMETER 錯誤。您不需要使用所有提供的 values。

例子

下列範例會定義三個參數標記：

值為 3 的 INTERVAL HOUR。
兩個 DOUBLE，每個的值為 15.0。

由於 parameters 未命名，每個提供的值最多只能被一個參數使用。

SQL

> DECLARE stmtStr = 'SELECT current_timestamp() + ?, ? * ? AS square';
> EXECUTE IMMEDIATE stmtStr USING INTERVAL '3' HOURS, 15.0, 15.0;
  2024-01-19 16:17:16.692303  225.00

Scala

import org.apache.spark.sql.SparkSession

val spark = SparkSession
  .builder()
  .appName("Spark unnamed parameter marker example")
  .getOrCreate()

val argArr = Array(java.time.Duration.ofHours(3), 15.0, 15.0)

spark.sql(
  sqlText = "SELECT current_timestamp() + ?, ? * ? AS square", args = argArr).show()
// +----------------------------------------+------+
// |current_timestamp() + INTERVAL '03' HOUR|square|
// +----------------------------------------+------+
// |                    2023-02-27 17:48:...|225.00|
// +----------------------------------------+------+

爪哇島

import org.apache.spark.sql.*;

SparkSession spark = SparkSession
  .builder()
  .appName("Java Spark unnamed parameter marker example")
  .getOrCreate();

Object[] argArr = new Object[] { java.time.Duration.ofHours(3), 15.0, 15.0 }

spark.sql(
  sqlText = "SELECT current_timestamp() + ?, ? * ? AS square",
  args = argArr).show();
// +----------------------------------------+------+
// |current_timestamp() + INTERVAL '03' HOUR|square|
// +----------------------------------------+------+
// |                    2023-02-27 17:48:...|225.00|
// +----------------------------------------+------+

Python

spark.sql("SELECT ? * ? * ? AS volume", args = { 3, 4, 5 }).show()
// +------+
// |volume|
// +------+
// |    60|
// +------+

共用方式為

參數標記

具名參數標記

語法

Parameters

筆記

例子

SQL

Scala

爪哇島

Python

未命名的參數標記

語法

Parameters

筆記

例子

SQL

Scala

爪哇島

Python

意見反應

其他資源

共用方式為

參數標記

具名參數標記

語法

Parameters

筆記

例子

SQL

Scala

爪哇島

Python

未命名的參數標記

語法

Parameters

筆記

例子

SQL

Scala

爪哇島

Python

相關文章

意見反應

其他資源