Tipos na linguagem de fórmula do Power Query M
A linguagem de fórmula do Power Query M é uma linguagem de mashup de dados útil e expressiva. No entanto, ela tem algumas limitações. Por exemplo, não há nenhuma imposição forte do sistema de tipos. Em alguns casos, uma validação mais rigorosa é necessária. Felizmente, o M fornece uma biblioteca interna compatível com tipos para viabilizar uma validação mais forte.
Os desenvolvedores devem ter uma compreensão abrangente do sistema de tipos para que possam fazer isso com qualquer generalidade. E embora a especificação da linguagem do Power Query M explique bem o sistema de tipos, ela ainda deixa algumas surpresas. Por exemplo, a validação de instâncias de função requer uma forma de comparar tipos quanto à compatibilidade.
Ao explorar o sistema de tipos do M mais cuidadosamente, muitos desses problemas poderão ser esclarecidos e os desenvolvedores se capacitarão a criar as soluções de que precisam.
O conhecimento de cálculo de predicados e a teoria ingênua dos conjuntos devem ser adequados para a compreensão da notação usada.
ETAPAS PRELIMINARES
(1) B := { true; false }
B é o conjunto típico de valores boolianos
(2) N := { identificadores válidos de M }
N é o conjunto de todos os nomes válidos em M. Isso é definido em outro lugar.
(3) P := ⟨B, T⟩
P é o conjunto de parâmetros de função. Cada um é possivelmente opcional e tem um tipo. Os nomes de parâmetro são irrelevantes.
(4) Pn := ⋃0≤i≤n ⟨i, Pi⟩
Pn é o conjunto de todas as sequências ordenadas de n parâmetros de função.
(5) P* := ⋃0≤i≤∞P i
P* é o conjunto de todas as sequências possíveis de parâmetros de função, em ordem crescente, começando pelas de comprimento 0.
(6) F := ⟨B, N, T⟩
F é o conjunto de todos os campos de registro. Cada campo é possivelmente opcional, tem um nome e um tipo.
(7) Fn := ∏0≤i≤n F
Fn é o conjunto de todos os campos de registro.
(8) F* := ( ⋃0≤i≤∞ Fi ) ∖ { F | ⟨b1, n1, t1⟩, ⟨b2, n2, t2⟩ ∈ F ⋀ n1 = n2 }
F* é o conjunto de todos os conjuntos (de qualquer tamanho) de campos de registro, exceto pelos conjuntos em que mais de um campo tem o mesmo nome.
(9) C := ⟨N,T⟩
C é o conjunto de tipos de coluna para tabelas. Cada coluna tem um nome e um tipo.
(10) Cn ⊂ ⋃0≤i≤n ⟨i, C⟩
Cn é o conjunto de todas as sequências de tipos de coluna n.
(11) C* := ( ⋃0≤i≤∞ Ci ) ∖ { Cm | ⟨a, ⟨n1, t1⟩⟩, ⟨b, ⟨n2, t2⟩⟩ ∈ Cm ⋀ n1 = n2 }
C* é o conjunto de todas as combinações (de qualquer tamanho) de tipos de coluna, exceto aquelas em que mais de uma coluna tem o mesmo nome.
TIPOS DE M
(12) TF := ⟨P, P*⟩
Um tipo de função consiste em um tipo de retorno e uma lista ordenada de zero ou mais parâmetros de função.
(13) TL :=〖T〗
Um tipo de lista é indicado por um determinado tipo (chamado de "tipo de item") encapsulado entre chaves.
Como as chaves são usadas na metalanguagem, 〖 〗 os colchetes são usados neste documento.
(14) TR := ⟨B, F*⟩
Um tipo de registro tem um sinalizador que indica se ele está "aberto" e tem zero ou mais campos de registro não ordenados.
(15) TRo := ⟨true, F⟩
(16) TR• := ⟨false, F⟩
TRo e TR• são atalhos de notação para tipos de registro abertos e fechados, respectivamente.
(17) TT := C*
Um tipo de tabela é uma sequência ordenada de zero ou mais tipos de coluna, em que não há conflitos de nome.
(18) TP := { any; none; null; logical; number; time; date; datetime; datetimezone; duration; text; binary; type; list; record; table; function; anynonnull }
Um tipo primitivo é um contido nesta lista de palavras-chave do M.
(19) TN := { tn, u ∈ T | tn = u+null } = nullable t
Qualquer tipo também pode ser marcado como permitindo valor nulo, usando apalavra-chave "nullable".
(20) T := TF ∪ TL ∪ TR ∪ TT ∪ TP ∪ TN
O conjunto de todos os tipos do M é a união de todos estes seis conjuntos de tipos:
Tipos de função, tipos de lista, tipos de registro, tipos de tabela, tipos primitivos e tipos que permitem valor nulo.
FUNÇÕES
É necessário definir uma função: NonNullable : T ← T
Essa função usa um tipo e retorna um tipo equivalente, exceto pelo fato de que esse segundo tipo não está em conformidade com o valor nulo.
IDENTIDADES
Algumas identidades são necessárias para definir alguns casos especiais e também podem ajudar a elucidar os casos acima.
(21) nullable any = any
(22) nullable anynonnull = any
(23) nullable null = null
(24) nullable none = null
(25) nullable nullable t ∈ T = nullable t
(26) NonNullable(t ∈ T que permitem valor nulo) = NonNullable(t)
(27) NonNullable(qualquer) = anynonnull
COMPATIBILIDADE DE TIPO
Conforme ressaltado em outra parte deste documento, um tipo M será compatível com outro tipo M se e somente se todos os valores que estiverem em conformidade com o primeiro tipo também estiverem em conformidade com o segundo tipo.
Aqui é definida uma relação de compatibilidade que não depende de os valores estarem em conformidade e é baseada nas propriedades dos próprios tipos. O que se espera é que essa relação, conforme definido neste documento, seja completamente equivalente à definição semântica original.
A relação "é compatível com" : ≤ : B ← T × T
Na seção abaixo, uma letra t minúscula sempre representará um tipo do M, um elemento de T.
Um Φ representará um subconjunto de F* ou de C*.
(28) t ≤ t
Essa relação é reflexiva.
(29) ta ≤ tb ∧ tb ≤ tc → ta ≤ tc
Essa relação é transitiva.
(30) none ≤ t ≤ any
Os tipos do M formam uma malha sobre essa relação; none é a parte inferior e any é a parte superior.
(31) ta, tb ∈ TN ∧ ta ≤ ta → NonNullable(ta) ≤ NonNullable(tb)
Se dois tipos forem compatíveis, os equivalentes NonNullable também serão compatíveis.
(32) null ≤ t ∈ TN
O tipo primitivo null é compatível com todos os tipos que permitem valor nulo.
(33) t ∉ TN ≤ anynonnull
Todos os tipos NonNullable são compatíveis com anynonnull.
(34) NonNullable(t) ≤ t
Um tipo NonNullable é compatível com o equivalente anulável.
(35) t ∈ TF → t ≤ function
Todos os tipos de função são compatíveis com function.
(36) t ∈ TL → t ≤ list
Todos os tipos de lista são compatíveis com list.
(37) t ∈ TR → t ≤ record
Todos os tipos de registro são compatíveis com record.
(38) t ∈ TT → t ≤ table
Todos os tipos de tabela são compatíveis com table.
(39) ta ≤ tb ↔ 〖ta〗≤〖tb〗
Um tipo de lista será compatível com outro tipo de lista se os tipos de item forem compatíveis e vice-versa.
(40) ta ∈ TF = ⟨ pa, p* ⟩, tb ∈ TF = ⟨ pb, p* ⟩ ∧ pa ≤ pb → ta ≤ tb
Um tipo de função será compatível com outro tipo de função se os tipos de retorno forem compatíveis e as listas de parâmetros forem idênticas.
(41) ta ∈ TRo, tb ∈ TR• → ta ≰ tb
Um tipo de registro aberto nunca é compatível com um tipo de registro fechado.
(42) ta ∈ TR• = ⟨false, Φ⟩, tb ∈ TRo = ⟨true, Φ⟩ → ta ≤ tb
Um tipo de registro fechado é compatível com outro tipo de registro quase idêntico, exceto por ser aberto.
(43) ta ∈ TRo = ⟨true, (Φ, ⟨true, n, any⟩)⟩, tb ∈ TRo = ⟨true, Φ⟩ → ta ≤ tb ∧ tb ≤ ta
Um campo opcional com o tipo any pode ser ignorado ao comparar dois tipos de registros abertos.
(44) ta ∈ TR = ⟨b, (Φ, ⟨β, n, ua⟩)⟩, tb ∈ TR = ⟨b, (Φ, ⟨β, n, ub⟩)⟩ ∧ ua ≤ ub → ta ≤ tb
Dois tipos de registro que diferem somente por um campo serão compatíveis se o nome e a opcionalidade do campo forem idênticos e os tipos desse campo forem compatíveis.
(45) ta ∈ TR = ⟨b, (Φ, ⟨false, n, u⟩)⟩, tb ∈ TR = ⟨b, (Φ, ⟨true, n, u⟩)⟩ → ta ≤ tb
Um tipo de registro com um campo não opcional é compatível com um tipo de registro quase idêntico, exceto por ter esse campo como opcional.
(46) ta ∈ TRo = ⟨true, (Φ, ⟨b, n, u⟩)⟩, tb ∈ TRo = ⟨true, Φ⟩ → ta ≤ tb
Um tipo de registro aberto é compatível com outro tipo de registro aberto que tem um campo a menos.
(47) ta ∈ TT = (Φ, ⟨i, ⟨n, ua⟩⟩), tb ∈ TT = (Φ, ⟨i, ⟨n, ub⟩⟩) ∧ ua ≤ ub → ta ≤ tb
Um tipo de tabela é compatível com um segundo tipo de tabela quase idêntico, exceto por ter uma coluna com um tipo diferente, quando os tipos dessa coluna são compatíveis.
REFERENCES
Microsoft Corporation (agosto de 2015)
Especificação de linguagem de fórmula do Microsoft Power Query para Excel [PDF]
Recuperado de https://msdn.microsoft.com/library/mt807488.aspx
Microsoft Corporation. (n. d.)
Referência de função do Power Query M [página da Web]
Recuperado de https://msdn.microsoft.com/library/mt779182.aspx