Índices em tabelas com otimização de memória
Aplica-se a:SQL ServerBanco de Dados SQL do AzureInstância Gerenciada de SQL do Azure
Todas as tabelas com otimização de memória devem ter, pelo menos, um índice, porque são os índices que conectam as linhas. Em uma tabela com otimização de memória, cada índice também tem otimização de memória. Existem várias diferenças entre um índice em uma tabela com otimização de memória e um índice tradicional em uma tabela baseada em disco:
- As linhas de dados não são armazenadas em páginas e, portanto, não há nenhuma coleção de páginas ou extensões, nenhuma partição ou unidade de alocação que pode ser referenciada para obter todas as páginas de uma tabela. Há o conceito de páginas de índice para um dos tipos de índices disponíveis, mas elas são armazenadas de modo diferente dos índices para tabelas baseadas em disco. Eles não acumulam o tipo tradicional de fragmentação em uma página e, portanto, não têm nenhum fator de preenchimento.
- As alterações feitas nos índices em tabelas com otimização de memória durante a manipulação de dados nunca são gravadas em disco. Apenas as linhas de dados e as alterações nos dados são gravadas no log de transações.
- Os índices com otimização de memória são recriados quando o banco de dados fica online novamente.
Todos os índices em tabelas com otimização de memória são criados com base nas definições de índice durante a recuperação do banco de dados.
O índice deve ser um dos seguintes:
- Índice de hash
- Índice não clusterizado com otimização de memória (ou seja, a estrutura interna padrão de uma árvore B)
Os índices de hash são abordados mais detalhadamente em Índices de hash para tabelas com otimização de memória.
Os índices não clusterizados são abordados mais detalhadamente em Índice não clusterizado para tabelas com otimização de memória.
Índicescolumnstore são abordados em outro artigo.
Sintaxe para índices com otimização de memória
Cada instrução CREATE TABLE para uma tabela com otimização de memória deve incluir um índice, explicitamente por meio de um ÍNDICE ou implicitamente por meio de uma restrição PRIMARY KEY ou UNIQUE.
Para ser declarada com DURABILITY = SCHEMA_AND_DATA padrão, a tabela com otimização de memória precisa ter uma chave primária. A cláusula PRIMARY KEY NONCLUSTERED na seguinte instrução CREATE TABLE atende a dois requisitos:
Fornece um índice para atender ao requisito mínimo de um índice na instrução CREATE TABLE.
Fornece a chave primária necessária para a cláusula SCHEMA_AND_DATA.
CREATE TABLE SupportEvent ( SupportEventId int NOT NULL PRIMARY KEY NONCLUSTERED, ... ) WITH ( MEMORY_OPTIMIZED = ON, DURABILITY = SCHEMA_AND_DATA);
Observação
O SQL Server 2014 (12.x) e o SQL Server 2016 (13.x) têm um limite de oito índices por tipo de tabela ou tabela com otimização de memória. Desde o SQL Server 2017 (14.x) e no Banco de Dados SQL do Azure, não há mais um limite no número de índices específicos para as tabelas com otimização de memória e os tipos de tabela.
Exemplo de código de sintaxe
Esta subseção contém um bloco de códigos Transact-SQL que demonstra a sintaxe para criar vários índices em uma tabela com otimização de memória. O código demonstra o seguinte:
Crie uma tabela com otimização de memória.
Use as instruções ALTER TABLE para adicionar dois índices.
Insira algumas linhas de dados.
DROP TABLE IF EXISTS SupportEvent; go CREATE TABLE SupportEvent ( SupportEventId int not null identity(1,1) PRIMARY KEY NONCLUSTERED, StartDateTime datetime2 not null, CustomerName nvarchar(16) not null, SupportEngineerName nvarchar(16) null, Priority int null, Description nvarchar(64) null ) WITH ( MEMORY_OPTIMIZED = ON, DURABILITY = SCHEMA_AND_DATA); go -------------------- ALTER TABLE SupportEvent ADD CONSTRAINT constraintUnique_SDT_CN UNIQUE NONCLUSTERED (StartDateTime DESC, CustomerName); go ALTER TABLE SupportEvent ADD INDEX idx_hash_SupportEngineerName HASH (SupportEngineerName) WITH (BUCKET_COUNT = 64); -- Nonunique. go -------------------- INSERT INTO SupportEvent (StartDateTime, CustomerName, SupportEngineerName, Priority, Description) VALUES ('2016-02-23 13:40:41:123', 'Abby', 'Zeke', 2, 'Display problem.' ), ('2016-02-24 13:40:41:323', 'Ben' , null , 1, 'Cannot find help.' ), ('2016-02-25 13:40:41:523', 'Carl', 'Liz' , 2, 'Button is gray.' ), ('2016-02-26 13:40:41:723', 'Dave', 'Zeke', 2, 'Cannot unhide column.'); go
Valores de chave de índice duplicados
Valores duplicados para uma chave de índice podem reduzir o desempenho de tabelas com otimização de memória. Duplicatas para o sistema percorrer as cadeias de entrada para a maioria das operações de leitura e gravação do índice. Quando uma cadeia de entradas duplicadas excede 100 entradas, a degradação do desempenho pode se tornar mensurável.
Valores de hash duplicados
Esse problema é mais visível no caso de índices de hash. Índices de hash sofrem mais devido às considerações a seguir:
- Menor custo por operação de índices de hash.
- A interferência de grandes cadeias duplicadas na cadeia de colisão de hash.
Para reduzir a duplicação em um índice, tente realizar os seguintes ajustes:
- Usar um índice não clusterizado.
- Adicionar colunas adicionais ao final da chave de índice para reduzir o número de duplicatas.
- Por exemplo, você pode adicionar colunas que também estão na chave primária.
Para obter mais informações sobre colisões de hash, consulte Índices de hash para tabelas com otimização de memória.
Exemplo de aperfeiçoamento
Aqui está um exemplo de como evitar qualquer ineficiência de desempenho em seu índice.
Considere uma tabela Customers
que tenha uma chave primária em CustomerId
e um índice na coluna CustomerCategoryID
. Normalmente, haverá muitos clientes em uma determinada categoria. Portanto, haverá muitos valores duplicados para CustomerCategoryID dentro de uma determinada chave do índice.
Nesse cenário, a melhor prática é usar um índice não clusterizado em (CustomerCategoryID, CustomerId)
. Esse índice pode ser usado para consultas que usam um predicado que envolve CustomerCategoryID
, mas a chave de índice não contém duplicação. Portanto, nenhuma ineficiência na manutenção do índice é causada pelos valores CustomerCategoryID duplicados nem pela coluna extra no índice.
A consulta a seguir mostra o número médio de valores de chave de índice duplicado para o índice em CustomerCategoryID
na tabela Sales.Customers
, no banco de dados de exemplo WideWorldImporters.
SELECT AVG(row_count) FROM
(SELECT COUNT(*) AS row_count
FROM Sales.Customers
GROUP BY CustomerCategoryID) a
Para avaliar o número médio de duplicatas de chave de índice para sua própria tabela e índice, substitua Sales.Customers
pelo nome da tabela e substitua CustomerCategoryID
pela lista de colunas de chave de índice.
Comparando quando usar cada tipo de índice
A natureza de cada consulta específica determina que tipo de índice é a melhor opção.
Ao implementar tabelas com otimização de memória em um aplicativo existente, a recomendação geral é iniciar com índices não clusterizados, já que as funcionalidades se assemelham mais às funcionalidades de índices clusterizados e não clusterizados tradicionais em tabelas baseadas em disco.
Recomendações para o uso do índice não clusterizado
Um índice não clusterizado é preferível em vez de um índice de hash quando:
- As consultas têm uma cláusula
ORDER BY
na coluna indexada. - Consultas nas quais apenas as colunas à esquerda de um índice de várias colunas são testadas.
- As consultas testam a coluna indexada usando uma cláusula
WHERE
com:- Uma desigualdade:
WHERE StatusCode != 'Done'
- Uma verificação do intervalo de valores:
WHERE Quantity >= 100
- Uma desigualdade:
Em todos os SELECTs a seguir, um índice não clusterizado é preferível em vez de um índice de hash:
SELECT CustomerName, Priority, Description
FROM SupportEvent
WHERE StartDateTime > DateAdd(day, -7, GetUtcDate());
SELECT StartDateTime, CustomerName
FROM SupportEvent
ORDER BY StartDateTime DESC; -- ASC would cause a scan.
SELECT CustomerName
FROM SupportEvent
WHERE StartDateTime = '2016-02-26';
Recomendações para o uso do índice de hash
Índices de hash são usados principalmente para pesquisas de ponto e não para verificações de intervalo.
Um índice de hash é preferível a um índice não clusterizado quando as consultas usam predicados de igualdade e a cláusula WHERE
é mapeada para todas as colunas de chave de índice, como no seguinte exemplo:
SELECT CustomerName
FROM SupportEvent
WHERE SupportEngineerName = 'Liz';
Índice de várias colunas
O índice de várias colunas pode ser um índice não clusterizado ou um índice de hash. Suponha que as colunas de índice sejam col1 e col2. Considerando a seguinte instrução SELECT
, apenas o índice não clusterizado será útil para o otimizador de consulta:
SELECT col1, col3
FROM MyTable_memop
WHERE col1 = 'dn';
O índice de hash precisa da cláusula WHERE
para especificar um teste de igualdade para cada uma das colunas em sua chave. Caso contrário, o índice de hash não será útil para o otimizador de consulta.
Nenhum tipo de índice é útil se a cláusula WHERE
especifica somente a segunda coluna na chave de índice.
Tabela de resumo de comparação dos cenários de uso de índices
A tabela a seguir lista todas as operações com suporte dos diferentes tipos de índice. Sim significa que o índice pode atender à solicitação com eficiência e Não significa que o índice não pode atender à solicitação com eficiência.
Operação | Com otimização de memória, hash |
Com otimização de memória, não clusterizado |
Baseada em disco, (não) clusterizado |
---|---|---|---|
Verificação de índice, recuperar todas as linhas da tabela. | Sim | Sim | Sim |
Busca de índice em predicados de igualdade (=). | Sim (A chave completa é necessária.) |
Sim | Sim |
Busca de índice em predicados de desigualdade e intervalo (>, <, <=, >=, BETWEEN ). |
Nenhum (Resulta em uma verificação de índice.) |
Sim 1 | Sim |
Recuperar linhas em uma ordem de classificação que corresponda à definição do índice. | Não | Sim | Sim |
Recuperar linhas em uma ordem de classificação que corresponda ao inverso da definição do índice. | Não | Não | Sim |
1 Para um índice não clusterizado com otimização de memória, a chave completa não é necessária para a execução de uma busca de índice.
Índice automático e gerenciamento de estatísticas
Aproveite soluções como a Desfragmentação de índice adaptável para gerenciar automaticamente a desfragmentação de índice e as atualizações de estatísticas em um ou mais bancos de dados. Este procedimento escolhe automaticamente se deve recompilar ou reorganizar um índice de acordo com seu nível de fragmentação, entre outros parâmetros, e atualizar as estatísticas com um limite linear.
Confira também
Guia de criação de índice do SQL Server
Índices de hash para tabelas com otimização de memória
Índices não clusterizados para tabelas com otimização de memória
Desfragmentação de índice adaptável