Exercício: dar uma primeira olhada em seus dados

Concluído

Lembre-se de que, em nosso cenário, você se deparou com um novo conjunto de dados que contém informações meteorológicas sobre tempestades nos EUA. Nesta unidade, você dará uma olhada inicial nos dados em si.

Examinar os dados brutos

A primeira coisa que você deseja fazer é examinar os dados reais para saber quais colunas existem, que tipos de dados estão nessas colunas e quais valores possíveis existem. Você não precisa ver todas as linhas da tabela de dados, portanto, vamos fazer uma pequena seleção de toda a tabela.

  1. Execute a consulta a seguir para obter 50 linhas arbitrárias de dados.

    Executar a consulta

    StormEvents
    | take 50
    

    Você deve obter resultados semelhantes à imagem a seguir, embora as linhas específicas que você vê possam ser diferentes:

    Captura de tela mostrando resultados da obtenção de 50 consultas.

  2. Examine a tabela resultante abaixo da consulta na chamada Grade de resultados. Role para o lado direito para anotar todas as colunas. É possível ter uma noção dos tipos de dados e intervalos de valores nessas colunas? Lembre-se de que os campos mostrados são apenas uma amostragem de toda a tabela.

Usar a grade de resultados para reorganizar os dados

A grade de resultados oferece uma variedade de ferramentas internas que provavelmente são ações familiares de outros ambientes. Por exemplo, você pode classificar os dados com base em uma determinada coluna.

Cada um dos exemplos a seguir começa com os resultados da consulta take 50.

Classificar os dados em uma coluna

Para classificar em uma coluna específica, selecione o nome dessa coluna na grade de resultados. A seta que aparece à direita do nome da coluna indica se ela está classificada em ordem crescente ou decrescente.

  1. Selecione a coluna Estado.

    Captura de tela mostrando colunas classificadas por coluna de estado.

  2. Confira a lista resultante. Você vê algum estado aparecendo em várias linhas? Lembre-se de que você está olhando para as 50 linhas selecionadas acima, portanto, não espere ver uma lista completa.

Resultados de grupo

Dando um passo adiante na classificação de dados, é possível agrupar ou agregar resultados por campos comuns. Você deve se lembrar de que a lista classificada acima deu várias entradas para vários estados.

  1. Selecione o ícone de menu à direita da coluna que você deseja classificar. Nesse caso, selecione o menu no lado direito da coluna Estado.
  2. Selecione Agrupar por estado.
  3. Cada estado é seguido por uma contagem de entradas associadas. Selecione a seta à esquerda do nome do estado para expandir essas entradas.

Captura de tela mostrando o processo de seleção de estado e o agrupamento por estado na interface do usuário da Web do Azure Data Explorer.

Selecionar um subconjunto de dados

Agora que você tem uma ideia de que tipo de dado existe em sua tabela, você pode selecionar um subconjunto desses dados, por exemplo, apenas eventos de inundação.

  1. Na coluna EventType, selecione os eventos que deseja filtrar. Mantenha pressionada a tecla Shift no teclado para selecionar vários eventos, como Flash Flood, Heavy Rain e Flood.
  2. Clique com o botão direito do mouse em um campo selecionado e marque Adicionar seleção como filtros. A consulta acima é alterada para adicionar campos filtrados.
  3. Execute novamente a consulta selecionando o botão Executar. Agora todos os eventos resultantes são um dos tipos selecionados.

Captura de tela mostrando a seleção de células e a adição de seleção como filtros na consulta.

Filtrar um valor

Também é possível filtrar um único valor. Vamos ver todos os eventos que aconteceram no estado de Ohio.

  1. Selecione o ícone de menu à direita da coluna Estado.

  2. Selecione o ícone de funil.

  3. Embora você possa pesquisar qualquer tipo de cadeia de caracteres ou correspondência de inteiros, você vai querer procurar qualquer coluna que contenha a palavra Ohio. Esse filtro também pode ser utilizado para localizar campos de dados incompletos ou vazios.

    Captura de tela da lista suspensa de operadores de cadeia de caracteres.

  4. Abaixo do tipo de filtragem, insira a palavra Ohio. Observe que os resultados são filtrados imediatamente.

    Captura de tela mostrando o filtro de colunas em um valor de cadeia de caracteres.

Resumir células selecionadas

No canto inferior direito da grade de resultados, as células selecionadas são resumidas. Ao selecionar valores inteiros, você também poderá ver um resumo estatístico desses valores.

  1. Role até a coluna DamageProperty na grade de resultados.

  2. Clique e arraste uma seleção de células nesta coluna. Essas células serão realçadas por uma tela de fundo azul para indicar a seleção.

  3. Examine o canto inferior direito da grade de resultados. Quais são os valores máximos e mínimos exibidos? Esse resumo ajuda você a entender o intervalo de dados nesta coluna?

    Captura de tela mostrando o resumo estatístico de células de inteiros selecionadas.

Expandir um campo dinâmico

Role até a última coluna na tabela de dados. Você vê a coluna StormSummary? Esse campo contém uma grande quantidade de dados, que não estão todos visíveis. Você pode expandir a célula para exibir todas as informações dentro do campo dinâmico.

  1. Selecione o ícone Expandir exibição no canto superior direito da grade de resultados.

  2. Selecione Direito para exibir os resultados expandidos no painel direito.

  3. Role até a coluna mais à direita da tabela, StormSummary.

  4. Clique duas vezes em um dos campos nesta coluna. O campo será expandido para mostrar o conteúdo em um formato mais fácil de ler:

    Captura de tela da expansão do campo dinâmico StormSummary.