Exercício: dar uma primeira olhada em seus dados
Lembre-se de que, em nosso cenário, você se deparou com um novo conjunto de dados que contém informações meteorológicas sobre tempestades nos EUA. Nesta unidade, você dará uma olhada inicial nos dados em si.
Examinar os dados brutos
A primeira coisa que você deseja fazer é examinar os dados reais para saber quais colunas existem, que tipos de dados estão nessas colunas e quais valores possíveis existem. Você não precisa ver todas as linhas da tabela de dados, portanto, vamos fazer uma pequena seleção de toda a tabela.
Execute a consulta a seguir para obter 50 linhas arbitrárias de dados.
StormEvents | take 50
Você deve obter resultados semelhantes à imagem a seguir, embora as linhas específicas que você vê possam ser diferentes:
Examine a tabela resultante abaixo da consulta na chamada Grade de resultados. Role para o lado direito para anotar todas as colunas. É possível ter uma noção dos tipos de dados e intervalos de valores nessas colunas? Lembre-se de que os campos mostrados são apenas uma amostragem de toda a tabela.
Usar a grade de resultados para reorganizar os dados
A grade de resultados oferece uma variedade de ferramentas internas que provavelmente são ações familiares de outros ambientes. Por exemplo, você pode classificar os dados com base em uma determinada coluna.
Cada um dos exemplos a seguir começa com os resultados da consulta take 50
.
Classificar os dados em uma coluna
Para classificar em uma coluna específica, selecione o nome dessa coluna na grade de resultados. A seta que aparece à direita do nome da coluna indica se ela está classificada em ordem crescente ou decrescente.
Selecione a coluna Estado.
Confira a lista resultante. Você vê algum estado aparecendo em várias linhas? Lembre-se de que você está olhando para as 50 linhas selecionadas acima, portanto, não espere ver uma lista completa.
Resultados de grupo
Dando um passo adiante na classificação de dados, é possível agrupar ou agregar resultados por campos comuns. Você deve se lembrar de que a lista classificada acima deu várias entradas para vários estados.
- Selecione o ícone de menu à direita da coluna que você deseja classificar. Nesse caso, selecione o menu no lado direito da coluna Estado.
- Selecione Agrupar por estado.
- Cada estado é seguido por uma contagem de entradas associadas. Selecione a seta à esquerda do nome do estado para expandir essas entradas.
Selecionar um subconjunto de dados
Agora que você tem uma ideia de que tipo de dado existe em sua tabela, você pode selecionar um subconjunto desses dados, por exemplo, apenas eventos de inundação.
- Na coluna EventType, selecione os eventos que deseja filtrar. Mantenha pressionada a tecla Shift no teclado para selecionar vários eventos, como Flash Flood, Heavy Rain e Flood.
- Clique com o botão direito do mouse em um campo selecionado e marque Adicionar seleção como filtros. A consulta acima é alterada para adicionar campos filtrados.
- Execute novamente a consulta selecionando o botão Executar. Agora todos os eventos resultantes são um dos tipos selecionados.
Filtrar um valor
Também é possível filtrar um único valor. Vamos ver todos os eventos que aconteceram no estado de Ohio.
Selecione o ícone de menu à direita da coluna Estado.
Selecione o ícone de funil.
Embora você possa pesquisar qualquer tipo de cadeia de caracteres ou correspondência de inteiros, você vai querer procurar qualquer coluna que contenha a palavra Ohio. Esse filtro também pode ser utilizado para localizar campos de dados incompletos ou vazios.
Abaixo do tipo de filtragem, insira a palavra Ohio. Observe que os resultados são filtrados imediatamente.
Resumir células selecionadas
No canto inferior direito da grade de resultados, as células selecionadas são resumidas. Ao selecionar valores inteiros, você também poderá ver um resumo estatístico desses valores.
Role até a coluna DamageProperty na grade de resultados.
Clique e arraste uma seleção de células nesta coluna. Essas células serão realçadas por uma tela de fundo azul para indicar a seleção.
Examine o canto inferior direito da grade de resultados. Quais são os valores máximos e mínimos exibidos? Esse resumo ajuda você a entender o intervalo de dados nesta coluna?
Expandir um campo dinâmico
Role até a última coluna na tabela de dados. Você vê a coluna StormSummary? Esse campo contém uma grande quantidade de dados, que não estão todos visíveis. Você pode expandir a célula para exibir todas as informações dentro do campo dinâmico.
Selecione o ícone Expandir exibição no canto superior direito da grade de resultados.
Selecione Direito para exibir os resultados expandidos no painel direito.
Role até a coluna mais à direita da tabela, StormSummary.
Clique duas vezes em um dos campos nesta coluna. O campo será expandido para mostrar o conteúdo em um formato mais fácil de ler: