Visualizar dados

Concluído

Os cientistas de dados visualizam os dados para compreendê-los melhor. Eles podem verificar os dados brutos, examinar medidas resumidas, como médias, ou representar graficamente os dados. Os grafos são um meio poderoso de visualizar dados, e os cientistas de dados geralmente usam grafos para discernir padrões moderadamente complexos rapidamente.

Representação visual dos dados

A geração de grafos é feita para fornecer uma avaliação qualitativa rápida de nossos dados, o que pode ser útil para entender os resultados, localizar valores de exceção, verificar como os números são distribuídos e assim por diante.

Embora, às vezes, saibamos antecipadamente qual tipo de grafo será mais útil, outras vezes usamos grafos de forma exploratória. Para entender o poder da visualização de dados, considere os seguintes dados: a localização (x, y) de um carro autônomo. É difícil ver padrões reais na forma bruta dos dados. O significado ou a média nos informa que o caminho do carro foi centralizado em torno de x=0,2 e y=0,3, e o intervalo de números parece estar entre cerca de -2 e 2.

Hora Local-X Local-Y
0 0 2
1 1,682942 1,080605
2 1,818595 -0,83229
3 0,28224 -1,97998
4 -1,5136 -1,30729
5 -1,91785 0,567324
6 -0,55883 1,920341
7 1,313973 1,507805
12 0,00001 0,00001
13 0,840334 1,814894
14 1,981215 0,273474
15 1,300576 -1,51938
16 -0,57581 -1,91532
17 -1,92279 -0,55033
18 -1,50197 1,320633
19 0,299754 1,977409
20 1,825891 0,816164

Se agora plotarmos o Local-X ao longo do tempo, poderemos ver que parece haver alguns valores ausentes entre 7 e 12 vezes.

Grafo das coordenadas x de localização plotadas em relação ao tempo.

Se grafarmos X versus Y, teremos um mapa de onde o carro passou. Fica óbvio que o carro estava em um círculo, e em algum momento ele foi até o centro desse círculo.

Grafo das coordenadas x e y de localização plotadas.

Os grafos não estão limitados a gráficos de dispersão 2D como os encontrados acima. Eles podem ser usados para explorar outros aspectos dos seus dados, por exemplo, proporções (gráficos de pizza e gráficos de barras empilhadas) e como os dados são distribuídos (histogramas e diagramas de caixa). Geralmente, quando estamos tentando entender os dados brutos ou os resultados, podemos experimentar diferentes tipos de grafos até encontrarmos um que explique os dados de maneira visualmente intuitiva.