Data Visualization: criação de gráficos com o Matplotlib
Data-visualization-Matplotlib
🪧 Vitrine.Dev | |
---|---|
✨ Nome | Data Visualization: criação de gráficos com o Matplotlib |
🏷️ Tecnologias | python |
🚀 URL | Notebook no Kaggle |
🔥 Desafio | Conteúdo do curso |
Sobre o curso 📚
Ainda no tópico Visualização de Dados, da formação Data Science, oferecido pela Alura, passamos o foco para aprender a criar gráficos e visualizações de dados com a biblioteca Matplotlib. Desta vez, o curso foi ministrado pelo Luis Meazzini e aprendi:
- conceitos sobre o funcionamento de figuras e eixos,
- a personalizar as visualizações com diferentes cores, estilos e anotações,
- e criar visualizações para diversos tipos de dados, como séries temporais e dados categóricos.
Em resumo, sair da configuração padrão:
E desenvolver um gráfico que esteja mais alinhado com determinada situação/empresa:
Minha prática 👩🏻💻
Para praticar o que aprendi, utilizei dois datasets, ambos disponíveis no Kaggle. O primeiro é sobre registros climáticos de mais de 40 regiões da Austrália entre 2008 até 2017.
O primeiro gráfico que decidi plotar foi referente às temperaturas máximas de Sydney, usando apenas o .plot, definindo as datas no eixo x e as temperaturas no eixo y:
Aos poucos, aumentei a figura, adicionei um título, uma legenda aos eixos, alterei seus tamanhos, coloquei uma legenda para a variável que está sendo apresentada e mudei a cor do gráfico.
Nada de muito diferente, certo? Até que o instrutor começou a apresentar configurações que eu não tinha explorado ainda, por exemplo, alterar a espessura da linha ou substituí-la por pontos ao longo do gráfico.
Até o momento, o gráfico mostra todos os registros, de 2008 até 2017. Porém, podemos limitar sua visualização, ao determinar um período, com o parâmetro set_xlim. Neste caso, determinei que o gráfico estivesse focado nos registros de 01/01/2016 até 01/01/2017.
Da mesma forma, também aprendi a criar um novo eixo e apresentar informações adicionais. Por exemplo, no gráfico “principal” temos os registros de 2016 e no gráfico menor, vemos todos os registros.
Ou, podemos limitar os registros do gráfico principal com um mês, enquanto o segundo gráfico apresenta as informações do ano inteiro.
Uma outra configuração que achei interessante, foi apresentar linhas que indicam o maior e o menor valor dos dados, adicionando setas e texto apontando para estes pontos do gráfico.
O segundo dataset que utilizei foi referente ao consumo de energia elétrica em uma indústria de aço, com registros de janeiro de 2018 até dezembro de 2018.
Além das datas, este dataset tem uma coluna com os dias da semana. Então, plotei um gráfico apresentando a média de consumo de energia a cada dia da semana.
Alterei seu tamanho, atribuí uma cor para cada dia, adicionei título, legendas e uma linha em volta das barras.
Ainda sobre a média de consumo de energia, desta vez, fiz um gráfico de pizza.
Mantive as cores que foram usadas no gráfico de barras, acrescentei a porcentagem de cada dia da semana e destaquei os dois dias em que o consumo é maior.
No próximo passo, fiz um gráfico de dispersão entre o consumo de energia com a potência reativa.
Este dataset também possui uma coluna chamada Load_Type, em que os registros são divididos em: Carga Leve, Carga Média e Carga Máxima. Utilizei esta informação para diferenciar os pontos no gráfico, mudando sua cor e forma.
Também aprendi a configurar gráficos do tipo box-plot, saindo da configuração padrão:
Até uma que tivesse tamanho e cores personalizadas.
E finalizei com um histograma, saindo da configuração básica:
Até desenvolver um histograma que apresentasse informações mais específicas.
Conclusão 🏁
Eu gostei bastante de fazer este curso, pois ele me mostrou que, dependendo da análise e seu conteúdo, o matplotlib consegue resolver muita coisa e apresentar os dados de formas mais assertivas e personalizadas.
Muito obrigada por chegar até aqui e até a próxima 🤗