Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Implementar boxplot

sns.boxplot(y=dados['consumo'], x=dados['chuva'],hue=dados['fds'], width=1500)

Rodei o boxplot acima, mas a visualização ficou horrível, e não consegui melhorar. Alguém poderia me ajudar a melhorar? Quero observar o consumo em finais de semana com chuva, e sem chuva. Grato.

2 respostas

Olá Danival, tudo bem? Espero que sim!

O problema está sendo gerado porque o boxplot não consegue avaliar a relação de dois dados contínuos, que são da coluna consumo e da coluna chuva. O boxplot é um tipo de gráfico para visualizarmos somente a distribuição de uma variável contínua. Podemos utilizar o eixo y ou o parâmetro hue para visualizar essa variável contínua separada por categorias. Portanto, podemos utilizar o fds para verificar o comportamento do consumo se é fim de semana ou não, e também conseguimos ver o comportamento da chuva se é fim de semana ou não. Mas não conseguimos fazer a relação entre essas duas variáveis contínuas utilizando o boxplot.

Para visualizarmos isso, teremos que escolher um outro formato de visualização. O scatterplot, conhecido como gráfico de dispersão, é perfeito para esse tipo de situação. O código utilizado para gerar um scatterplot com esses dados pode ser encontrado a seguir:

sns.scatterplot(y=dados['consumo'], x=dados['chuva'],hue=dados['fds'])

Gráfico de dispersão que mostra a relação entre duas variáveis contínuas, o consumo de cerveja em litros no eixo y e a precipitação em milímetros de chuva no eixo x. O eixo y compreende valores de 15000 a 35000 litros de cerveja e o eixo x compreende valores de 0 a 80 milímetros de chuva. Os dados estão divididos pela categoria fim de semana, a cor azul identifica os pontos que não são fim de semana e a cor laranja identifica pontos que são fim de semana

Podemos nos recorrer ao método relplot do seaborn, com tipo de gráfico scatter. Dessa forma podemos representar a categorização separada por colunas, sendo um gráfico para os pontos que não correspondem ao fim de semana e outro gráfico para os pontos correspondentes ao fim de semana. O código que gera essa visualização pode ser encontrado a seguir:

sns.relplot(data=dados, x="chuva", y="consumo",col="fds",hue='fds', kind="scatter")

Dois gráficos de dispersão um ao lado do outro, com a relação de duas variáveis contínuas, o consumo de cerveja em litros no eixo y e a precipitação em milímetros de chuva no eixo x. O eixo y compreende valores de 15000 a 35000 litros de cerveja e o eixo x compreende valores de 0 a 80 milímetros de chuva. O primeiro gráfico contém pontos que não se referem ao fim de semana, enquanto o segundo gráfico contém pontos que se referem ao fim de semana

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!

solução!

obrigado, vou olhar esses gráficos