1
resposta

Dúvida sobre boxplot

O código é esse: dados_new.boxplot(['Valor'], by = ['Tipo']) E está gerando esse boxplot. Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Porém eu gostaria de melhorar vizualização de cada boxplot e apresentar separados dos outros, como eu faço? Existe modo de fazer isso seguindo o código "dados_new.boxplot(['Valor'], by = ['Tipo'])", ou será necessário fazer seleção, criar 5 dfs diferentes para cada tipo e assim gerar o boxplot.

1 resposta

Boa tarde João, tudo bem com você?

Uma forma de gerar a visualização que você deseja é utilizando a biblioteca seaborn. Segue o exemplo de código:

import seaborn as sns 

#configura a grid como plano de fundo do gráfico
sns.set_theme(style="whitegrid")

#kind: você escolhe qual tipo de gráfico você deseja
#col: qual coluna do dataframe será utilizada para separar em gráficos individuais, no nosso caso são os tipos de imóveis
#col_wrap: quantas colunas de exibição você deseja, se colocássemos 2 ele quebraria em 3 linhas com duas colunas cada.
sns.catplot(y='Valor', 
            data=dados_new,
            kind='box',
            col='Tipo',
            col_wrap=1)

Saída:

Cinco gráficos de tipos de imóveis. Todos os gráficos são do tipo boxplot, no eixo y está o valor que inicia no zero e vai até trinta mil com intervalos de cinco mil em cinco mil. As caixas estão na cor azul com fundo transparente e linhas horizontais na cor cinza claro. Primeiro gráfico do tipo igual a casa, o limite inferior está entre zero e mil, o primeiro quartil está entre os números dois mil e quintos e mil e quinhentos, a mediana está próxima ao valor 2500, o terceiro quartil está entre os números três mil e quinhentos e quatro mil e quinhentos, o limite superior está entre os valores sete mil e quinhentos e oito mil. Os outliers partem do limite superior e vão até dez mil. Segundo gráfico do tipo igual a apartamento, o limite inferior está entre zero e mil, o primeiro quartil está entre os números mil e mil e quinhentos, a mediana está próxima de dois mil, o terceiro quartil está próxima de sete mil e quinhentos, o limite superior está próximo de dezesseis mil. Os outliers partem do limite superior e vão até vinte e dois mil. Terceiro gráfico do tipo igual a casa de condomínio, o limite inferior está entre zero e mil, o primeiro quartil está entre os números quatro e cinco mil, a mediana está próxima de nove mil, o terceiro quartil está próximo de quinze mil, o limite superior está próximo de trinta mil. Os outliers partem do limite superior e ultrapassam trinta mil. Quarto gráfico do tipo igual a casa de vila, o limite inferior está entre zero e mil, o primeiro quartil e mediana estão próximos de mil, o terceiro quartil está entre os números dois mil e quinhentos e mil e quinhentos, o limite superior está entre os valores dois mil e quinhentos e três mil. Os outliers partem do limite superior e vão até três mil. Quino gráfico do tipo igual a quitenete, o limite inferior está entre zero e mil, o primeiro quartil e mediana estão próximos de mil, o terceiro quartil está entre os números dois mil e quinhentos e dois mil, o limite superior está próximo a dois mil e quinhentos.

 

Caso você tenha interesse em saber mais sobre seaborn, na plataforma temos o curso Data Visualization: Explorando com Seaborn, você pode também dar uma olhada na documentação seaborn: statistical data visualization. A documentação está em inglês, mas você consegue utilizar o tradutor do seu navegador, para isso, basta clicar com o botão direito do mouse na página e selecionar o item: traduzir para português.

Espero ter ajudado, mas qualquer coisa é só mandar mensagem aqui.

Abraço e bons estudos!

 

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!