Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

A descrição do BoxPlot parece estar errada!

Se o tamanho das "pernas laterais" do box plt fossem calculadas como descritas no vídeo ([Q1 - 1,5 x IIC] e [Q3 + 1,5 x IIC]) elas teriam sempre o mesmo tamanho! Isso não é verdade como podemos ver nos próprios exemplos do vídeo. Grato pela atenção.

2 respostas
solução!

Olá Paulo,

A diferença no tamanho das "pernas laterais" ocorre porque em alguns casos os valores de [Q1 - 1,5 x IIC] e [Q3 + 1,5 x IIC] excedem os valores mínimo e máximo da série de dados, respectivamente. Quando isto ocorre os limites do gráfico ficam fixados nos valores mínimo e máximo do conjunto de dados.

Execute o código abaixo para visualizar um caso deste tipo:

import seaborn as sns
import pandas as pd

dados = pd.DataFrame([1, 23, 45, 56, 4, 23, 1, 3, 45, 56, 56, 79, 67, 3, 2, 23], columns = ['Dados'])

IIC = dados.quantile(0.75)[0] - dados.quantile(0.25)[0]

print('[Q1 - 1,5 x IIC] ->', dados.quantile(0.25)[0] - 1.5 * IIC)
print('\nObserve que [Q1 - 1,5 x IIC] é menor que o valor MÍNIMO da série. \nNeste caso devemos utilizar o MÍNIMO na representação gráfica.\n')
print('Mínimo ->', dados.min()[0])
print('Q1 ->', dados.quantile(0.25)[0])
print('Q2 ->', dados.quantile(0.5)[0])
print('Q3 ->', dados.quantile(0.75)[0])
print('Máximo ->', dados.max()[0])
print('\nObserve que [Q3 + 1,5 x IIC] é maior que o valor MÁXIMO da série. \nNeste caso devemos utilizar o MÁXIMO na representação gráfica.\n')
print('[Q3 + 1,5 x IIC] ->', dados.quantile(0.75)[0] + 1.5 * IIC)

ax = sns.boxplot(data = dados, orient = 'h')

ax.figure.set_size_inches(12, 4)
ax

Espero ter ajudado

Dúvida 100% esclarecida. Obrigado.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software