1
resposta

Funcionamento Gráfico BoxPlot

O Guilherme diz que 25% dos dados estão em cada "bigodinho" do gráfico. Porém ao falar isso conclui-se que os outliers não seriam parte da série de dados, por nãos estarem dentro desse bigodinho. Ficou meio confuso pra mim. Poderia elaborar mais essa parte?

1 resposta

Oi Bruno! Tudo certo por aí?

Vou colocar uma imagem aqui para tentarmos entender melhor:

Imagem de um boxplot onde é mostrado os outliers, o limite inferior, o primeiro quartil, a mediana, o terceiro quartil e o limite superior. Essa imgem se encontra no artigo que foi referenciado no final desse tópico

A linha no centro da figura em verde, representa a mediana. A linha azul que está na aresta esquerda da figura representa 25% da distribuição, e a linha que está na aresta direita representa 75% da distribuição dos dados. Sendo assim, esses bigodinhos (whiskers) mostram o restante da distribuição e delimitam onde estão os outliers.

Esses outliers fazem parte dos nossos dados, entretanto eles são dados mais "isolados", ou seja, são dados que possuem valores bem diferentes do restante dos outros valores. E como o intuito do Boxplot é nos auxiliar a visualizar a distribuição desses dados, é interessante que ele delimite a partir de qual valor existem esses outliers.

Para a determinação desses quartis e desses limites existentes no boxplot são utilizadas algumas contas matemáticas. Vou deixar aqui um artigo que explica de forma bem didática e completa como esses pontos são definidos:

Espero que isso te ajude! Se ficar com alguma dúvida é só falar :)

Bons estudos!