Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Outliers no boxplot após selecao

Olá!

Fiquei com dúvida sobre o último boxplot gerado em aula.

Definiu-se os limites inferior e superior e definimos os valores de dados que deveriam aparecer no boxplot:

selecao = (valor >= limite_inferior) & (valor <= limite_superior)
dados_new = dados[selecao]
dados_new.boxplot(['Valor'])

Porém, no boxplot acabou aparecendo alguns outliers. Não entendi porquê isso aconteceu, sendo que pedimos para selecionar somente os valores dentro dos limites inferior e superior.

1 resposta
solução!

Olá, Vivian. Beleza?

Os outliers que foram computados anteriormente utilizavam uma certa lista de valores, e aqueles valores que não atendiam os critérios dos limites inferiores e superior, eram classificados como outliers.

Agora que fazemos o primeiro tratamento, é gerado um novo conjunto de dados, e pode acontecer (mas nem sempre), de quando aplicado o mesmo teste, com uma média agora diferente e também um desvio padrão diferente, ainda aparecerem novos outliers. Então não é interessante julgar com o boxplot de maneira recursiva, ou seja, ir aplicando sucessivamente. Somente uma vez no conjunto original é suficiente, se a distribuição aparenta ser unimodal :D

Se ainda tiver alguma dúvida, estou por aqui. Ótimos estudos e grande abraço!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software