Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Até quando tratar os outliers

Fala pessoal, boa noite!

Ao final da aula, obtivemos um conjunto de dados já tratados, com alguns outliers excluídos da série. Porém, ao plotar o BoxPlot percebemos que ainda temos a presença de alguns outliers. O certo seria continuar o tratamento de outliers, retirando esses que observamos no gráfico, ou podemos seguir as análises?

Se sim, corremos o risco de no próximo tratamento observarmos novamente novos outliers. Até quando temos que repetir esse processo de exclusão de outliers?

Grande abraço!!

2 respostas

Aguém sabe?

solução!

Olá Vitor, tudo bem com você??

Excelente pergunta!

Seguinte, depende hehe

Quando trabalhamos com bases de dados e tratamentos, eles são feitos direcionados para alguma necessidade e análise. Por exemplo muito se fala de excluir dados nulos na base de dados, porém, pode ser que justamente minha busca seja em virtude de encontrar esses dados nulos que não serviriam para você, entende? Então é muito relativo isso. Falando exatamente da sua pergunta, os outliers foram tratados e não vejo necessidade de efetuar uma nova limpeza.

Outliers nem sempre são erros, são dados mais distantes ou discrepantes da maioria. Então pode seguir suas análises após essa limpeza.

E com relação ao seu segundo questionamento, vai depender do que está buscando e até onde a limpeza se fará necessária.

Espero que tenha ficado mais claro o conceito de outliers e a limpeza de dados.

Qualquer dúvida é só retornar aqui no fórum!

Bons estudos Vitão

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software