Solucionado (ver solução)
Solucionado
(ver solução)
3
respostas

Necessidade de limpeza dos dados

Será que não havendo outliers e a distribuição ser bastante homogénea, ainda assim preciso remover os 25% dos dados nos 2 extremos?

3 respostas
solução!

Oi, :)

é possivel sim que não hajam outliers num dataset. Nesse caso, se eles não existem, você não precisa removê-los.

A remoção é feita, pois a média é sensível aos outliers e não queremos ter resultados inconsistentes.

Além disso, é sempre bom explorá-los e ver se eles realmente são erros antes de removê-los.

Suponha que você tem um dataset com idade e peso, e tem alguém com -50kg ou com 30 anos e peso de 10kg, muito provavelmente tem algo de errado e seria uma boa remover os outliers nesse caso.

Espero ter respondido, qualquer outra dúvida só mandar aqui :p.

Olá Cássia. Muito obrigado ; ).

Imagine, disponha :) e bom curso!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software