Será que não havendo outliers e a distribuição ser bastante homogénea, ainda assim preciso remover os 25% dos dados nos 2 extremos?
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Será que não havendo outliers e a distribuição ser bastante homogénea, ainda assim preciso remover os 25% dos dados nos 2 extremos?
Oi, :)
é possivel sim que não hajam outliers num dataset. Nesse caso, se eles não existem, você não precisa removê-los.
A remoção é feita, pois a média é sensível aos outliers e não queremos ter resultados inconsistentes.
Além disso, é sempre bom explorá-los e ver se eles realmente são erros antes de removê-los.
Suponha que você tem um dataset com idade e peso, e tem alguém com -50kg ou com 30 anos e peso de 10kg, muito provavelmente tem algo de errado e seria uma boa remover os outliers nesse caso.
Espero ter respondido, qualquer outra dúvida só mandar aqui :p.
Olá Cássia. Muito obrigado ; ).
Imagine, disponha :) e bom curso!