Será que não havendo outliers e a distribuição ser bastante homogénea, ainda assim preciso remover os 25% dos dados nos 2 extremos?
Será que não havendo outliers e a distribuição ser bastante homogénea, ainda assim preciso remover os 25% dos dados nos 2 extremos?
Oi, :)
é possivel sim que não hajam outliers num dataset. Nesse caso, se eles não existem, você não precisa removê-los.
A remoção é feita, pois a média é sensível aos outliers e não queremos ter resultados inconsistentes.
Além disso, é sempre bom explorá-los e ver se eles realmente são erros antes de removê-los.
Suponha que você tem um dataset com idade e peso, e tem alguém com -50kg ou com 30 anos e peso de 10kg, muito provavelmente tem algo de errado e seria uma boa remover os outliers nesse caso.
Espero ter respondido, qualquer outra dúvida só mandar aqui :p.
Olá Cássia. Muito obrigado ; ).
Imagine, disponha :) e bom curso!