1
resposta

DÚVIDAS__ Identificando e Removendo Outliers

Prezado(a).

Ao assistir a aulas, fiquei com a seguinte dúvida em relação aos cálculos:

Por que o histograma de 'dados' mostrou apenas uma barra e na de 'dados_new' apareceu uma distribuição normal a direita?

1 resposta

Olá Thiago,

O histograma de dados mostrou apenas uma barra porque a maior parte dos dados estão concentrados entre 0 e 100.000, mas existem alguns outliers que "esticam" o gráfico até além de 5.000.000

Assim quando fazemos a remoção desses outliers em dados_new podemos ver melhor a distribuição desses valores que estão entre 0 e 100.000 sem interferências de valores muito altos, podemos dizer que estamos fazendo um zoom naquela única barra do primeiro gráfico.