Prezado(a).
Ao assistir a aulas, fiquei com a seguinte dúvida em relação aos cálculos:
Por que o histograma de 'dados' mostrou apenas uma barra e na de 'dados_new' apareceu uma distribuição normal a direita?
Prezado(a).
Ao assistir a aulas, fiquei com a seguinte dúvida em relação aos cálculos:
Por que o histograma de 'dados' mostrou apenas uma barra e na de 'dados_new' apareceu uma distribuição normal a direita?
Olá Thiago,
O histograma de dados
mostrou apenas uma barra porque a maior parte dos dados estão concentrados entre 0 e 100.000, mas existem alguns outliers que "esticam" o gráfico até além de 5.000.000
Assim quando fazemos a remoção desses outliers em dados_new
podemos ver melhor a distribuição desses valores que estão entre 0 e 100.000 sem interferências de valores muito altos, podemos dizer que estamos fazendo um zoom naquela única barra do primeiro gráfico.