1
resposta

Não entendi porque o exemplo "dados.hist(['Valor']) não gerou uma distribuição

Na aula "02 Identificando e Removendo Outliers", no final da aula, o professor compara a distribuição dos valores de "dados" e "dados_new" utilizando o método para retornar histogramas. Não entendi porquê o primeiro exemplo, não retornou uma distribuição e acabou retornando somente uma barra... Pois "dados_new" é uma variável idêntica a "dados", porém filtrada de acordo com uma fórmula utilizada anteriormente.

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Oi Renato! Tudo bem contigo?

Essa diferença no gráfico se deve pois dados_new representa o dataframe dados sem os outliers.

Observe o eixo x de cada um dos gráficos. Podemos perceber neles que há uma grande diferença quanto a distribuição das escalas. No primeiro gráfico (referente a dados) notamos que os valores variam de 0 a 4, já no segundo gráfico (referente a dados_new) notamos que os valores variam de 0 a 10.00. Há uma distância bem considerável entre essas escalas que dificulta nossa visualização. Mas essa forma de visualização vem muito por conta da existência do outlier que é muito grande e por isso é bem considerável que seja mostrado em um historiograma. No entanto, por ele ter valores bem distantes dos demais dados, o historiograma se resumiu a mostrar apenas esse dado específico.

Além disso, até observando os valores do eixo y, vemos também uma disparidade muito elevada entre os dados mostrados. Mesmo assim, todos os valores da coluna 'Valor' de dados e dados_new foram adquiridos para montar o gráfico, mas como no caso de dados existe um valor bem "absurdo" comparado aos demais, a visualização foi inteiramente focada nele.

Acredito que o objetivo do instrutor nessa análise é perceber o quanto a presença de um Outlier pode nos prejudicar na análise dos dados.

Eu espero ter te ajudado! Se a dúvida persistir, estarei à disposição.

Bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!