2
respostas

dados.hist(['Valor']) dados_new.hist(['Valor'])

Boa tarde,

Nao entendi porque no dados.hist(['Valor']) mostrou só uma barra e no dados_new.hist(['Valor']) mostrou mais de uma ....

O professor tratou os dados e retirou as informações discrepantes, mas não entendi porque a mudança no gráfico :(

2 respostas

Olá Marcio, tudo bem? Espero que sim!

No primeiro histograma, haviam valores muito grandes que apareciam apenas uma vez, que são os valores discrepantes. As "barras" que eram pra ser destinadas a esses valores não aparecem porque a frequência é muito baixa (aparecem 1 única vez). Já todos os outros valores dos dados estão em uma única barra.

Se você aumentar a quantidade de bins, ou seja, de intervalos, no primeiro histograma, provavelmente vai conseguir enxergar melhor a distribuição dos dados.

dados.hist(['Valor'], bins = 100)

O segundo gráfico na verdade é a distribuição dos dados que estão todos dentro da barra do primeiro histograma.

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!

Boaa ! entendi sim, então as barras estavam ali mas não dava pra ver por conta dos valores discrepantes !

Obrigado. Ótima explicação :)

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software