1
resposta

Gráfico: sns.distplot(medias_por_filme)

Prezados, Boa tarde! Na primeira apresentação do gráfico de histograma do seaborn, temos uma apresentação "estranha" que só foi corrigida quando adicionado o parâmetro bins=10, pois observando o gráfico vemos que existem valores entre por exemplo 3 e 3,5, o que pelo comando de unique nos é apresentado apenas 3 ou 3,5. Isso é uma distorção do histograma do seaborn? No aguardo, att

1 resposta

Olá Jorge, tudo bem? Espero que sim!

Desculpe pela demora em retornar.

Não acontece nenhuma distorção por parte do seaborn, estamos plotando a média das notas agrupadas pelo filme e não as notas em si.

Temos valores únicos para as notas, mas quando fazemos a média das notas pelo Id do filme, significa que agrupamos as notas de cada filme em um único valor. Como a média é a soma das notas dadas para daquele filme dividido pela contagem de vezes que o filme foi votado, teremos valores fracionários.

Veja a seguir a diferença entre os valores únicos das notas e valores únicos das médias das notas:

Valores únicos das notas e valores únicos das médias das notas por filme

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software