1
resposta

códigos diferentes

tmdb.query("vote_count>10")['vote_average'].plot(kind='hist', xlabel="Média das notas do TMDB em que o número de votos é maior que 10")

esse código produz um resultado mt diferente da solução do professor? que seria:

import matplotlib.pyplot as plt
mais_de_10_votos = tmdb.query("vote_count > 10")
sns.displot(mais_de_10_votos["vote_average"])
plt.title("Distribuição das médias das notas dos filmes\ncom mais de 10 votos")
plt.show()

se sim, quais as diferenças?

1 resposta

Ei, Barbara! Tudo bem?

A diferença está nas bibliotecas que geram a visualização, ambos os códigos estão analisando o mesmo conjunto de dados.

A primeira diferença, no seu código, você utilizou o método .plot() direto do Pandas (que usa o Matplotlib como base), resultando em um gráfico mais simples e com barras largas. O professor utilizou o Seaborn (sns.displot), que por padrão aplica um design mais moderno e limpo.

Outra é no número de bins (caixa), seu código usou o padrão do Pandas (geralmente 10 divisões), o que "agrupa" mais as notas. O Seaborn calculou automaticamente um número maior de barras (bins) mais finas, permitindo enxergar picos específicos de notas que ficam escondidos quando as barras são muito largas.

E, por último, as legendas e títulos, as informações de eixos foram passadas como argumentos dentro do .plot(), enquanto o professor usou funções específicas do Matplotlib (plt.title) para formatar o texto acima do gráfico.

Então podemos dizer que o seu resultado mostra uma visão mais generalista da distribuição. O código do professor oferece uma visão mais detalhada (com maior resolução) dos dados.

Espero ter ajudado. Qualquer dúvida, sempre conte conosco aqui no fórum.

Bons estudos e até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado