Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Dúvida Exercicio

Como podemos filtrar os dados para gerarmos um visual com a distribuição da média das notas do TMDB (vote_average) em que o número de votos (vote_count) seja maior que 10?

Fiquei na dúvida da resolução desse exercício. Ele pediu para tirarmos a média, mas não tem o mean(). O instrutor fala que tem vários caminhos. Fiquei curiosa de como foi puxado a média com esses comandos.

import matplotlib.pyplot as plt
mais_de_10_votos = tmdb.query("vote_count > 10")
sns.displot(mais_de_10_votos["vote_average"])
plt.title("Distribuição das médias das notas dos filmes\ncom mais de 10 votos")
plt.show()
1 resposta
solução!

Oii, Ticiane! Tudo bem?

Exatamente, na tecnologia sempre podemos contar com mais de um caminho para se realizar a mesma tarefa.

Neste contexto do código, não é calculado uma nova média, mas é usado a média presente nos dados existentes no TMDB, o vote_average, que é a média de notas dados pelos usuários.

Abaixo podemos consultar o que cada parte do código faz:

#Importando as bibliotecas
import matplotlib.pyplot as plt 

#filtrando os dados do df para incluir filmes que possuem mais de 10 votos
mais_de_10_votos = tmdb.query("vote_count > 10")

#Criando um gráfico de distribuição do resultado das médias do filtro
sns.displot(mais_de_10_votos["vote_average"])

#Adicionando um título ao gráfico
plt.title("Distribuição das médias das notas dos filmes\ncom mais de 10 votos")

#Exibindo o gráfico
plt.show()

No código seguimos a linha de filtrar os filmes com mais de 10 votos e, depois, na distribuição das médias. Uma vez que o objetivo foi filtrar, a função mean() não é adequada, pois estamos lidando com médias já estão calculadas.

Espero ter esclarecido sua dúvida.

Continue se dedicando aos estudos e recorra ao fórum quando houver alguma dúvida.

Bons estudos, Ticiane!