Oi Daniel!
Pelo que você descreveu, parece que o problema pode estar relacionado à forma como você está filtrando e agrupando os dados.
Para resolver isso, você pode seguir os passos abaixo, que são baseados no exemplo da atividade:
Filtrar as Notas por Filme: Primeiro, você precisa garantir que está filtrando corretamente as notas pelo filmeId
. Para calcular a média das notas de um filme específico, você pode usar o método query
para filtrar as notas por filmeId
e depois calcular a média da coluna nota
.
media_filme_1 = notas.query("filmeId==1")["nota"].mean()
print(media_filme_1)
Isso deve te dar a média das notas para o filme com filmeId
igual a 1.
Agrupar as Notas por Filme: Se você quer calcular a média das notas para todos os filmes, use o método groupby
para agrupar os dados pelo filmeId
e depois calcule a média apenas da coluna nota
.
medias_por_filme = notas.groupby("filmeId")["nota"].mean()
print(medias_por_filme.head())
Isso vai te dar uma tabela com o filmeId
e a média das notas para cada filme.
Certifique-se de Selecionar Apenas a Coluna de Interesse: Ao usar o groupby
, é importante selecionar apenas a coluna nota
antes de calcular a média, para evitar calcular médias de colunas que não fazem sentido, como usuarioId
.
Se ainda estiver com dificuldades, verifique se os nomes das colunas estão corretos e se os dados estão sendo carregados corretamente no seu DataFrame.
Espero ter ajudado e bons estudos!