Como podemos obter a média de cada um dos filmeID (filmes) sem ter que digitar o comando milhares de vezes?
Usando o DataFrame, agrupando os ids pelo comando groupby:
media_por_filme = notas.groupby('filmesId').mean()['nota']
media_por_filme.head()
Como podemos obter a média de cada um dos filmeID (filmes) sem ter que digitar o comando milhares de vezes?
Usando o DataFrame, agrupando os ids pelo comando groupby:
media_por_filme = notas.groupby('filmesId').mean()['nota']
media_por_filme.head()
Isso mesmo Matheus!
Como você fez já está correto, fica só a dica de mudar a ordem entre mean() e ['nota'], fazendo essa troca pode melhorar um pouco a performance do código:
# Aqui calculamos a média de todas as colunas numéricas
notas.groupby('filmesId').mean()['nota']
# Aqui calculamos a média apenas da coluna nota
notas.groupby('filmesId')['nota'].mean()
Obrigado pela dica!