media_por_filmes = notas.groupby("filmeId").mean().nota media_por_filmes.head() ou media_por_filmes = notas.groupby("filmeId").nota.mean() media_por_filmes.head()
media_por_filmes = notas.groupby("filmeId").mean().nota media_por_filmes.head() ou media_por_filmes = notas.groupby("filmeId").nota.mean() media_por_filmes.head()
Me parece que a segunda opção notas.groupby("filmeId").nota.mean() media_por_filmes.head() seria mais eficiente computacionalmente já que seria calculada a média somente da coluna nota
Boa João, é isso mesmo!
E essa dica do Francisco é muito boa, em conjuntos de dados muito grandes isso pode fazer muita diferença, então é mais eficiente seguir a ordem:
coluna->operação