Podemos usar a seguintes solução:
medias_por_filme = notas.groupby('filmeId').mean().nota
medias_por_filme.head()
A linha de código medias_por_filme.head()
serve para apresentar os 5 primeiros, gerando o seguinte resultado como uma Series:
filmeId 1 3.920930 2 3.431818 3 3.259615 4 2.357143 5 3.071429 Name: nota, dtype: float64
E apresentando isso em algum gráfico, como os mostrados na aula pelo professor:
medias_por_filme.plot(kind='hist') #através de um histograma com o Pandas
sns.boxplot(y=medias_por_filme) #com a boxplot da biblioteca Seaborn, o "y=" é para mudança do eixo para o vertical (mais utilizado nesse tipo boxplot)
import matplotlib.pyplot as plt #utlizando a biblioteca Matplotlib
plt.hist(medias_por_filme)
plt.title('Médias das Notas por Filme') #adicionando um título ao histograma
Ótimo conteúdo do curso! :)