Uma dúvida com que fiquei assistindo a aula foi a seguinte:
Existe algum motivo para estarmos fazendo
notas.groupby('filmeID').mean().Nota
ao invés de
notas.groupby('filmeID').Nota.mean()
?
Me parece que a segunda opção seria mais eficiente (pois o computador só precisaria calcular a média de uma única coluna). Aqui no meu computador cronometrei as duas opções, e consistentemente a primeira leva de 40% a 50% mais tempo do que a segunda. Se for usar em dataframes grandes, imagino que essa diferença vá se tornar considerável.
Assim, existe algum motivo para preferir o primeiro ao segundo?