Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Um jeito que use menos operações

Uma dúvida com que fiquei assistindo a aula foi a seguinte:

Existe algum motivo para estarmos fazendo

notas.groupby('filmeID').mean().Nota

ao invés de

notas.groupby('filmeID').Nota.mean()

?

Me parece que a segunda opção seria mais eficiente (pois o computador só precisaria calcular a média de uma única coluna). Aqui no meu computador cronometrei as duas opções, e consistentemente a primeira leva de 40% a 50% mais tempo do que a segunda. Se for usar em dataframes grandes, imagino que essa diferença vá se tornar considerável.

Assim, existe algum motivo para preferir o primeiro ao segundo?

1 resposta
solução!

Olá João,

Bem observado! Pelo segundo método podemos evitar vários cálculos desnecessários pois é calculado a média apenas da coluna que precisamos, enquanto no primeiro é calculado as médias de todas as colunas.

Então é bom sempre dar preferência a ordem coluna->cálculo quando precisamos de apenas uma coluna específica, mesmo que em datasets menores a gente nem perceba a diferença.

E obrigado pelo aviso, vamos rever o texto dessa atividade.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software