Como eu posso relacionar colunas no df pra por exemplo conseguir descobrir quantos dos 5000 filmes receberam a nota x ?
Seria uma forma deu descobri qntas vezes a nota x apareceu
Como eu posso relacionar colunas no df pra por exemplo conseguir descobrir quantos dos 5000 filmes receberam a nota x ?
Seria uma forma deu descobri qntas vezes a nota x apareceu
Oi Gustavo! Tudo tranquilo por aí?
Desculpa pela demora em dar um retorno.
Vamos supor que você queira descobrir quantas vezes a nota 7.2 apareceu. Sendo assim, primeiramente podemos separar dos nossos dados apenas os filmes que possuem as notas 7.2. Para isso, podemos utilizar a função query:
import pandas as pd
tmdb.query("vote_average == 7.2")
Essa função vai nos retornar um DataFrame com todas as colunas, mas apenas com os filmes que tem notas iguais a 7.2.
Certo, agora que separamos os filmes, precisamos contar quantas vezes essa nota aparece. Para isso, basta utilizarmos a função value_counts e especificarmos a coluna vote_average que contém as notas, observe:
import pandas as pd
tmdb.query("vote_average == 7.2").value_counts('vote_average')
Ou, caso prefira, também podemos fazer separadamente:
import pandas as pd
filmes_com_nota_x = tmdb.query("vote_average == 7.2")
filmes_com_nota_x.value_counts('vote_average')
E de ambos os jeitos, iremos obter o mesmo resultado:
Nos contando que a nota 7.2 aparece 119 vezes nos nossos dados :)
Caso você queira saber quantas vezes aparece cada uma das notas que temos no nosso dataset, você pode utilizar o comando tmdb.value_counts('vote_average')
e ele irá te retornar uma Series contando quantas vezes cada uma das notas aparece.
Se quiser saber mais sobre as funções query e value_counts, segue link da documentação dessas funções (em inglês):
Qualquer dúvida estou por aqui, tá bom?
Bons estudos!