1
resposta

Relacionar Colunas

Como eu posso relacionar colunas no df pra por exemplo conseguir descobrir quantos dos 5000 filmes receberam a nota x ?

Seria uma forma deu descobri qntas vezes a nota x apareceu

1 resposta

Oi Gustavo! Tudo tranquilo por aí?

Desculpa pela demora em dar um retorno.

Vamos supor que você queira descobrir quantas vezes a nota 7.2 apareceu. Sendo assim, primeiramente podemos separar dos nossos dados apenas os filmes que possuem as notas 7.2. Para isso, podemos utilizar a função query:

import pandas as pd

tmdb.query("vote_average == 7.2")

Essa função vai nos retornar um DataFrame com todas as colunas, mas apenas com os filmes que tem notas iguais a 7.2.

Certo, agora que separamos os filmes, precisamos contar quantas vezes essa nota aparece. Para isso, basta utilizarmos a função value_counts e especificarmos a coluna vote_average que contém as notas, observe:

import pandas as pd

tmdb.query("vote_average == 7.2").value_counts('vote_average')

Ou, caso prefira, também podemos fazer separadamente:

import pandas as pd

filmes_com_nota_x = tmdb.query("vote_average == 7.2")
filmes_com_nota_x.value_counts('vote_average')

E de ambos os jeitos, iremos obter o mesmo resultado:

Imagem dos códigos mostrados acima com do resultado indicando que a nota 7.2 aparece 119 vezes no dataset

Nos contando que a nota 7.2 aparece 119 vezes nos nossos dados :)

Caso você queira saber quantas vezes aparece cada uma das notas que temos no nosso dataset, você pode utilizar o comando tmdb.value_counts('vote_average') e ele irá te retornar uma Series contando quantas vezes cada uma das notas aparece.

Se quiser saber mais sobre as funções query e value_counts, segue link da documentação dessas funções (em inglês):

Qualquer dúvida estou por aqui, tá bom?

Bons estudos!