Boa noite!
como eu faço para saber o número de vezes que cada valor está duplicado no dataframe?
Boa noite!
como eu faço para saber o número de vezes que cada valor está duplicado no dataframe?
Oi, Klyngher! Boa tarde, tudo bem com você?
Você pode usar um método do pandas chamado pivot_table
que pode contar duplicatas em uma única coluna. A coluna a ser contada deve ser passada no parâmetro index, além dele, é preciso conter o parâmetro aggfunc ='size'
.
Com o DataFrame dados mostrado na aula, podemos calcular e visualizar a quantidade de cada duplicata da coluna Tipo do seguinte modo:
duplicas = dados.pivot_table(index = ['Tipo'], aggfunc ='size')
print(duplicas)
O resultado do print
é uma Series com cada valor da coluna Tipo e a quantidade de vezes que eles se repetem. Se quiser saber mais sobre o método pivot_table
e seus parâmetros, recomendo a leitura da documentação oferecida pelo pandas. OBS: Infelizmente o artigo está em inglês, então, caso tenha dificuldade em relação a este idioma, indico que tente utilizar o tradutor do navegador, para conseguir efetuar a leitura em português, mas qualquer dúvida ou dificuldade estarei à disposição
Eu espero ter te ajudado! Se surgir outra dúvida estarei à disposição ;-)
Bons estudos!
Boa tarde!
Muito obrigado, sua resposta foi excelente
Por nada! Fico muito feliz de ter te ajudado e por você ter gostado do nível da resposta ^^
Bons estudos!