Olá, estou com uma dúvida e gostaria de saber se alguem poderia me dar uma luz quanto a ela....
Digamos que eu tenha um DataFrame da seguinte forma:
import pandas as pd
import numpy as np
df1 = pd.DataFrame({
'A': ['a', 'b', 'c', 'd', 'e'],
'B': ['e', 'd', 'c', 'b', 'a'],
'C': ['a', 'e', 'b', 'd', 'c'],
'D': ['i', 'h', 'g', 'f', 'e'],
})
df1
Eu gostaria de realizar uma contagem - ao estilo que fazemos com o groupby - mas gostaria de fazer com todas as colunas ao mesmo tempo de forma que o novo index fosse composto pelos valores unicos das colunas do DataFrame... Resultando no seguinte DataFrame:
df2 = pd.DataFrame({
'A': [1, 1, 1, 1, 1, 0, 0, 0, 0],
'B': [1, 1, 1, 1, 1, 0, 0, 0, 0],
'C': [1, 1, 1, 1, 1, 0, 0, 0, 0],
'D': [0, 0, 0, 0, 1, 1, 1, 1, 1],
}, index = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i'])
df2
Com o groupby só sei fazer de cada coluna.... Nesse estilo:
df1.groupby('A').A.count()
Gostaria de saber se alguem tem uma solução para isso