Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Como contar a recorrência de uma frase dentro de uma coluna do datarame no pandas

Boa noite! Estou com uma dúvida sobre uma função de pandas. Meu dataframe possuiu a coluna "motivo da falha" que mostra uma frase por linha, descrevendo qual foi o motivo que causou a degradação (os valores são fixos, temos 8.000 possibilidades de motivos). Preciso fazer a contagem de quantas vezes cada "motivo de falha" ocorre no meu dataframe, exemplo: "Ausência de capacity" ocorreu 20 vezes. Como faria esta contagem? NSó encontrei contagem de recorrencia de palavras, não encontrei de frases, ou de linhas do dataframe. Obrigada pelo apoio

2 respostas
solução!

Thais, se cada linha corresponder a apenas um motivo de falha, você precisa apenas usar o value_counts().

Por exemplo, suponha que você tenha a seguinte tabela:

motivo_de_falhacoluna 2...coluna n
Ausência de capacityabc
Ausência de capacityabc
Segundo motivoabc
Ausência de capacityabc
Ausência de capacityabc
Terceiro motivoabc
Terceiro motivoabc
Ausência de capacityabc
Ausência de capacityabc

Considerando que df seja o seu dataframe, se você usar value_counts = df['motivo_de_falha'].value_counts(), sua saída será:

value_counts
Ausência de capacity   6
Terceiro motivo         2
Segundo motivo          1

Que você também poderá converter para um dataframe:

df_counts = pd.DataFrame(value_counts).reset_index()

df_counts.columns = ['motivo_de_falha', 'contagem']

O ideal, antes de usar o value_counts(), é você padronizar as suas strings, removendo acentos, padronizando todas elas com letras maiúsculas, ou minúsculas, etc (desde que a regra que você crie seja aplicada em todas as linhas).

Caso você apresente mais de um motivo de falha em uma linha, sua solução será diferente. Comente aqui sobre isso.

Deu certo Giulia! Muito obrigada pela ajuda :)

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software