1
resposta

Exclusão de variáveis constantes

No curso foi ensinado a descobrir variáveis constantes através da plotagem do gráfico de violino. Gostaria de saber como que posso ter o mesmo tipo de análise através de cálculo matemático, sem a plotagem de gráfico. Há como?

1 resposta

Olá Pietro, tudo bem? Espero que sim!

Como variáveis constantes apresentam o mesmo valor para todos os registros, podemos identificar variáveis constantes através da indentificação das colunas que possuem apenas um registro único, ou seja, apenas um dado que se repete.

Podemos encontrar os dados únicos de uma coluna utilizando o método unique() e podemos identificar quais colunas possuem apenas um registro único, utilizando o método len() que retorna a quantidade de dados em uma lista. Caso o tamanho da lista de valores únicos seja igual a 1, saberemos que essa coluna possui dados constantes.

Vamos utilizar um loop for para percorrer as colunas do dataframe e comparar quais dessas colunas possui quantidade de dados únicos igual a 1. Segue abaixo o código e logo depois a explicação de cada linha de código:

colunas_constantes = []
for coluna in valores_exames.columns:
        if len(valores_exames[coluna].unique()) == 1:
                colunas_constantes.append(coluna)

Inicialmente criamos uma lista vazia que será utilizada para armazenar o nome das colunas constantes. Em seguida, percorremos todos os nomes das colunas utilizando o for coluna in valores_exames.columns, onde valores_exames são os dados utilizados na aula sem as colunas id e diagnóstico. Checaremos as colunas com apenas um dado único comparando se a quantidade de dados únicos na coluna é igual a 1 com a linha if len(valores_exames[coluna].unique()) == 1. Para finalizar, caso a comparação seja verdadeira, adicionamos o nome dessa coluna na lista colunas_constantes, que inicialmente estava vazia.

Ao rodar esse código, e utilizar o print() da variável colunas_constantes, encontrei como resultado uma lista com duas colunas, a do exame 4 e do exame 29.

Output: ['exame_4', 'exame_29']

Acredito que não seja a única abordagem possível e talvez não seja a melhor, mas foi uma que pensei como solução.

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!