Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Estrategia para classificar variaveis

Segundo a atividade existem alguns tipos de variaveis,

                 Quantitativa-discreta, Quantitativa-continua, Qualitativa-nominal, Qualitativa-ordinal

Se atribuissimos a letra N a Quantitativa, Q a Qualitativa. Discreto = 1, Continuo =2, Nominal = 3, Ordinal = 4. Teriamos

N1 Q3
N2 Q4

Existe alguma biblioteca em python que poderia classificar ou identificar automaticamente o tipo de variavel de uma serie?

Se houvesse uma maneira de, antes de iniciar qualquer codigo, classificar as series de acordo com o tipo, poderiamos criar um tipo de workflow que gera relatorios de acordo com so tipos de dados que temos, pois imagino que alguns tipos de dados nao conseguem trazer nenhuma informacao util com certos tipos de plot.

De acordo com a experiencia de voces, que tipo de variavel retorna melhor informacao com que tipo de plot? Se possivel seria possivel explicarem os motivos?

Desculpe a falta de assentos, meu computador nao possui o layout abnt.

1 resposta
solução!

Olá Artur, tudo bem com você?

Existem algumas bibliotecas em Python que podem ajudar na identificação e classificação de variáveis. Uma das mais utilizadas é o pandas, que é bastante poderosa para manipulação de dados. No entanto, ela não classifica automaticamente as variáveis como quantitativas ou qualitativas, mas, podemos usar a combinação de pandas com outras técnicas para inferir o tipo de variável. Exemplo:

import pandas as pd

df = pd.DataFrame({
    'idade': [23, 45, 31, 35],
    'salario': [50000, 80000, 62000, 65000],
    'sexo': ['M', 'F', 'M', 'F'],
    'escolaridade': ['medio', 'superior', 'medio', 'superior']
})

def classificar_variavel(serie):
    if pd.api.types.is_numeric_dtype(serie):
        return 'Quantitativa'
    else:
        return 'Qualitativa'

classificacao = df.apply(classificar_variavel).reset_index()
classificacao.columns = ['Coluna', 'Tipo Variável']

classificacao

Resultado:

Imagem do resultado da classificação das colunas

Em relação aos gráficos, os mais utilizados são:

  • Gráficos de Barras: Simples e direto para comparar categorias.
  • Histograma: Mostra a distribuição de uma variável quantitativa.
  • Boxplot: Ajuda a identificar a mediana, quartis e outliers.
  • Scatter Plot: Bom para visualizar a correlação entre duas variáveis contínuas.

Espero ter ajudado. Conte com o apoio do Fórum na sua jornada. Fico à disposição. Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!