Olá Thales, tudo bem?
Para visualizar se é possível separar os grupos "ativo" e "inativo" com até três componentes principais. Deixo como sugestão a abordagem abaixo:
Primeiro, certifique-se de que seus dados estão completos, sem valores faltantes. Para dados binários (0 e 1), a normalização não é necessária. Em seguida, utilize uma biblioteca como sklearn
em Python para aplicar a PCA.
import pandas as pd
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
# Supondo que seu dataset esteja em um DataFrame chamado df
# Separar as características do status
X = df.drop('Status', axis=1)
y = df['Status']
# Aplicar a PCA
pca = PCA(n_components=3)
principal_components = pca.fit_transform(X)
# Criar um DataFrame com os componentes principais
pca_df = pd.DataFrame(data=principal_components, columns=['PC1', 'PC2', 'PC3'])
pca_df['Status'] = y
Para visualizar os três primeiros componentes principais, você pode usar a biblioteca matplotlib
para criar um gráfico 3D. Basicamente, você precisará configurar um gráfico com matplotlib
, definir os eixos (PC1, PC2 e PC3) e plotar os dados colorindo os pontos de acordo com o status ("Ativo" ou "Inativo").
Após gerar o gráfico 3D, observe se há uma separação clara entre os grupos "ativo" e "inativo". Se houver, a PCA conseguiu distinguir os grupos. Caso contrário, é válido considerar outras técnicas de redução de dimensionalidade ou métodos de classificação.
Reforço que o código é apenas uma sugestão, é possível fazer algumas adaptações para o seu projeto
Espero ter ajudado.
Qualquer dúvida, compartilhe no fórum.
Abraços e bons estudos!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!