Oi Luisa, tudo bem?
Trabalhar com um DataFrame que possui 7 mil colunas pode ser um desafio, quando se trata de visualizar e entender os tipos de dados de cada coluna. O Polars é uma boa escolha para lidar com grandes volumes de dados devido à sua eficiência.
Para visualizar todas as colunas e seus tipos, você pode usar o método dtypes
do Polars, que retorna uma lista com os tipos de dados de cada coluna. Por exemplo:
import polars as pl
# Supondo que 'df' seja o seu DataFrame
tipos_de_dados = df.dtypes
nomes_das_colunas = df.columns
# Combinar os nomes das colunas com seus tipos
colunas_com_tipos = list(zip(nomes_das_colunas, tipos_de_dados))
# Visualizar as primeiras 10 colunas e seus tipos (por exemplo)
for coluna, tipo in colunas_com_tipos[:10]:
print(f"Coluna: {coluna}, Tipo: {tipo}")
Esse código vai te dar uma visão geral das colunas e seus tipos. Se você precisar ver o conteúdo de algumas colunas específicas para decidir quais são úteis para o seu projeto, você pode usar o método select
para visualizar algumas linhas dessas colunas:
# Visualizar as primeiras linhas de algumas colunas
df.select(['coluna1', 'coluna2', 'coluna3']).head()
Substitua 'coluna1', 'coluna2', 'coluna3'
pelos nomes das colunas que você quer inspecionar.
Espero ter ajudado.
Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!