1
resposta

alterar tipo de dados no dataframe

Como exercício eu exportei uma planilha para csv com mais de 100mil linhas. Ao consultar abri-la no Jupyter, recebo mensagens de arquivo muito longo, e quando consulto o tipo de dados continudos nela, o pandas me diz que são todos do tipo object. 1ª Pergunta: Existe um limite de tamanho de listas CSV para abrir com o pandas? 2ª Pergunta: Como posso alterar o tipo de dados contidos num dataframe? No meu caso, tudo é marcado como Object. Posso alterar determinadas colunas para String, e outras para integer, ou outros tipos numéricos?

1 resposta

Olá Roberto tudo bem com você??

Arquivos .CSV maiores é normal gerar esse tipo de aviso, o ideal é utilizar o pandas para que você trabalhe com uma parte destes dados por vez após carregá-los. Para isso existe o comando:

dados.head() 

Onde você substituí o "dados" pelo nome do seu dataframe e caso não coloque nenhum número entre parênteses ele mostrará por padrão as cinco primeiras linhas. Você encontra muita coisa aqui na documentação técnica.

Quanto aos tipos de dados no seu DF existe uma sequência de comandos para que você possa identificar e transformar assim manipulando melhor os dados.

Com o comando:

type.(dados)
pandas.core.frame.DataFrame

Você conseguirá identificar se os pandas está identificando seu arquivo como um DataFrame.

Com o comando:

dados.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 32960 entries, 0 to 32959
Data columns (total 9 columns):
Tipo          32960 non-null object
Bairro        32960 non-null object
Quartos       32960 non-null int64
Vagas         32960 non-null int64
Suites        32960 non-null int64
Area          32960 non-null int64
Valor         32943 non-null float64
Condominio    28867 non-null float64
IPTU          22723 non-null float64
dtypes: float64(3), int64(4), object(2)
memory usage: 2.3+ MB

Receberá uma info completa do arquivo.

Com o comando:

dados.dtypes
Tipo           object
Bairro         object
Quartos         int64
Vagas           int64
Suites          int64
Area            int64
Valor         float64
Condominio    float64
IPTU          float64
dtype: object

Os tipos.

Esse link aqui vai te ajudar com essa grande quantidade de dados.

Espero ter ajudado!