[Projeto] desafio arquivo utilizando a função read_csv da biblioteca Pandas. gastos hospitalares públicos de cada uma das Unidades da Federação brasileira

import pandas as pd

Definindo o caminho do arquivo

url = 'dados_sus.csv'

Lendo o arquivo com os parâmetros específicos

df_sus = pd.read_csv(
url,
sep=';', # Separador identificado no arquivo
encoding='ISO-8859-1', # Codificação para caracteres latinos
skiprows=3, # Pula as 3 primeiras linhas de cabeçalho informativo
skipfooter=9, # Ignora as 9 últimas linhas de rodapé
engine='python' # Necessário para usar o skipfooter
)

Visualizando as primeiras linhas para confirmar a leitura

df_sus.head()

sep=';': Ao observar o arquivo, notamos que os dados são separados por ponto e vírgula, o que é o padrão de muitos arquivos gerados por sistemas governamentais brasileiros (como o TABNET/DATASUS).

encoding='ISO-8859-1': Sem isso, o Pandas teria dificuldade em ler palavras como "Unidade da Federação" ou "Maranhão", resultando em erros ou caracteres estranhos (como ).

skiprows=3: Remove o título e as descrições iniciais que não fazem parte da tabela de dados propriamente dita.

skipfooter=9: Limpa o "lixo" do final do arquivo (fontes, notas de rodapé), garantindo que o DataFrame contenha apenas os dados numéricos e as categorias.

engine='python': O motor padrão do Pandas (escrito em C) é muito rápido, mas não suporta o descarte de linhas no final do arquivo; por isso, alternamos para o motor em Python.

Oi, Moacir! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

É isso aí! Você estruturou bem a leitura do arquivo. Seu código está correto. Continue assim!

Uma dica interessante para o futuro é usar o método info() para validar rapidamente a estrutura do DataFrame após a leitura:


import pandas as pd

df = pd.read_csv('dados.csv', sep=';')
df.info()

Esse codigo mostra o tipo de cada coluna e se existem valores nulos, ajudando na analise inicial dos dados.

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Conteúdo relacionado:

DOCUMENTAÇÃO

pandas.DataFrame.info

Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!

Importante

[Projeto] desafio arquivo utilizando a função read_csv da biblioteca Pandas. gastos hospitalares públicos de cada uma das Unidades da Federação brasileira

Definindo o caminho do arquivo

Lendo o arquivo com os parâmetros específicos

Visualizando as primeiras linhas para confirmar a leitura

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Definindo o caminho do arquivo

Lendo o arquivo com os parâmetros específicos

Visualizando as primeiras linhas para confirmar a leitura

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP