import pandas as pd
Definindo o caminho do arquivo
url = 'dados_sus.csv'
Lendo o arquivo com os parâmetros específicos
df_sus = pd.read_csv(
url,
sep=';', # Separador identificado no arquivo
encoding='ISO-8859-1', # Codificação para caracteres latinos
skiprows=3, # Pula as 3 primeiras linhas de cabeçalho informativo
skipfooter=9, # Ignora as 9 últimas linhas de rodapé
engine='python' # Necessário para usar o skipfooter
)
Visualizando as primeiras linhas para confirmar a leitura
df_sus.head()
sep=';': Ao observar o arquivo, notamos que os dados são separados por ponto e vírgula, o que é o padrão de muitos arquivos gerados por sistemas governamentais brasileiros (como o TABNET/DATASUS).
encoding='ISO-8859-1': Sem isso, o Pandas teria dificuldade em ler palavras como "Unidade da Federação" ou "Maranhão", resultando em erros ou caracteres estranhos (como ).
skiprows=3: Remove o título e as descrições iniciais que não fazem parte da tabela de dados propriamente dita.
skipfooter=9: Limpa o "lixo" do final do arquivo (fontes, notas de rodapé), garantindo que o DataFrame contenha apenas os dados numéricos e as categorias.
engine='python': O motor padrão do Pandas (escrito em C) é muito rápido, mas não suporta o descarte de linhas no final do arquivo; por isso, alternamos para o motor em Python.