import pandas as pd
url= 'https://raw.githubusercontent.com/alura-cursos/Pandas/main/dados_sus.csv'
dados = pd.read_csv(url, encoding='ISO-8859-1', sep = ';', skiprows = [0, 1, 2], skipfooter = 9, engine='python')
dados
dados.head()
import pandas as pd
url= 'https://raw.githubusercontent.com/alura-cursos/Pandas/main/dados_sus.csv'
dados = pd.read_csv(url, encoding='ISO-8859-1', sep = ';', skiprows = [0, 1, 2], skipfooter = 9, engine='python')
dados
dados.head()
E aí, Ronildo! Tudo bem?
Parabéns! Mantenha o ritmo nos exercícios e continue compartilhando na nossa comunidade.
Percebi que você praticou o uso de parâmetros avançados do read_csv()
, aplicou muito bem o skiprows
e skipfooter
para limpar o cabeçalho e rodapé do arquivo e ainda entendeu a relevância de definir o encoding
corretamente para ler dados com acentuação e caracteres especiais.
Uma sugestão para evoluir ainda mais é usar o parâmetro usecols
com o objetivo de selecionar apenas as colunas necessárias logo na leitura do CSV. Veja só:
dados = pd.read_csv(url, encoding='ISO-8859-1', sep=';', skiprows=[0, 1, 2], skipfooter=9, engine='python', usecols=['Município', 'Total'])
Resultado: Retorna um DataFrame apenas com as colunas 'Município'
e 'Total'
.
Essa abordagem ajuda a economizar memória e agiliza o carregamento dos dados, especialmente em arquivos grandes.
Sugestão de conteúdo para você mergulhar ainda mais sobre o tema:
Alguns materiais estão em inglês, mas é possível compreendê-los usando o recurso de tradução de páginas do próprio navegador.
Fico à disposição! E se precisar, conte sempre com o apoio do fórum.
Abraço e bons estudos!