1
resposta

Como ler dados de URL com o pandas

Pessoal, tudo bem? Eu estou tentando pegar alguns dados especificos do site: https://www2.bmf.com.br/pages/portal/bmfbovespa/lumis/lum-ajustes-do-pregao-ptBR.asp porem surgem algumas duvidas, a primeira é que eu não consigo fazer o pandas ler isso como CSV, existe alguma forma de eu conseguir fazer com que o pandas leia este site em CSV, ou somente tem como eu conseguir ler com read_html? (neste caso qual seria a range que eu pegaria, aparecem informaceos muito parecidas e não consigo filtrar o range exato das informacoes que eu quero) A outra duvida é que eu gostaria de pegar somente parte dos dados, que seria as colunas relacionadas ao "DAP - Cupom de DI x IPCA", como que eu filtraria somente estas colunas? Obrigado!!Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Olá, tudo bem? Espero que sim!

Como essa tabela está apresentada dentro de um website, o seu formato não está em csv e sim em formato de table do HTML da página.

Portanto você só pode utilizar a função read_html() nesse caso, e o pandas fará a leitura de todas as tabelas do site, armazenando em uma lista de tabelas.

Para acessar a primeira tabela, você pode acessar o índice 0 da lista, por exemplo dados[0] caso tenha armazenado em uma variável nomeada dados.

Para realizar o filtro das informações, é necessário utilizar os métodos do pandas, mas somente após a leitura de toda a tabela.

Bons estudos!