2
respostas

problemas ao tentar importar os dados da tabela do site

Oi pessoal, estou tentando importar essa tabela para o panda, mas sem sucesso.

new_html = pd.read_html('https://www.bitrawr.com/demonetized-currencies.html') new_html

alguém sabe dizer o que estou fazendo do errado?

2 respostas

Pessoal descobri o problema, alguns sites bloqueiam acesso do tipo read_html do panda. Esse site que poste acima é um desses exemplos.

resolvi o problema com o código abaixo: (O código imita um navegador para poder capturar as informações)


import requests

#A url que você quer acesssar url = "https://www.bitrawr.com/demonetized-currencies.html"

#Informações para fingir ser um navegador header = { "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36", "X-Requested-With": "XMLHttpRequest" }

#juntamos tudo com a requests r = requests.get(url, headers=header)

#E finalmente usamos a função read_html do pandas dfs = pd.read_html(r.text) dfs


Porém agora estou com outro problema, o resultado de retorno do site é uma lista, e quando tento incluir no DataFrame do panda ele dá erro, olha o código que estou usando...

dft = pd.DataFrame( dfs, columns = ['COD', 'NAME','INCEPTION','DEMONETIZED','DURATION','DESTROYED_BY'] ) dft

Alguém consegue me dizer onde estou errando?!Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Exatamente! Juliana

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software