Oi pessoal, estou tentando importar essa tabela para o panda, mas sem sucesso.
new_html = pd.read_html('https://www.bitrawr.com/demonetized-currencies.html') new_html
alguém sabe dizer o que estou fazendo do errado?
Oi pessoal, estou tentando importar essa tabela para o panda, mas sem sucesso.
new_html = pd.read_html('https://www.bitrawr.com/demonetized-currencies.html') new_html
alguém sabe dizer o que estou fazendo do errado?
Pessoal descobri o problema, alguns sites bloqueiam acesso do tipo read_html do panda. Esse site que poste acima é um desses exemplos.
resolvi o problema com o código abaixo: (O código imita um navegador para poder capturar as informações)
import requests
#A url que você quer acesssar url = "https://www.bitrawr.com/demonetized-currencies.html"
#Informações para fingir ser um navegador header = { "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36", "X-Requested-With": "XMLHttpRequest" }
#juntamos tudo com a requests r = requests.get(url, headers=header)
#E finalmente usamos a função read_html do pandas dfs = pd.read_html(r.text) dfs
Porém agora estou com outro problema, o resultado de retorno do site é uma lista, e quando tento incluir no DataFrame do panda ele dá erro, olha o código que estou usando...
dft = pd.DataFrame( dfs, columns = ['COD', 'NAME','INCEPTION','DEMONETIZED','DURATION','DESTROYED_BY'] ) dft
Alguém consegue me dizer onde estou errando?!
Exatamente! Juliana