Oi pessoal, estou tentando importar essa tabela para o panda, mas sem sucesso.
new_html = pd.read_html('https://www.bitrawr.com/demonetized-currencies.html') new_html
alguém sabe dizer o que estou fazendo do errado?
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Oi pessoal, estou tentando importar essa tabela para o panda, mas sem sucesso.
new_html = pd.read_html('https://www.bitrawr.com/demonetized-currencies.html') new_html
alguém sabe dizer o que estou fazendo do errado?
Pessoal descobri o problema, alguns sites bloqueiam acesso do tipo read_html do panda. Esse site que poste acima é um desses exemplos.
resolvi o problema com o código abaixo: (O código imita um navegador para poder capturar as informações)
import requests
#A url que você quer acesssar url = "https://www.bitrawr.com/demonetized-currencies.html"
#Informações para fingir ser um navegador header = { "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36", "X-Requested-With": "XMLHttpRequest" }
#juntamos tudo com a requests r = requests.get(url, headers=header)
#E finalmente usamos a função read_html do pandas dfs = pd.read_html(r.text) dfs
Porém agora estou com outro problema, o resultado de retorno do site é uma lista, e quando tento incluir no DataFrame do panda ele dá erro, olha o código que estou usando...
dft = pd.DataFrame( dfs, columns = ['COD', 'NAME','INCEPTION','DEMONETIZED','DURATION','DESTROYED_BY'] ) dft
Alguém consegue me dizer onde estou errando?!
Exatamente! Juliana