Erro ao fazer o scraping html

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

Referente ao curso Python Pandas: tratando e analisando dados, no capítulo Importando dados e atividade (Extra) Importando outras fontes

por Marina Mello Nogueira Porcaro

| 60.5k xp | 13 posts

df_html = pd.read_html('https://www.federalreserve.gov/releases/h3/current/default.htm')

HTTPError                                 Traceback (most recent call last)
<ipython-input-33-53e944597ab9> in <module>()
----> 1 df_html = pd.read_html('https://www.federalreserve.gov/releases/h3/current/default.htm')

12 frames
/usr/lib/python3.7/urllib/request.py in http_error_default(self, req, fp, code, msg, hdrs)
    647 class HTTPDefaultErrorHandler(BaseHandler):
    648     def http_error_default(self, req, fp, code, msg, hdrs):
--> 649         raise HTTPError(req.full_url, code, msg, hdrs, fp)
    650 
    651 class HTTPRedirectHandler(BaseHandler):

HTTPError: HTTP Error 403: Forbidden

1 resposta

por Millena Gená Pereira

| 878.2k xp | 1503 posts

Instrutor

23/05/2022

Oii Marina, tudo bem contigo?

Neste outro tópico é explicado sobre o motivo do erro 403, que se refere a acesso não autorizado de conteúdo e também é indicada uma solução através de uma biblioteca mais robusta, que é o Selenium. A função do pandas read_html, que você está utilizando, apenas procura extrair o HTML, ela não tem os recursos que o Selenium oferece, que se refere a simular as mãos humanas, efetuando cliques, digitando algo, dentre outros. Tente através do exemplo que está no tópico recomendado aplicar no seu caso de uso.

Qualquer dúvida fico à disposição para ajudá-la.

Grande abraço e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP