1
resposta

Erro ao fazer o scraping html

df_html = pd.read_html('https://www.federalreserve.gov/releases/h3/current/default.htm')
HTTPError                                 Traceback (most recent call last)
<ipython-input-33-53e944597ab9> in <module>()
----> 1 df_html = pd.read_html('https://www.federalreserve.gov/releases/h3/current/default.htm')

12 frames
/usr/lib/python3.7/urllib/request.py in http_error_default(self, req, fp, code, msg, hdrs)
    647 class HTTPDefaultErrorHandler(BaseHandler):
    648     def http_error_default(self, req, fp, code, msg, hdrs):
--> 649         raise HTTPError(req.full_url, code, msg, hdrs, fp)
    650 
    651 class HTTPRedirectHandler(BaseHandler):

HTTPError: HTTP Error 403: Forbidden
1 resposta

Oii Marina, tudo bem contigo?

Neste outro tópico é explicado sobre o motivo do erro 403, que se refere a acesso não autorizado de conteúdo e também é indicada uma solução através de uma biblioteca mais robusta, que é o Selenium. A função do pandas read_html, que você está utilizando, apenas procura extrair o HTML, ela não tem os recursos que o Selenium oferece, que se refere a simular as mãos humanas, efetuando cliques, digitando algo, dentre outros. Tente através do exemplo que está no tópico recomendado aplicar no seu caso de uso.

Qualquer dúvida fico à disposição para ajudá-la.

Grande abraço e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!