Black November

ATÉ 50% OFF

TÁ ACABANDO!

0 dias

0 horas

0 min

0 seg

1
resposta

[Sugestão] Desafio: lendo uma tabela de uma página web

Ao tentar o desafio me deparei com o seguinte erro:
Imagem do erro
E copiando o código da Opinião do instrutor deu o seguinte erro: HTTPError: HTTP Error 403: Forbidden

Então salvei a página e fiz a leitura a partir do arquivo:

  • Na página apertei Ctrl+S , escolhi o tipo Página da Web, Somente HTML e salvei o arquivo localmente
  • Fiz upload do arquivo no Google Colab epd.read_html('/content/paises_por_populacao.html')[0]
  • Depois removi a coluna chamada Unnamed: 0 pois todas as linhas são NaN
    dados = dados.drop('Unnamed: 0', axis=1)

Alguém conhece outra forma de lidar com esse erro?

Matricule-se agora e aproveite até 50% OFF

O maior desconto do ano para você evoluir com a maior escola de tecnologia

QUERO APROVEITAR
1 resposta

Ei, Marcos! Tudo bem?

Fico feliz em ver que você testou de outra forma e que deu certinho.

O erro acontece porque o servidor bloqueia requisições que não parecem vir de um navegador. Como o Pandas não envia um cabeçalho User-Agent por padrão, o site interpreta o acesso como potencialmente suspeito e impede a conexão.

Uma pessoa estudante do mesmo conteúdo, compartilhou duas formas de resolver:

  • Salvar a página e usar um link raw, podemos fazer isso no Github.
  • Simular um navegador adicionando um User-Agent com requests.

Vou deixar o tópico aqui para você acessar: [Sugestão] HTTPError: HTTP Error 403: Forbidden com páginas da Wikipédia .

Continue se dedicando aos estudos e qualquer dúvida, compartilhe.

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!