estou com erro ao extrair os dados:
estou com erro ao extrair os dados:
Olá, Thiago, tudo bem?
O erro "HTTP Error 403: Forbidden"
indica que o acesso ao recurso solicitado foi negado. Isso pode acontecer por diferentes motivos, como restrições de acesso ou a exigência de enviar cabeçalhos específicos na requisição.
Neste caso, o problema ocorre porque o servidor bloqueia downloads que não enviam um User-Agent (identificação de navegador). Para resolver, altere seu código assim:
Código original:
import urllib.request
def extract_data(url, filename):
urllib.request.urlretrieve(url, filename)
Código atualizado:
import requests
def extract_data(url, file_path):
headers = {"User-Agent": "Mozilla/5.0"}
response = requests.get(url, headers=headers)
response.raise_for_status() # Lança erro se status != 200
with open(file_path, "wb") as f:
f.write(response.content)
Essa modificação faz a requisição se identificar como um navegador comum, evitando o bloqueio.
Em seguida, reinicie o Notebook, seguindo estes passos:
No menu de ferramentas do Google Colaboratory, clicar em "Ambientes de execução";
Selecionar a opção "Reiniciar sessão e executar tudo".
Para realizar essas etapas, você pode acompanhar a imagem abaixo:
Espero ter ajudado.
Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!