5
respostas

[Dúvida] não encontro o index

Estou estudando e aplicando em caso real, mas em outros sites não encontro o index mesmo atualizando a página. Poderia me ajudar? há outra forma de conseguir o caminho?

5 respostas

Qual é o site que você está tentando encontrar o index?

from urllib.request import Request, urlopen
from urllib.error import URLError, HTTPError


def get_source(url):
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}
    try:
        req = Request(url, headers = headers)
        response = urlopen(req)
        print(response.read())
    except HTTPError as e:
        print(e.status, e.reason)


get_source('https://br.iherb.com')
print('')
print('')
print('')
get_source('https://nutraceuticalbusinessreview.com')
print('')
print('')
print('')
get_source('https://www.news-medical.net')

Obrigada, Alexandre! onde você conseguiu buscar o caminho? headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'} há outra forma que não pelo site? Porque isso que não estou conseguindo.

O código está no final do aula: https://cursos.alura.com.br/course/web-scraping-data-science-python/task/61711