Estou estudando e aplicando em caso real, mas em outros sites não encontro o index mesmo atualizando a página. Poderia me ajudar? há outra forma de conseguir o caminho?
Estou estudando e aplicando em caso real, mas em outros sites não encontro o index mesmo atualizando a página. Poderia me ajudar? há outra forma de conseguir o caminho?
Qual é o site que você está tentando encontrar o index?
Oi, Alexandre! Tudo bem?
https://br.iherb.com/ https://www.nutraingredients.com/# https://www.ingredientsnetwork.com/ https://nutraceuticalbusinessreview.com/ https://www.news-medical.net/
esses são alguns do que tentei e não encontro.
from urllib.request import Request, urlopen
from urllib.error import URLError, HTTPError
def get_source(url):
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}
try:
req = Request(url, headers = headers)
response = urlopen(req)
print(response.read())
except HTTPError as e:
print(e.status, e.reason)
get_source('https://br.iherb.com')
print('')
print('')
print('')
get_source('https://nutraceuticalbusinessreview.com')
print('')
print('')
print('')
get_source('https://www.news-medical.net')
Obrigada, Alexandre! onde você conseguiu buscar o caminho? headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'} há outra forma que não pelo site? Porque isso que não estou conseguindo.
O código está no final do aula: https://cursos.alura.com.br/course/web-scraping-data-science-python/task/61711