O resultado do html extraído no site da Alura difere do resultado exposto na vídeo aula, imprimindo apenas b''.
O que pode estar acontecendo ?
O resultado do html extraído no site da Alura difere do resultado exposto na vídeo aula, imprimindo apenas b''.
O que pode estar acontecendo ?
Oii Lucas, tudo bem com você?
Para conseguir te auxiliar melhor, vou te pedir que compartilhe aqui no fórum o código que você está utilizando para realizar o scraping no site da Alura. Coloque o código desde a definição da variável url = 'https://www.alura.com.br'
até a parte final do except.
Aguardo seu retorno :)
Olá Millena, grato pela atenção !
Vou compartilhar o código que tentei extrair as informações da Alura conforme explicado no curso Scraping com Python: Coleta de dados na web, em que o resultado foi apenas b''
from urllib.request import Request, urlopen
from urllib.error import URLError, HTTPError
url = 'https://www.alura.com.br/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}
try:
req = Request(url, headers = headers)
response = urlopen(req)
response.read()
print(response.read())
except HTTPError as e:
print(e.status, e.reason)
except URLError as e:
print(e.reason)
Oii Lucas, tudo certinho?
Analisando seu código aqui, percebi que o que está fazendo com que o resultado seja apenas "b" é a linha response.read()
localizada dentro do try
. Se você tirá-la, você deve conseguir acessar o HTML da página da Alura certinho:
from urllib.request import Request, urlopen
from urllib.error import URLError, HTTPError
url = 'https://www.alura.com.br/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}
try:
req = Request(url, headers = headers)
response = urlopen(req)
print(response.read())
except HTTPError as e:
print(e.status, e.reason)
except URLError as e:
print(e.reason)
Espero que isso ajude, qualquer dúvida estou à disposição :)
Era isso mesmo. Grato por mostrar o que estava errando.