Solucionado (ver solução)
Solucionado
(ver solução)
5
respostas

Resultado do html extraído do site da Alura aparece apenas b''

O resultado do html extraído no site da Alura difere do resultado exposto na vídeo aula, imprimindo apenas b''.

O que pode estar acontecendo ?

5 respostas

Oii Lucas, tudo bem com você?

Para conseguir te auxiliar melhor, vou te pedir que compartilhe aqui no fórum o código que você está utilizando para realizar o scraping no site da Alura. Coloque o código desde a definição da variável url = 'https://www.alura.com.br' até a parte final do except.

Aguardo seu retorno :)

Olá Millena, grato pela atenção !

Vou compartilhar o código que tentei extrair as informações da Alura conforme explicado no curso Scraping com Python: Coleta de dados na web, em que o resultado foi apenas b''

from urllib.request import Request, urlopen
from urllib.error import URLError, HTTPError

url = 'https://www.alura.com.br/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}

try:
    req = Request(url, headers = headers)
    response = urlopen(req)
    response.read()
    print(response.read())

except HTTPError as e:
    print(e.status, e.reason)

except URLError as e:
    print(e.reason)
solução!

Oii Lucas, tudo certinho?

Analisando seu código aqui, percebi que o que está fazendo com que o resultado seja apenas "b" é a linha response.read() localizada dentro do try. Se você tirá-la, você deve conseguir acessar o HTML da página da Alura certinho:

from urllib.request import Request, urlopen
from urllib.error import URLError, HTTPError

url = 'https://www.alura.com.br/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}

try:
    req = Request(url, headers = headers)
    response = urlopen(req)
    print(response.read())

except HTTPError as e:
    print(e.status, e.reason)

except URLError as e:
    print(e.reason)

Espero que isso ajude, qualquer dúvida estou à disposição :)

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Era isso mesmo. Grato por mostrar o que estava errando.