[WEB-SCRAPING] - Tentando carregar todo o site antes de 'raspar' as informaçoes | Data Science

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

por carlos alberto ochner costa

| 107.6k xp | 7 posts

Eu estou tentando fazer um Webscraping de locais para alugar em sp no site do quinto andar, mas to tendo um problema que o site não deixa os imoveis em cache, usei selenium, e bs4, mas não consigo manter os imoveis em cache, este e o site 'https://www.quintoandar.com.br/alugar/imovel/sao-paulo-sp-brasil' eu chequei e o parâmetro Max_age da requisição que a principio e o tempo que mantem as informações em cache e alta, alguém tem alguma dica ? /ajuda?

from selenium import webdriver
from bs4 import BeautifulSoup
import time

PATH = PATH
url =  'https://www.quintoandar.com.br/alugar/imovel/sao-paulo-sp-brasil'

driver = webdriver.Chrome(PATH)
driver.get(url)

driver.maximize_window()

time.sleep(10)

driver.implicitly_wait(3)

posts = driver.find_elements_by_css_selector("div.sc-1txbuf3-0 dlJilS")

page = driver.execute_script("return document.documentElement.outerHTML;")

soup = BeautifulSoup(''.join(page), 'html.parser')
driver.close()

1 resposta

por Nádia Oliveira

| 1487.9k xp | 2381 posts

Instrutor

25/09/2021

Oii Carlos, como você está?

Peço desculpas pela demora em obter um retorno.

Não entendi muito bem seu objetivo, vou te fazer algumas perguntas para que eu possa compreender melhor para te ajudar:

Quando você diz sobre manter em cache, se refere a ir salvando os dados conforme a rolagem da página? Se puder exemplificar.
Quais os dados pretende buscar na página? Exemplo: título, preço...

Fico no aguardo.

Grande abraço e bons estudos!

Importante

[WEB-SCRAPING] - Tentando carregar todo o site antes de 'raspar' as informaçoes

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP