0
respostas

html muito grande da pagina, soup não traz todo conteudo

uma duvida, estou conseguindo recuperar o html do site https://shopee.com.br/search?keyword=pano%20de%20ch%C3%A3o&page=0 je tentei usar o headers mas, não traz de forma correta. alguem sabe outra manheira de fazer o scraping acontese isso.

url = "https://shopee.com.br/search?keyword=pano%20de%20ch%C3%A3o&page=0"

# Obtendo o conteúdo da página em formato de texto


headers = { 
    'User-Agent'      : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36', 
    'Accept'          : 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', 
    'Accept-Language' : 'en-US,en;q=0.5',
    'DNT'             : '1', # Do Not Track Request Header 
    'Connection'      : 'close'
}
data = requests.get(url, headers=headers, timeout=5).text
soup = BeautifulSoup(data,"html.parser")

soup

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software