[Projeto] Web Scrapping

Vinícius Cunha Ferreira · 2023-06-06 01:39

Estou tentando fazer web scrapping desse site https://patentes.ufrj.br/ws/api/consulta/#. Não sei se aparece tudo na página inicial, mas aparentemente o conteúdo não está dividido em páginas.

Olá, Vinícius, tudo bem?

Desde já peço desculpas pela demora em obter um retorno.

Por não está dividido em páginas e todo o conteúdo estar em uma única página, isso pode facilitar o processo de web scraping, pois você não precisa lidar com a paginação. No entanto, é importante lembrar que a viabilidade do web scraping depende de vários fatores, incluindo a estrutura HTML da página, os termos de uso do site e as práticas éticas.

Para fazer web scraping, você pode usar bibliotecas em Python, como BeautifulSoup e requests, para extrair o conteúdo da página. Você pode inspecionar o código-fonte da página para identificar os elementos HTML que contêm as informações que você deseja coletar e, em seguida, escrever um script para extrair esses dados.

Para importar a biblioteca, utilize o seguinte comando:

pip install beautifulsoup4

Depois de instalado, você pode importar a biblioteca em seu código Python e começar a usá-la para analisar páginas da web. Por exemplo, você pode fazer algo assim:

from bs4 import BeautifulSoup
import requests

Deixo como consulta a documentação da biblioteca:

Beautiful Soup Documentation

Espero ter ajudado.

Caso surja alguma dúvida, não hesite em compartilhar no fórum.

Abraços e até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP