Estou tentando fazer web scrapping desse site https://patentes.ufrj.br/ws/api/consulta/#.
Não sei se aparece tudo na página inicial, mas aparentemente o conteúdo não está dividido em páginas.
Estou tentando fazer web scrapping desse site https://patentes.ufrj.br/ws/api/consulta/#.
Não sei se aparece tudo na página inicial, mas aparentemente o conteúdo não está dividido em páginas.
Olá, Vinícius, tudo bem?
Desde já peço desculpas pela demora em obter um retorno.
Por não está dividido em páginas e todo o conteúdo estar em uma única página, isso pode facilitar o processo de web scraping, pois você não precisa lidar com a paginação. No entanto, é importante lembrar que a viabilidade do web scraping depende de vários fatores, incluindo a estrutura HTML da página, os termos de uso do site e as práticas éticas.
Para fazer web scraping, você pode usar bibliotecas em Python, como BeautifulSoup e requests, para extrair o conteúdo da página. Você pode inspecionar o código-fonte da página para identificar os elementos HTML que contêm as informações que você deseja coletar e, em seguida, escrever um script para extrair esses dados.
Para importar a biblioteca, utilize o seguinte comando:
pip install beautifulsoup4
Depois de instalado, você pode importar a biblioteca em seu código Python e começar a usá-la para analisar páginas da web. Por exemplo, você pode fazer algo assim:
from bs4 import BeautifulSoup
import requests
Deixo como consulta a documentação da biblioteca:
Espero ter ajudado.
Caso surja alguma dúvida, não hesite em compartilhar no fórum.
Abraços e até mais!