Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Ajuda com scraping de academias

Boa noite, tudo bem? Estou precisando fazer uma raspagem do site "https://www.confef.org.br/confef/pj-registradas/" para reconhecer todas as academias do Brasil, mas não estou conseguindo entender o html dessa página, alguém poderia me ajudar com isso?

1 resposta
solução!

Olá... A raspagem é possível ser feita usando os recursos do curso, se você observar o print abaixo vai ver que é simples. Print

A meu ver, o problema que você enfrenta é como atribuir valor ao filtro e pegar os dados resultantes. Para isso você vai precisar fazer a requisição de consulta diretamente, você pode olhar na aba network do inpect do chrome.

Quando você coloca alguma informação no filtro é feito uma requisição do tipo get passando as informações por parâmetro e retornando um dataset com os dados, inclusive mais fácil do que a raspagem tradicional, pois, você só precisa fazer a requisição diretamente.

Print2

Pode ser um problema se você não sabe como fazer a requisição e alimentar os parâmetros, mas nada que pesquisando um pouco você não entenda. Se você não sabe fazer pesquisa sobre 'url decode' e passa o link daquela requisição. Vai resultar em vários parâmetros, você pode editar, codificar os valores e consultar novamente usando aquele link. Desta maneira é necessário bolar uma forma de filtrar todas as informações da melhor forma.

print3

print4

Essa seria minha abordagem, mas se você encontrar ou alguém tiver alguma solução melhor publica aqui para eu aprender também :)

OBS: vi no fórum outra abordagem para este mesmo problema segue o link fórum, ai pode ver qual abordagem vai te atender melhor.

Abraço e qualquer coisa estou a disposição.