Web scraping texto site de notícias

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

Referente ao curso Scraping com Python: coleta de dados na web

por Estudante

| 142k xp | 7 posts

Preciso fazer o web scraping do conteúdo de notícias de sites específicos. Percebi que buscando as URL da página principal, tenho tanto links html, direcionando para as notíciais, quanto links para outras seções do jornal(esporte, economia, etc). Neste caso, eu precisaria fazer um loop "for" para cada link encontrado na página inicial, gerando um objeto soup para cada um desses endereços que não são html? até chegar na última seção onde terei de fato as notícias? Ou existe um a forma mais inteligente de fazer isso? O BeautifulSoup seria a ferramenta ideal para fazer isso ou o Scrapy seria mais indicado? abraço

1 resposta

por HENRIQUE MARTINELLI

| 15.2k xp | 26 posts

02/12/2020

Olá Stefano, poderia passa a url do local?

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP