JS_WebScraping_IMDB
Um exemplo de Web Scraping simples com JavaScript e Puppeteer acessando a página do IMDB
🪧 Vitrine.Dev | |
---|---|
✨ Nome | JS_WebScraping_IMDB |
🏷️ Tecnologias | JavaScript Puppeteer fs download |
Detalhes do projeto
Montei esse Web Scraping baseado nestes videos, mas alterei alguns pontos.
- PARTE 1:
Construa um Web Scraping - Simples - Com JavaScript
13 de mai. de 2022
Programando com Anderson Souza
- PARTE 2:
Construa um Web Scraping - Simples - Com JavaScript - Vídeo #02
20 de mai. de 2022
Programando com Anderson Souza
- PARTE 3:
Construa um Web Scraping - Simples - Com JavaScript - Vídeo #03
21 de mai. de 2022
Programando com Anderson Souza
Site alvo da captura:
- Criar o arquivo package.json:
npm init -y
Puppeteer
Puppeteer is a Node.js library which provides a high-level API to control Chrome/Chromium over the DevTools Protocol. Puppeteer runs in headless mode by default, but can be configured to run in full (non-headless) Chrome/Chromium.
É uma biblioteca para fazer "Web Scraping".
https://pptr.dev/#?product=Puppeteer https://www.npmjs.com/search?q=Puppeteer
- Instalar o Puppeteer
npm install puppeteer
fs
fs-extra adds file system methods that aren't included in the native fs module and adds promise support to the fs methods. It also uses graceful-fs to prevent EMFILE errors. It should be a drop in replacement for fs.
Cria o arquivo JSON con as informações do filme.
https://www.npmjs.com/package/fs-extra
- Instalar o fs
npm install fs or npm install fs-extra
download
Para a baixar a imagem da capa do filme.
https://github.com/kevva/download-cli https://www.npmjs.com/package/download
- Instalar o download
npm install download or npm install --global download-cli