Olá Pietro, tudo bem com você?
Peço desculpas pela demora em dar um retorno.
O que acontece é que nem sempre teremos um index.php
nas inspeções das páginas. Isso varia de acordo com o site que estamos inspecionando e da forma que ele foi estruturado. Peço desculpas se essa parte não tenha ficado muito bem explicada na aula.
De todo modo, o instrutor faz esse procedimento para capturar o user-agent da página, ou seja, capturar o cabeçalho da requisição que serve como um identificador para o tipo de dispositivo, sistema operacional e navegador que estamos usando para acessar aquele site. Assim, o servidor terá acesso à essas informações e dará uma resposta específica para nosso tipo de dispositivo.
Um detalhe é que o user-agent costuma ser o mesmo para a maioria dos sites, no caso do site da Amazon, para obtermos esse dado, basta acessar o site www.amazon.com.br, clicar F12 e na aba networking clicar no item "www.amazon.com.br", do lado esquerdo do painel. Já no lado direito, no canto inferior terá o valor do atributo user-agent e será ele que você deverá copiar.
Importante ressaltar que apesar de ter semelhanças nas capturas, o scraping varia de página para página, tudo depende de como o site que queremos capturar os dados está estruturado e quanto isso, infelizmente não temos um padrão.
Caso precise extrair alguma informação específica da Amazon ou de outro site, me encontro à disposição para ajudar.
Grande abraço!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!