Olá, Matheus!
Seu raciocínio está no caminho certo, mas vamos esclarecer um pouco mais sobre como funcionam as instâncias de servidores na AWS, especificamente com o Amazon EC2.
As instâncias de servidores são, de fato, máquinas virtuais que você pode configurar para atender às suas necessidades específicas, como escolher o sistema operacional, a quantidade de memória, o tipo de processador, entre outros. Quando você lança uma instância no Amazon EC2, ela passa a estar disponível para processar requisições que são enviadas para ela.
Agora, sobre ter "milhares de outras instâncias iguais esperando requisições", isso depende de como você configura sua infraestrutura na nuvem. Você pode ter múltiplas instâncias rodando ao mesmo tempo, o que é útil para distribuir a carga de trabalho e garantir alta disponibilidade. Isso é conhecido como escalabilidade horizontal, onde você adiciona mais instâncias para lidar com aumentos na carga de trabalho.
Por exemplo, se você tem um aplicativo web que recebe muitas visitas durante uma promoção, você pode configurar um balanceador de carga para distribuir as requisições entre várias instâncias EC2, garantindo que o serviço continue rápido e responsivo.
Bons estudos!