Olá Hugo.
Tudo bem?
Desculpa a demora, estou respondendo esse tópico para tentar ajudar você e outros alunos que estiverem com essa mesma dúvida, e também para organizar o nosso fórum. Valeu :)
Pelo que entendi da sua pergunta, você está se perguntando se o Google Cloud escala automaticamente o App Engine caso a aplicação seja muito requisitada, ou se é necessário especificar tudo no código, como quantidade de instâncias, templates, instance groups, load balancing, etc.
No caso do App Engine, o Google Cloud faz o escalonamento automático da sua aplicação, levando em consideração o tráfego e a demanda. Você não precisa se preocupar em gerenciar os recursos de hardware, como instâncias, templates, instance groups, etc. O Google Cloud cuida disso para você.
No entanto, é importante que você configure corretamente o seu aplicativo para que ele possa se beneficiar do escalonamento automático. Por exemplo, você pode definir a quantidade mínima e máxima de instâncias que o App Engine deve manter em execução para lidar com a carga de tráfego. Além disso, você pode configurar o balanceamento de carga para distribuir as requisições entre as instâncias disponíveis.
No código da sua aplicação, você não precisa especificar esses detalhes de escalonamento. O App Engine se encarrega de provisionar e gerenciar as instâncias necessárias com base nas configurações que você definiu.
Espero ter ajudado e bons estudos!