Não sei se pode ser tratado nas próximas aulas, mas a sugestão de segmentar em diferentes arquivos me pareceu não trazer economia de tokens de entrada.
Na primeira versão, utilizamos a função "carrega" com o arquivo ecomart.txt, que continha todos os contextos no prompt. 1 envio de todo o conteúdo necessário quanto a contexto.
Na segunda versão, o prompt do sistema no "app.py", recebe somente o "documento_selecionado". Contudo, o conteúdo de ambos os arquivos foi encaminhado em "seleciona documentos.txt", gerando o mesma quantidade de tokens que o arquivo "ecomart.txt", somente para que pudessemos definir o arquivo ideal. Em seguinda, um segundo envio foi realizado para produzir o retorno ao usuário, aumentando a quantidade de tokens que agora é o conteúdo de dois dos três arquivos disponíveis.
Entretanto, didaticamente ficou claro as possibilidade de exploração deste tipo de recurso para o refinamento do prompt.