Olá,
De acordo com o que o professor apresentou em aula, os metadados auxiliam o modelo a decidir qual seria a melhor resposta, dados os atributos de origem, categoria, etc. Por isso, foi atribuído, em modo hardcoded, as categorias. Porém, não seria mais interessante permitir que o próprio modelo avalie e atribua uma categoria para cada chunk, conforme o seu conteúdo? Pois, no exemplo do projeto de bulas de medicamentos, a lógica para a atribuição da categoria "como_funciona", por exemplo, inclui a ocorrência da palavra "ação" no conteúdo do texto, o que, em diversos casos, poderia provocar erros semânticos para os chunks.