Olá,
Durante a aula, percebi que o professor utilizou o Ollama para baixar e utilizar alguns modelos para responder às perguntas e, em paralelo, utilizou o HuggingFace para carregar outros modelos, como o de embeddings. Não entendi a necessidade se utilizar ambos se, na prática, por meio dos 2 é possível baixar e acessar os mesmos modelos, tanto como tokenizer quanto como modelos de resposta.