1
resposta

Trabalhando com RAG no dia a dia, o quanto que a gente vai precisar saber ou calcular essas métricas? Ou é um assunto mais para conhecimento de como as coisas funcionam?

1 resposta

Oi, Tatiane!

Para o seu dia a dia, a resposta curta é: você raramente precisará calcular essas fórmulas manualmente, mas precisará escolher qual métrica o seu banco de vetores (vector database) deve usar.

Quando você cria uma coleção ou índice em bancos como Pinecone, Weaviate, Chroma ou Milvus, o sistema pergunta qual métrica de distância deve ser usada para realizar as buscas. Se você escolher a métrica errada para o modelo de embedding que tá usando, a qualidade das respostas do seu Chatbot pode cair drasticamente.

Cada modelo de embedding (da OpenAI, Cohere ou HuggingFace) é treinado de uma forma.

  • Muitos modelos são otimizados para Similaridade de Cosseno.
  • Outros funcionam melhor com Distância L2 (Euclidiana).
    Ler a documentação do modelo que você escolheu para o seu projeto RAG é o que vai determinar se você deve usar o cálculo que viu na atividade.

Saber como a distância funciona ajuda quando o sistema traz documentos que não fazem sentido. Se a distância entre a pergunta do usuário e o documento recuperado for muito grande, você consegue ajustar "limiares" (thresholds) para que o modelo prefira dizer "não sei" em vez de inventar uma resposta baseada em um documento irrelevante.

Então, você não precisa decorar a fórmula matemática ou se preocupar em programar o cálculo do zero toda vez, pois bibliotecas como o LangChain e o LlamaIndex fazem o trabalho pesado. O foco deve ser entender a lógica para configurar suas ferramentas corretamente e garantir que a busca semântica seja precisa.

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!