Trabalhando com RAG no dia a dia, o quanto que a gente vai precisar saber ou calcular essas métricas? Ou é um assunto mais para conhecimento de como as coisas funcionam?
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Trabalhando com RAG no dia a dia, o quanto que a gente vai precisar saber ou calcular essas métricas? Ou é um assunto mais para conhecimento de como as coisas funcionam?
Oi, Tatiane!
Para o seu dia a dia, a resposta curta é: você raramente precisará calcular essas fórmulas manualmente, mas precisará escolher qual métrica o seu banco de vetores (vector database) deve usar.
Quando você cria uma coleção ou índice em bancos como Pinecone, Weaviate, Chroma ou Milvus, o sistema pergunta qual métrica de distância deve ser usada para realizar as buscas. Se você escolher a métrica errada para o modelo de embedding que tá usando, a qualidade das respostas do seu Chatbot pode cair drasticamente.
Cada modelo de embedding (da OpenAI, Cohere ou HuggingFace) é treinado de uma forma.
Saber como a distância funciona ajuda quando o sistema traz documentos que não fazem sentido. Se a distância entre a pergunta do usuário e o documento recuperado for muito grande, você consegue ajustar "limiares" (thresholds) para que o modelo prefira dizer "não sei" em vez de inventar uma resposta baseada em um documento irrelevante.
Então, você não precisa decorar a fórmula matemática ou se preocupar em programar o cálculo do zero toda vez, pois bibliotecas como o LangChain e o LlamaIndex fazem o trabalho pesado. O foco deve ser entender a lógica para configurar suas ferramentas corretamente e garantir que a busca semântica seja precisa.