[Dúvida] Resultado da aula prática não faz o esperado

Luís Augusto Weber Mercado · 2025-12-04 10:41

Olá, tudo bem? Estive vendo a aula prática `Pipeline para Dados Complexos Pratica #2`. Na última parte da aula (minuto 17:08), é esperado que as duas perguntas diferentes retornem similaridade

Ei, Luís, tudo bem?

Claro, vamos la! Aqui estão algumas sugestões para melhorar a precisão:

Verifique se os metadados estão sendo corretamente atribuídos aos documentos. Isso ajuda o sistema a identificar a fonte correta de cada documento.
Os embeddings utilizados podem não estar capturando bem a semântica dos documentos. Experimente ajustar o modelo de embeddings ou testar com outro modelo que possa capturar melhor as nuances dos seus dados.
Certifique-se de que o texto dos documentos está bem formatado e com informações relevantes. Às vezes, a maneira como o texto é estruturado pode influenciar na similaridade calculada.
O tamanho dos chunks pode influenciar na recuperação. Experimente ajustar o chunk_size e a chunk_overlap para ver se isso melhora a precisão.
Veja se a maneira como as consultas são processadas pode ser melhorada. Às vezes, reformular a consulta ou adicionar contexto pode ajudar o sistema a encontrar resultados mais relevantes.
Revise se o pipeline de processamento está corretamente configurado, especialmente na parte de união dos documentos antes de enviá-los para o VectorStore.

Espero que essas dicas te ajudem e qualquer dúvida, compartilhe no fórum.

Até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP