Geração de embeddings

Roberto Fortuci Lopes · 2026-05-10 15:46

No exercício foram gerados os embeddings com o modelo da OpenAI. Caso eu resolva trocar de LLM, por exemplo Gemini, para realizar as consultas preciso gerar os embedding novamente com o modelo Gemini

Ei! Tudo bem, Roberto?

Essa é uma excelente pergunta! Sim, você precisará gerar os embeddings novamente se decidir trocar o modelo de representação vetorial (do OpenAI para o Gemini, por exemplo).

Isso acontece porque cada modelo de embeddings possui seu próprio "espaço vetorial". Pense neles como tradutores de diferentes idiomas: enquanto o modelo da OpenAI traduz seu texto para uma lista de números baseada em sua própria lógica interna, o Gemini utiliza uma lógica e dimensões diferentes.

Por que isso é obrigatório?

Dimensionalidade: O modelo text-embedding-3-small da OpenAI pode gerar vetores de 1536 dimensões, enquanto modelos do Gemini ou do HuggingFace podem usar 768 ou outros valores. Vetores de tamanhos diferentes não podem ser comparados.
Espaço Semântico: Mesmo que tivessem o mesmo tamanho, o "significado" que o modelo atribui a cada número no vetor é único. Se você buscar uma pergunta processada pelo Gemini em um banco de dados indexado pela OpenAI, o resultado será matematicamente incompatível, gerando recuperações sem sentido ou erros de sistema.

O que você deve fazer ao trocar de LLM:

Defina o novo provedor de embeddings no seu código (ex: GoogleGenerativeAIEmbeddings).
Limpe ou crie um novo índice no seu Vector Store (banco de dados vetorial).
Processe novamente seus documentos (chunks) através desse novo modelo para reindexá-los.

E não se esqueça que o custo e a performance de recuperação (retrieval) podem variar bastante entre esses modelos, então vale testar qual se adapta melhor ao seu domínio de dados.

Espero ter ajudado e continue se dedicando aos estudos, qualquer dúvida é só compartilhar no fórum.

Material Complementar

Esse conteúdo pode estar em inglês, para traduzi-lo utilize o tradutor automático do navegador ou clique com o botão direito do mouse sobre a página e selecione a opção Traduzir para o português.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP