1
resposta

Aula 3 Embeddings de Alta Performance Pratica #2

Todo código em "Aula_03_embeddings_alta_performance.ipynb", 3. Batch Processing para Indexação em Larga Escala simplesmente não funciona, nem Gemini/Copilot estão ajudando a fazer funcionar. Deve ser incompatibilidade de versão. Conseguem atualizar o código ou corrigir?

1 resposta

Oi, Valdir, tudo bem?

Para que o seu notebook funcione como o do instrutor, recomendo seguir estes ajustes.

1. Atualize as versões das bibliotecas.
Remova o comando:

!pip install langchain langchain-google-genai sentence-transformers scikit-learn langchain-community

e substitua por:

!pip install langchain==0.3.26 langchain-community==0.3.27 langchain-core==0.3.71 langchain-google-genai==2.1.8 sentence-transformers==4.1.0 scikit-learn==1.6.1

2. Ajuste o modelo utilizado.
Troque:

model="models/embedding-001"

por:

model="gemini-embedding-001"

Após isso, será necessário reiniciar o Notebook, seguindo estes passos:

  1. No menu de ferramentas do Google Colaboratory, clicar em "Ambientes de execução";

  2. Selecionar a opção "Reiniciar sessão e executar tudo".

Para realizar essas etapas, você pode acompanhar a imagem abaixo:

Reiniciar sessão e executar tudo, no Google Colaboratory

Deixo também o meu notebook como referência. Lembre-se de inserir a sua chave de API no local indicado.

Ah! E não se preocupe com o tempo de execução do último bloco de código, ele realmente demora. Aqui, a execução batch levou 18 minutos ao total.

Fico à disposição!

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!