[Dúvida] Inserção dos Documentos no Pinecone

Nelson Jacob Dressler · 2026-03-27 06:44

Olá, Durante a aula de bancos vetoriais, o professor apresentou o modo como usar o banco Pinecone, criando um índice e, com base no host e na chave de API, criando o objeto de acesso ao banco

Oii, Nelson!

É excelente notar como você tá comparando as diferentes formas de inicialização das Vector Stores. Essa é uma confusão muito comum quando mudamos de bancos em memória (como o InMemoryVectorStore) pra bancos gerenciados na nuvem (como o Pinecone).

A principal diferença aqui é o estado do banco de dados.

O Conceito de Conexão vs. Criação:

Nos exemplos anteriores com InMemoryVectorStore ou Chroma.from_documents, você estava criando o banco do zero naquele exato momento. Por isso, precisava passar os documentos e o modelo de embeddings simultaneamente para que o LangChain pudesse processar tudo.

No caso do Pinecone (ou Milvus e outros bancos persistentes), o fluxo geralmente se divide em dois momentos:

Indexação (Criação): Você envia os documentos uma única vez. Eles são transformados em vetores e armazenados nos servidores do Pinecone.
Recuperação (Uso): Você apenas se conecta a um índice que já existe e já contém os dados.

Por que não usamos o from_documents o tempo todo?

Se você usar o Pinecone.from_documents toda vez que rodar seu script, você estará enviando e duplicando os mesmos documentos no banco de dados a cada execução. Isso gera custos desnecessários de API e polui sua base de dados.

No código que você viu em aula, o professor seguiu este raciocínio:

O índice já foi criado no painel do Pinecone (com a dimensão 384 para o modelo do Hugging Face).
Os documentos já foram inseridos via add_documents.
O objeto de acesso serve apenas para apontar para aquele endereço (host) e dizer ao LangChain: "Sempre que eu fizer uma pergunta, use este modelo de embedding para transformar minha pergunta em vetor e procure neste índice específico".

Onde entram os Embeddings nesse contexto?

Mesmo que você não esteja inserindo documentos novos, o modelo de Embeddings é obrigatório na inicialização por um motivo vital: a sua pergunta.

Quando você faz uma busca (query), o Pinecone não entende texto puro. Ele precisa que a sua pergunta seja transformada em um vetor de números. O modelo de embeddings que você passa na configuração é o responsável por:

Pegar sua dúvida (ex: "Ouro tem Seguro Viagem?").
Gerar o vetor correspondente.
Enviar esse vetor ao Pinecone para comparação de similaridade (distância de cosseno).

Resumo do fluxo:

Se o banco está vazio: Use Pinecone.from_documents(docs, embeddings, ...) ou vectorstore.add_documents(docs).
Se o banco já tem os dados: Use apenas a inicialização da classe passando o index_name e o embeddings_model.

Isso garante que sua aplicação seja rápida, pois ela não precisa reprocessar toda a base de conhecimento toda vez que o usuário abrir o chat.

Conteúdos relacionados

Inteligência Artificial com Guanabara – Hipsters Ponto Tech #426

Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Tópicos relacionados

Conteúdos Alura com o tema