1
resposta

criar agente RAG

Nesta atividade, desenvolvi um projeto de agente RAG utilizando a Vertex AI para responder perguntas com base em documentos. Primeiro, realizei a ingestão dos dados a partir de arquivos armazenados no Cloud Storage ou tabelas no BigQuery , formando uma base de conhecimento do sistema. Em seguida, os documentos foram divididos em menores depósitos , facilitando o processamento e melhorando a recuperação de contexto.

Depois disso, apliquei o processo de embeddings , convertendo cada trecho textual em vetores numéricos que representam seu significado semântico. Esses vetores foram então indexados em um banco vetorial , permitindo uma busca semântica eficiente dos conteúdos mais relevantes. Na etapa de testes, ajustei o parâmetro TopK para recuperar os trechos mais úteis de acordo com a pergunta feita pela pessoa usuária.

Por fim, integrei uma etapa de recuperação com um LLM na Vertex AI , permitindo que o modelo gerasse respostas fundamentadas nos documentos recuperados. Assim, o agente passou a responder de forma mais precisa, contextualizada e com menor risco de alucinação, demonstrando o funcionamento completo de um pipeline RAG.

1 resposta

Olá, Moacir! Como vai?

Parabéns pela resolução da atividade!

Observei que você explorou o uso do Vertex AI para implementar um agente RAG com Python, utilizou muito bem o processo de embeddings para transformar os documentos em vetores semânticos e ainda compreendeu a importância da integração com LLM para gerar respostas fundamentadas e reduzir o risco de alucinações.

Continue postando as suas soluções, com certeza isso ajudará outros estudantes e tem grande relevância para o fórum.

Sugestão de conteúdo para você mergulhar ainda mais no tema:

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

AluraConte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!