[Projeto] Faça como eu fiz: pipeline de RAG

Solucionado (ver solução)

Solucionado
(ver solução)

2
respostas

por LEANDRO DOS SANTOS MOQUIUTI FERREIRA

| 137.2k xp | 126 posts

A pipeline de RAG funciona como uma arquitetura que conecta o modelo de linguagem a uma base externa de conhecimento. Primeiro, os documentos brutos, como PDFs, planilhas e arquivos de texto, são convertidos para um formato textual. Depois, esses textos são limpos, padronizados e divididos em partes menores, chamadas de chunks. Em seguida, cada trecho é transformado em embedding, ou seja, uma representação vetorial do seu significado, e armazenado em uma VectorStore.

Quando o usuário faz uma pergunta, o sistema também transforma essa pergunta em embedding e utiliza um retriever para buscar os trechos mais relevantes na base vetorial. Esses trechos recuperados são enviados como contexto para o LLM, que então gera uma resposta mais precisa, contextualizada e baseada nos documentos disponíveis.

Dessa forma, o RAG reduz a dependência do conhecimento genérico do modelo e melhora a confiabilidade das respostas, principalmente em cenários corporativos, onde as informações corretas estão em documentos internos, políticas, manuais e regras de negócio. No caso de uma empresa como a TRATOTECH, isso permitiria consultar documentos internos, manuais de produtos e políticas de venda para oferecer um suporte mais preciso, rápido e embasado.

2 respostas

por Rafaela Petelin Silvério

| 2024.9k xp | 4645 posts

Alura Scuba Team

3 semanas atrás

Oi, Leandro! Como vai?

Agradeço por compartilhar suas reflexões e aprendizados com a comunidade Alura.

Gostei da sua explicação sobre a pipeline de RAG e de como você descreve o fluxo desde a transformação dos documentos até o uso do retriever para buscar os trechos mais relevantes. Sua visão sobre como isso melhora a confiabilidade das respostas faz sentido e mostra boa compreensão do tema. Continue explorando esses conceitos, pois isso vai fortalecer sua base em arquiteturas de IA.

Dica: para fixar melhor o funcionamento do RAG, experimente desenhar um fluxo simples com as etapas (chunks, embeddings, VectorStore, busca e geração). Isso ajuda a visualizar como cada parte se conecta na prática.

Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!

solução!

por LEANDRO DOS SANTOS MOQUIUTI FERREIRA

| 137.2k xp | 126 posts

3 semanas atrás

Ola Rafaela, tudo certo!

Obrigado pelo feedback e pela dica! vou aplicar sim!

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Tópicos relacionados

Conteúdos Alura com o tema