Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Projeto] SQL Agent AI

Boa tarde, Espero que estejam bem.

Gostaria de uma orientação ou sugestões do que estudar para fazer um projeto.

Possuo um banco de dados firebird com +1.000 tabebelas, uma volumetria algumas tabelas chegam a aumentar seus registros em +200.000 registros. Estou elaborando um agente de IA que consiga interpretar esses dados e retorna-los. O projeto tem o seguinte passo a passo:

  1. Agente deve ser capaz de consultar todas informações das principais tabelas.
  2. Realizar análises com base nos dados consultados.

Pontos relevantes:

  • Os dados são sensíveis.
  • Informações estruturadas em SQL

Estou estudando RAG para consultar como documento, porém, ao que parece, RAG não é uma boa opção para dados SQL estruturados com ID, COD_CLIENTE, CNPJ...

Poderiam me dar uma sugestão de implementação?

Desde já agradeço.

1 resposta
solução!

Giovanni, boa tarde!

O que você está tentando fazer (um SQL Agent AI para consultar e analisar dados estruturados) é um caso clássico onde RAG não é a melhor estratégia. Como você mesmo percebeu, RAG funciona muito bem com texto não estruturado (documentos, PDFs, artigos), mas em bancos relacionais é diferente:

  1. Integração direta com SQL (sem RAG)

    • O modelo de linguagem pode atuar como tradutor natural language SQL query.

    • Exemplo: Usuário pergunta “Quantos clientes foram cadastrados este mês?” o agente gera a query SQL executa no banco retorna o resultado formatado.

    • Aqui, o modelo precisa conhecer o esquema do banco (principais tabelas, colunas e relacionamentos).

    • Ferramentas:

  2. Camada de Abstração / Semantic Layer

    • Criar uma camada intermediária (ex.: dbt, Cube.js, Apache Superset) que organiza métricas, KPIs e relacionamentos.
    • O agente de IA não consulta o banco “cru”, mas essa camada semanticamente modelada → reduz risco e complexidade.
  3. Controle de Segurança e Governança

    • Como os dados são sensíveis, é importante:

      • Criar um whitelist de tabelas e colunas acessíveis.
      • Implementar auditoria/logs das queries geradas.
      • Talvez anonimizar dados sensíveis (ex.: mascarar CNPJs ou IDs).
  4. Pipelines de Análise

    • Para análises mais complexas (ex.: tendências, estatísticas), o agente pode:

      • Consultar o SQL → trazer o dataframe → usar Python (Pandas, Scikit-learn, etc.) → gerar a análise/visualização.
      • Assim você une query estruturada + análise inteligente.
  5. RAG pode ser complementar

    • Não para dados SQL, mas para a documentação do banco (ex.: dicionário de dados, regras de negócio).
    • O agente poderia consultar essa documentação via RAG e, em seguida, gerar queries no banco.

Abs;