Tema: Inteligência Artificial com sotaque brasileiro – A jornada dos modelos Sabiá
Por Ricardo Costa Val do Rosário auxiliado por Microsoft Copilot 365
Contexto
• Maritaca AI desenvolve modelos de linguagem especializados no Brasil.
• Linha de modelos Sabiá: adaptados ao português e ao contexto jurídico, cultural
e educacional brasileiro.
• Importância da especialização: modelos globais não capturam nuances locais.
Desafios
• Falta de datasets confiáveis e representativos do Brasil.
• Alto custo computacional para treinar modelos em larga escala.
• Atualização constante de conhecimento (jurisprudência, legislação, cultura).
Soluções e Estratégias
• Criação de datasets próprios (ex.: BlueX, OAB Bench).
• Modelos especializados (Sabiá 1, 2, 3 e agora 4) com foco em custo-benefício.
• API compatível com OpenAI, facilitando adoção por empresas brasileiras.
• Casos de uso: simplificação de juridiquês, análise de transcrições, outputs
estruturados.
Caminhos Futuros
• Lançamento do Sabiá 4, com foco jurídico e maior capacidade de raciocínio.
• Expansão para setores críticos (educação, saúde, governo).
• Investimento em infraestrutura nacional de IA para reduzir dependência de
clouds estrangeiras.