Nessa aula prática, "03 Pipeline para Dados Complexos Pratica #2", as respostas para as duas perguntas no teste final parece não fazer sentido algum. Podem explicar melhor, por favor?
Nessa aula prática, "03 Pipeline para Dados Complexos Pratica #2", as respostas para as duas perguntas no teste final parece não fazer sentido algum. Podem explicar melhor, por favor?
Olá, Uarles! Como vai?
As alternativas corretas dessas duas questões (as alternativas A nas duas questões) fazem sentido quando entendemos que o objetivo do capítulo é construir um pipeline completo, capaz de lidar com dados complexos para uso em RAG — PDFs, vídeos, textos, feedbacks e outros formatos.
As perguntas pedem pipelines que mantenham qualidade, consistência, padronização, enriquecimento com metadados e preparo para armazenamento vetorial.
Somente as alternativas corretas incluem todas essas etapas essenciais.
Por que a alternativa A é a correta nas duas questões?
1) “Garantindo a qualidade dos dados em tratamentos de relaxamento”
O enunciado exige um pipeline que cuide de:
A alternativa A é a única que reúne todas essas etapas, garantindo que os dados fiquem prontos para personalização dos tratamentos.
As demais alternativas sempre deixam faltar partes importantes, como limpeza, padronização, enriquecimento ou indexação, o que quebra o pipeline.
2) “Otimizando a experiência de bem-estar com pipelines de dados complexos”
Aqui o problema envolve dados multimodais: vídeos, PDFs, áudios e textos.
É necessário um pipeline robusto que trate cada tipo de forma consistente e padronizada.
A alternativa A descreve exatamente isso:
Ou seja, é a única opção que realmente cria um pipeline sólido para um sistema RAG funcional.
As demais alternativas simplificam demais o processo, ignoram etapas essenciais ou focam apenas em um tipo de dado, o que não atende ao enunciado.
Espero ter ajudado. Conte com o apoio do Fórum na sua jornada. Fico à disposição.
Abraços e bons estudos!