1
resposta

Verificar abordagem - biblioteca PyDeequ

Resposta da pergunta: "Realizar um check para verificar se todas as datas de registro dos clientes estão dentro de um intervalo específico, identificando possíveis inconsistências temporais nos dados. Um check pode ser utilizado para verificar a consistência temporal dos dados, garantindo que as datas estejam dentro de um intervalo válido e identificando possíveis erros de registro."

Neste caso, se "Utilizar um analyzer para verificar a integridade dos dados e identificar se há valores ausentes ou nulos nas colunas principais do conjunto de dados dos clientes." não teriamos uma possibilidade de ter mais amplitude na verificação da qualidade?

1 resposta

Ei, Daiany! Tudo bem?

Agradeço por aguardar o nosso retorno.

A sua dúvida faz muito sentido, pois o check e o analyzers possuem características que se complementam.

No contexto da sua pergunta, o uso de "checks" e "analyzers" são abordagens complementares. Enquanto o check, foca em garantir que as datas de registro estejam dentro de um intervalo específico, identificando inconsistências temporais, o uso de um analyzer para verificar a integridade dos dados, pode, de fato, ampliar a verificação da qualidade dos dados.

Mas no contexto da atividade, o check já é o suficiente para verificar a qualidade dos dados.

Caso você precise ter uma abordagem mais ampla, combine as duas técnicas.

Deixo um artigo como algo complementar aos seus estudos sobre o tema:

A página está em inglês, caso não tenha familiaridade com o idioma, use o tradutor automático do seu navegador.

Espero ter sanado a sua dúvida e conte sempre com o nosso auxílio.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!