1
resposta

[Sugestão] Data da Venda - Evitando o erro e obtendo os dados

Olá, tudo bem?

No último vídeo da aula 3 (Transformando os dados) aprendemos a lidar com o DictWriter.

No vídeo, o professor toma um erro com relação a falta da informação 'Data da Venda'.

Apenas uma forma mais visual de entender o erro que rolou:

Essa informação existe na lista de dados do CSV, mas não existe nos dados que extraímos do JSON, como mostra o print abaixo:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Durante a aula, criamos uma combined_list para guardar os dados das duas listas em uma só. A questão aqui é que a ordem em que inserimos os dois conjuntos de dados na lista combinada muda a estrutura do arquivo.

Segue o print se começarmos a combined_list pelo arquivo que não tem o campo de Data da Venda:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Segue o print se começarmos a montar o combined_list pelo arquivo data_csv, que contem o campo de Data da Venda:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Seguindo a ordem de colocar primeiro o arquivo com mais campos, teremos um arquivo CSV final com todos os campos necessários, porém os registros que não tenham o dado para preencher naquele lugar, ficarão em branco! Podendo ser tratado num segundo momento ou simplesmente ignorado.

O dado foi entregue, mas como o professor citou, no fim do dia fica a critério da equipe de negócios decidir se o dado de Data da Venda é importante para as analises ou não.

Obs.: Nos registros que nós não temos uma data da venda, a informação fica em branco, como mostram os prints abaixo:

Header com o campo de data:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Transição dos arquivos que foram combinados, onde os últimos registros não tem a informação de data da venda, mas respeitam o layout do header e mantém a separação por vírgula, com o dado em branco:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Olá, Anderson, tudo bem?

Agradeço por compartilhar essa dica de como lidar com a inconsistência dos campos entre os diferentes conjuntos de dados ao combinar os dados do CSV e do JSON. Sua abordagem é eficaz, pois garante que todas as colunas necessárias estejam presentes no arquivo final, mesmo que alguns registros tenham valores em branco para certos campos.

Quanto aos valores em branco da 'Data da Venda', você pode considerar algumas opções, como, por exemplo, preencher os valores em branco com um valor padrão, como 'Não Disponível' ou uma data específica que faça sentido no contexto dos seus dados.

Anderson, mais uma vez agradeço pelo conhecimento compartilhado, ele poderá ajudar outros alunos.

Caso surja alguma dúvida, compartilhe no fórum.

Abraços e bons estudos!