Olá, tudo bem?
No último vídeo da aula 3 (Transformando os dados) aprendemos a lidar com o DictWriter.
No vídeo, o professor toma um erro com relação a falta da informação 'Data da Venda'.
Apenas uma forma mais visual de entender o erro que rolou:
Essa informação existe na lista de dados do CSV, mas não existe nos dados que extraímos do JSON, como mostra o print abaixo:
Durante a aula, criamos uma combined_list para guardar os dados das duas listas em uma só. A questão aqui é que a ordem em que inserimos os dois conjuntos de dados na lista combinada muda a estrutura do arquivo.
Segue o print se começarmos a combined_list pelo arquivo que não tem o campo de Data da Venda:
Segue o print se começarmos a montar o combined_list pelo arquivo data_csv, que contem o campo de Data da Venda:
Seguindo a ordem de colocar primeiro o arquivo com mais campos, teremos um arquivo CSV final com todos os campos necessários, porém os registros que não tenham o dado para preencher naquele lugar, ficarão em branco! Podendo ser tratado num segundo momento ou simplesmente ignorado.
O dado foi entregue, mas como o professor citou, no fim do dia fica a critério da equipe de negócios decidir se o dado de Data da Venda é importante para as analises ou não.
Obs.: Nos registros que nós não temos uma data da venda, a informação fica em branco, como mostram os prints abaixo:
Header com o campo de data:
Transição dos arquivos que foram combinados, onde os últimos registros não tem a informação de data da venda, mas respeitam o layout do header e mantém a separação por vírgula, com o dado em branco: