Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Olá, Vivian! Tudo bem?
Que ótimo ver você colocando a mão na massa e explorando as bases de dados da Olist no curso de Power BI Desktop! Essa é uma das etapas mais enriquecedoras do aprendizado, pois trabalhar com datasets reais como os da Olist nos dá uma visão muito mais próxima do que encontramos no dia a dia profissional.
Parabéns por estar praticando, está se saindo muito bem!
Ao explorar as bases de dados da Olist, é importante observar a qualidade dos dados desde o início, identificando colunas desnecessárias, valores ausentes e tipos de dados incorretos. Esses ajustes feitos no Power Query garantem que suas análises sejam precisas e eficientes.
Continue explorando com curiosidade, pois cada desafio nessa etapa do projeto é uma oportunidade de consolidar seu conhecimento de forma prática e significativa.
Você encontrou alguma dificuldade específica ao conectar ou transformar alguma das bases de dados da Olist durante o processo de ETL?
Olá, Vivian. Como vai?
Excelente registro da sua tela! É muito bom ver que você já está explorando a base de dados da Olist diretamente no Power Query. Notei também que você ativou os recursos visuais de Qualidade da coluna e Distribuição de colunas na guia Exibição. Essa é uma das melhores práticas no início de qualquer projeto de BI, pois nos permite mapear rapidamente a integridade dos dados, identificando a porcentagem de valores válidos, erros ou linhas vazias antes de carregar o modelo.
Analisando atentamente a estrutura da sua tabela olist_orders_dataset no print, existem alguns tratamentos cruciais de ETL que precisam ser realizados para que seus futuros relatórios funcionem corretamente. Note que os dados estão "desalinhados" nas primeiras linhas:
date: 09/2016 - 09/2018) e os demais campos estão preenchidos como null.order_id, customer_id, order_status, etc.).orders list, Column2, Column3, etc.Para limpar essa base e deixá-la pronta para o Power BI, recomendo que você execute o seguinte passo a passo de tratamento:
1. Remover a primeira linha inválida
Como a primeira linha não faz parte dos registros (é apenas um texto informativo), você precisa eliminá-la:
1 (para remover apenas a primeira linha) e clique em OK.2. Promover a nova primeira linha a Cabeçalho
Agora que a linha com os nomes corretos (order_id, customer_id, etc.) subiu para a primeira posição da tabela, faça o seguinte:
3. Corrigir os Tipos de Dados
Após promover os cabeçalhos, o Power Query costuma criar uma etapa automática chamada Tipo Alterado. Certifique-se de validar se as colunas de data/hora, como order_purchase_timestamp, foram devidamente tipadas como Data/Hora (com o ícone de um calendário e relógio no cabeçalho) e não como Texto, para garantir que suas futuras análises temporais funcionem sem erros.
Realizar essa limpeza inicial vai garantir que os relacionamentos com as outras tabelas (como olist_itens_pedidos) funcionem perfeitamente. Parabéns por iniciar os trabalhos nesta base rica da Olist!
Espero que possa ter lhe ajudado!