Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)
2
respostas

[Projeto] Mão na massa: explorando bases de dados da Olist

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

2 respostas

Olá, Vivian! Tudo bem?

Que ótimo ver você colocando a mão na massa e explorando as bases de dados da Olist no curso de Power BI Desktop! Essa é uma das etapas mais enriquecedoras do aprendizado, pois trabalhar com datasets reais como os da Olist nos dá uma visão muito mais próxima do que encontramos no dia a dia profissional.

Parabéns por estar praticando, está se saindo muito bem!

Ao explorar as bases de dados da Olist, é importante observar a qualidade dos dados desde o início, identificando colunas desnecessárias, valores ausentes e tipos de dados incorretos. Esses ajustes feitos no Power Query garantem que suas análises sejam precisas e eficientes.

Continue explorando com curiosidade, pois cada desafio nessa etapa do projeto é uma oportunidade de consolidar seu conhecimento de forma prática e significativa.

Você encontrou alguma dificuldade específica ao conectar ou transformar alguma das bases de dados da Olist durante o processo de ETL?

Conteúdos para complementar seus estudos
Esse conteúdo pode estar em inglês, para traduzi-lo utilize o tradutor automático do navegador ou clique com o botão direito do mouse sobre a página e selecione a opção Traduzir para o português.
Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!
solução!

Olá, Vivian. Como vai?

Excelente registro da sua tela! É muito bom ver que você já está explorando a base de dados da Olist diretamente no Power Query. Notei também que você ativou os recursos visuais de Qualidade da coluna e Distribuição de colunas na guia Exibição. Essa é uma das melhores práticas no início de qualquer projeto de BI, pois nos permite mapear rapidamente a integridade dos dados, identificando a porcentagem de valores válidos, erros ou linhas vazias antes de carregar o modelo.

Analisando atentamente a estrutura da sua tabela olist_orders_dataset no print, existem alguns tratamentos cruciais de ETL que precisam ser realizados para que seus futuros relatórios funcionem corretamente. Note que os dados estão "desalinhados" nas primeiras linhas:

  • Linha 1: Contém uma informação descritiva de período (date: 09/2016 - 09/2018) e os demais campos estão preenchidos como null.
  • Linha 2: É onde estão guardados os verdadeiros nomes das colunas (order_id, customer_id, order_status, etc.).
  • Cabeçalhos Atuais: O Power Query nomeou temporariamente os cabeçalhos como orders list, Column2, Column3, etc.

Para limpar essa base e deixá-la pronta para o Power BI, recomendo que você execute o seguinte passo a passo de tratamento:

1. Remover a primeira linha inválida
Como a primeira linha não faz parte dos registros (é apenas um texto informativo), você precisa eliminá-la:

  • Na guia Página Inicial, clique no botão Reduzir Linhas.
  • Escolha Remover Linhas e depois Remover Linhas Superiores.
  • Na janela que se abrir, digite 1 (para remover apenas a primeira linha) e clique em OK.

2. Promover a nova primeira linha a Cabeçalho
Agora que a linha com os nomes corretos (order_id, customer_id, etc.) subiu para a primeira posição da tabela, faça o seguinte:

  • Na guia Página Inicial (ou na guia Transformar), clique no botão Usar Primeira Linha como Cabeçalho.

3. Corrigir os Tipos de Dados
Após promover os cabeçalhos, o Power Query costuma criar uma etapa automática chamada Tipo Alterado. Certifique-se de validar se as colunas de data/hora, como order_purchase_timestamp, foram devidamente tipadas como Data/Hora (com o ícone de um calendário e relógio no cabeçalho) e não como Texto, para garantir que suas futuras análises temporais funcionem sem erros.

Realizar essa limpeza inicial vai garantir que os relacionamentos com as outras tabelas (como olist_itens_pedidos) funcionem perfeitamente. Parabéns por iniciar os trabalhos nesta base rica da Olist!

Espero que possa ter lhe ajudado!