1
resposta

[Dúvida] olist

O que é esse conjunto de dados olist em cima do conjunto de dados criado na aula (olist_dataset)?

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Olá, William! Como vai?

Essa é uma excelente dúvida e uma situação muito comum quando estamos trabalhando em ambientes de nuvem, especialmente no Google BigQuery (que é a ferramenta de Data Warehouse mostrada na sua captura de tela).

Esse item olist que apareceu logo acima do olist_dataset (criado por você durante a aula) não surgiu por erro. Trata-se de um Conjunto de Dados Público (Public Dataset) ou de um projeto compartilhado que o ecossistema do Google Cloud ou a própria Alura deixa fixado ou disponível na sua árvore de diretórios.

Para te ajudar a entender a diferença teórica e prática entre eles, vamos analisar o papel de cada um no BigQuery:


Entendendo a diferença na sua árvore de recursos

No Google BigQuery, a organização dos dados segue uma hierarquia padrão: Projeto $\rightarrow$ Conjunto de Dados (Dataset) $\rightarrow$ Tabelas.

  • olist_dataset (O seu): Este é o seu conjunto de dados privado. Ele foi criado dentro do seu projeto de faturamento (alura-465911). Você tem permissões totais de administrador nele, o que significa que pode carregar dados, criar tabelas, deletar informações e aplicar scripts de tratamento.
  • olist (O de cima): Este é um atalho para um conjunto de dados externo ou público carregado na plataforma. Ele contém as tabelas originais da base de dados de e-commerce da Olist (uma base famosa e muito utilizada para treinar SQL e Ciência de Dados). Ele aparece ali para que você consiga consultá-lo diretamente, mas você tem apenas permissão de leitura (visualização) sobre ele.

Qual é a utilidade prática disso na aula?

Geralmente, o instrutor disponibiliza esse projeto ou conjunto de dados original (olist) para que você não precise baixar arquivos pesados no seu computador e fazer o upload manual de tudo para a nuvem.

A dinâmica das atividades costuma ser:

  1. Você abre o conjunto de dados original olist.
  2. Faz consultas nas tabelas dele usando o editor SQL.
  3. Salva ou exporta os resultados filtrados e tratados para dentro do seu próprio conjunto privado (olist_dataset).

Você pode clicar na setinha preta ao lado esquerdo de olist para expandi-lo. Você verá que ele abrirá uma lista de tabelas prontas (como pedidos, clientes, produtos). Pode usar essas tabelas para realizar as suas consultas e testes de código sem medo, pois nada do que você fizer ali alterará os dados originais.

Espero que possa ter lhe ajudado!