Passo a Passo – Implementação Prática
- Crie um Bucket no Cloud Storage
No console do Google Cloud:
Menu → Armazenamento → Navegador → Criar bucket
Nome do balde: trtotech_dataset (letras minúsculas, números, traços, sem espaços ou palavra "google").
Localização: Multi-regional (ex.: EUA) para alta disponibilidade.
Classe de armazenamento: Standard (para arquivos acessados frequentemente).
Acesso público: Desative o acesso público para segurança.
- Organizar e fazer upload de arquivos
Dentro do balde, chore massas, por exemplo:
csv_files/→ para arquivos CSV
json_files/→ para arquivos JSON
Faça o upload dos arquivos para as pastas correspondentes.
Confirme que os arquivos foram carregados com sucesso.
Exemplo:
trtotech_dataset/
├─ csv_files/
│ └─ orders.csv
└─ json_files/
└─ holidays.json
- Criar conjunto de dados no BigQuery
Sem console: Menu → BigQuery → Explorer → Criar conjunto de dados
Nome do conjunto de dados: trtotech_dataset_bq
Localização: mesma que o bucket (multirregional) para melhor desempenho.
- Criar Tabelas Conectadas ao Bucket
Dentro do conjunto de dados, clique em Criar Tabela .
Origem: Google Cloud Storage → selecione o arquivo CSV ou JSON.
Formato: CSV ou JSON (conforme o arquivo).
Destino: Conjunto de dados criado ( trtotech_dataset_bq) e nome da tabela (ex.: orders).
Detecção automática de esquema: habilite para que o BigQuery identifique colunas e tipos.
Crie uma tabela.
Dica: se algum tipo de dado não for detectado corretamente, você pode editar o esquema manualmente.
- Validar e consultar os dados
Consulta básica para ver todas as colunas (limitando a 2 registros):
SELECT *
FROM seu-projeto.trtotech_dataset_bq.orders
LIMIT 2;
Consulte para ver valores diferentes de status de pedidos:
SELECT DISTINCT order_status
FROM seu-projeto.trtotech_dataset_bq.orders;
Análise prática: identificar pedidos entregues, cancelados ou em atraso para relatórios e dashboards.