import pandas as pd
import json
url = '/content/drive/MyDrive/Dados/Dados_normalizando_json/questao_3.json'
with open(url, 'r') as arquivo:
dados = json.load(arquivo)
dados
dados = pd.json_normalize(dados, sep = '_')
dados
import pandas as pd
import json
url = '/content/drive/MyDrive/Dados/Dados_normalizando_json/questao_3.json'
with open(url, 'r') as arquivo:
dados = json.load(arquivo)
dados
dados = pd.json_normalize(dados, sep = '_')
dados
Oi, Marcia! Como vai?
Agradeço por compartilhar seu código com a comunidade Alura.
Muito boa a leitura manual com json.load()
antes de aplicar o pd.json_normalize()
. Esse caminho é ótimo quando precisamos inspecionar os dados antes de processá-los, especialmente em arquivos com estruturas aninhadas.
Quando usamos a função json_normalize()
com o parâmetro sep
, como no exemplo acima, conseguimos controlar como os nomes das colunas serão formados ao "achatar" os dicionários aninhados. O valor de sep
define o separador usado entre os níveis de chaves do JSON. Por exemplo, com sep='_'
, a chave usuario.endereco.cidade
vira usuario_endereco_cidade
.
Isso ajuda a evitar conflitos com nomes de colunas e facilita a manipulação posterior dos dados.
Se quiser saber mais sobre como trabalhar com JSONs complexos e explorar parâmetros como record_path
e meta
, você pode acessar a documentação oficial do pandas.
Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!