Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Projeto] Desafio - tratando os dados

#lendo arquivo json
with open('/content/dados.json') as arquivo:
  json_dados = json.load(arquivo)

#normalizando arquivo a partir de 'pessoas'
json_dados = pd.json_normalize(json_dados, record_path='pessoas')

#visualizando os dados
json_dados.head()

#observa-se que endereco.rua está vazio no registro 1

#conferindo os tipos de dados
json_dados.info()

#obtendo o índice do registro com endereco.rua vazio
indice = json_dados[json_dados['endereco.rua'] == ''].index

#removendo o registro com endereco.rua vazio do dataframe
json_dados.drop(indice, inplace = True)

#checando as alterações feitas
json_dados.head()
1 resposta
solução!

Olá, Vinicius! Como vai?

Parabéns pela resolução da atividade!

Observei que você explorou o uso do json_normalize para transformar dados em um DataFrame com Python, criou muito bem a lógica para identificar registros com valores vazios e ainda compreendeu a importância do drop para manter a consistência dos dados.

Continue postando as suas soluções, com certeza isso ajudará outros estudantes e tem grande relevância para o fórum.

Uma dica interessante para o futuro é usar o parâmetro subset do dropna para remover registros com valores nulos em colunas específicas. Assim:

json_dados.dropna(subset=['endereco.rua'], inplace=True)

Isso faz a remoção automática de linhas com valores ausentes na coluna indicada, sem precisar buscar índices manualmente.

Sugestão de conteúdo para você mergulhar ainda mais no tema:

Alguns materiais estão em inglês, mas é possível compreendê-los usando o recurso de tradução de páginas do próprio navegador.

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

AluraConte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!