1
resposta

Desafio: tratando os dados

import pandas as pd
import json
df = pd.read_json('/content/sample_data/dados.json')
df.head()
with open('/content/sample_data/dados.json') as f:
dados = json.load(f)
df_normalizados = pd.json_normalize(dados, record_path= 'pessoas')
df_normalizados
df_normalizados.info()
df_normalizados['idade'] = df_normalizados['idade'].astype(int)
df_filtrado = df_normalizados.query('`endereco.rua` != ""')
df_normalizados = df_normalizados[df_normalizados['endereco.rua'] != '' ]
df_normalizados
1 resposta

Oi,Marcia! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

É isso aí! Você usou o json_normalize para organizar os dados e aplicou corretamente o astype(int) para tratar o tipo de dado. Está no caminho certo!

💡Uma dica interessante para o futuro é usar o dropna() para remover valores nulos de uma coluna específica. Veja este exemplo:


df = df.dropna(subset=['nome_da_coluna'])

Esse código remove linhas em que a coluna nome_da_coluna estiver com valor nulo.

Abraços!

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!