1
resposta

Desafio: tratando uma base de dados

import pandas as pd
import numpy as np
import json
with open('/content/sample_data/cursos_cadastrados.json') as f:
  df = json.load(f)
dados = pd.json_normalize(df)
dados
dados.replace('',np.nan, inplace = True)
dados.isna().sum()
dados[dados.isna().any(axis = 1)]
dados.dropna(inplace = True)
dados.duplicated()
dados.drop_duplicates(inplace=True)
dados_tratados = dados.copy()
dados_tratados.info()
dados_tratados['concluintes'] = dados_tratados['concluintes'].astype(int)
dados_tratados['data_inicio'] = pd.to_datetime(dados_tratados['data_inicio'])
dados_tratados['data_conclusao'] = pd.to_datetime(dados_tratados['data_conclusao'])
dados_tratados['preco'] = dados_tratados['preco'].astype(float)
dados_tratados.info()
  
1 resposta

Oi, Marcia Gabrielle Apolinario! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

Seu código chamou atenção pela sequência bem estruturada no tratamento de dados nulos e duplicados. Ficou que está aplicando boas práticas para preparar os dados antes da análise.

Continue assim! Abraços!

Ícone de sugestão Para saber mais:

Sugestão de conteúdo para você mergulhar ainda mais sobre o tema:

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!