0
respostas

Desafio: tratando uma base de dados

import pandas as pd
import numpy as np
import json
with open('/content/sample_data/cursos_cadastrados.json') as f:
  df = json.load(f)
dados = pd.json_normalize(df)
dados
dados.replace('',np.nan, inplace = True)
dados.isna().sum()
dados[dados.isna().any(axis = 1)]
dados.dropna(inplace = True)
dados.duplicated()
dados.drop_duplicates(inplace=True)
dados_tratados = dados.copy()
dados_tratados.info()
dados_tratados['concluintes'] = dados_tratados['concluintes'].astype(int)
dados_tratados['data_inicio'] = pd.to_datetime(dados_tratados['data_inicio'])
dados_tratados['data_conclusao'] = pd.to_datetime(dados_tratados['data_conclusao'])
dados_tratados['preco'] = dados_tratados['preco'].astype(float)
dados_tratados.info()