Estou trabalhando com uma base de dados com várias linhas e colunas. Segue o código que estou usando para fazer a leitura da base:
tipo = pd.DataFrame(df.dtypes, columns = ['Tipo'])
tipo.columns.name = 'Variáveis'
print(tipo)
Variáveis Tipo
sample_code int64
clump_thick int64
cell_sive int64
cell_shape int64
marg_adhesion int64
sing_epith_cell_size int64
bare_nuclei object
bland_chromatin int64
normal_nucleoli int64
mitoses int64
class int64
Como podemos ver, a variável bare_nuclei está com um formato diferente. Fazendo um drop_duplicate descobri que existem valores do tipo '?'. Preciso substituir todos os valores '?' desta variável, por números.
Qual seria a melhor forma de fazer?
O melhor é fazer um iterador para avaliar se cada componente é igual a '?' e então substituí-lo?