1
resposta

Sobrescrevendo valores em uma lista

Estou trabalhando com uma base de dados com várias linhas e colunas. Segue o código que estou usando para fazer a leitura da base:

tipo = pd.DataFrame(df.dtypes, columns = ['Tipo'])
tipo.columns.name = 'Variáveis'
print(tipo)


Variáveis               Tipo
sample_code            int64
clump_thick            int64
cell_sive              int64
cell_shape             int64
marg_adhesion          int64
sing_epith_cell_size   int64
bare_nuclei          object
bland_chromatin        int64
normal_nucleoli        int64
mitoses                int64
class                  int64

Como podemos ver, a variável bare_nuclei está com um formato diferente. Fazendo um drop_duplicate descobri que existem valores do tipo '?'. Preciso substituir todos os valores '?' desta variável, por números.

Qual seria a melhor forma de fazer?

O melhor é fazer um iterador para avaliar se cada componente é igual a '?' e então substituí-lo?

1 resposta

Fabio,

Sugiro que vc assista essa aula do Curso Data Science: Introdução ao Python Pandas. Acredito que tem tudo que vc precisa:

https://cursos.alura.com.br/course/introducao-python-pandas/task/41800

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software