Acabei de importar uma base do repositório UCI ML e não estou conseguindo rodar um algoritmo de KNN por causa da tipagem de uma variáveis específica.
Assim que executei o dtypes apareceu o seguinte:
tipo = pd.DataFrame(df.dtypes, columns = ['Tipo'])
tipo.columns.name = 'Variáveis'
print(tipo)
Variáveis Tipo
sample_code int64
clump_thick int64
cell_sive int64
cell_shape int64
marg_adhesion int64
sing_epith_cell_size int64
bare_nuclei object
bland_chromatin int64
normal_nucleoli int64
mitoses int64
class int64
O que aconteceu? Como eu faço para converter a variável bare_nuclei? (sou iniciante)
Segue o código completo:
import pandas as pd
import os
#Reading data
labels = ['sample_code' ,'clump_thick' ,'cell_sive' ,'cell_shape' ,
'marg_adhesion' ,'sing_epith_cell_size','bare_nuclei','bland_chromatin',
'normal_nucleoli','mitoses' ,'class']
df = pd.read_csv('.../Breast cancer Wisconsin/data.csv',
sep=',', header=0, names=labels)
tipo = pd.DataFrame(df.dtypes, columns = ['Tipo'])
tipo.columns.name = 'Variáveis'
print(tipo)