1
resposta

[Sugestão] Parametrização automática das colunas.

Olá,

Percebi que a instrutora acabou por fazer a alteração dos atributos das colunas de maneira 'manual', ou seja, foi em cada coluna que possui strings como atributo e fez o processo mostrado no vídeo. Abaixo eu deixo uma sugestão de código que faz de maneira manual. Não sei se é o código mais limpo mas ajuda bastante. Espero dessa forma ajudar alguém que venha a fazer o curso no futuro.

Abs

#criar um loop com o numero de colunas do database
for i in range(dados.shape[1]): 
    #verifica se a coluna possui dadados que estão no formato de string ou não
    if (type(dados.loc[0][i]) is str) == True: 
        #criação de uma variavel para armazenar os atributos distintos de cada coluna 
        teste = dados[dados.columns[i]].unique() 
        #dicionario que era fazer a troca dos atributos
        dict = {}
        #loop que faz a parametrização dos atributos 
        for j in range(len(teste)):
            dict[teste[j]] = j+1

        dados[dados.columns[i]] = dados[dados.columns[i]].map(dict)
#padronização dos dados binarios da ultima coluna, sendo 1 para yes e 0 para no                
troca = {
    1 : 1,
    2 : 0
}

dados[dados.columns[-1]] = dados[dados.columns[-1]].map(troca)

dados.head()    
1 resposta

Olá Breno, tudo bem com você?

Fico feliz em ver a sua postagem e sua contribuição para o fórum da Alura. Existem várias maneiras de alcançar um resultado e o que você mostrou também atende ao objetivo demonstrado na atividade. Sendo muito útil, pois pode economizar um tempo considerável, especialmente quando se trabalha com conjuntos de dados com um grande número de colunas. Sua dica certamente servirá de inspiração para os demais estudantes.

Continue mergulhando em conhecimento e não hesite em voltar ao fórum para continuar aprendendo e interagindo com a comunidade.

Abraços e bons estudos!