1
resposta

Erro Linhas duplicadas

Quando vou fazer o concat o meu dataset vem com as linhas duplicadas estou usando o axis=1

1 resposta

Olá Lucas, tudo bem? Espero que sim!

Confira se está executando o código corretamente, colocando os dois DataFrames entre colchetes na função concat().

O código utilizado em aula foi o seguinte:

from sklearn.preprocessing import OneHotEncoder

ohe = OneHotEncoder(dtype=int)
colunas_ohe = ohe.fit_transform(dados[['artists']]).toarray()
dados2 = dados.drop('artists', axis = 1)

dados_musicas_dummies = pd.concat([dados2, pd.DataFrame(colunas_ohe, columns = ohe.get_feature_names_out(['artists']))], axis = 1)
dados_musicas_dummies

Bons estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software