Linhas duplicadas ao final do processo

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

por Rodrigo Hjort

| 69.2k xp | 6 posts

Ao final dessa seção, restam linhas duplicadas de clientes (que deveriam ser únicos):

df_final['Id_unico_cliente'].value_counts()

df_final.tail()

Para resolver esse problema, basta executar essa linha:

df_final.drop_duplicates(subset='Id_unico_cliente', keep='last', inplace=True)

E aí sim persistir o arquivo final em disco:

df_final.to_csv('RFM.csv.bz2', index=False)

1 resposta

por Mirla Costa

| 272.1k xp | 493 posts

Instrutor

05/01/2022

Oi Rodrigo! Tudo bem com você? Espero que sim!

Muito bacana sua solução, muito legal também o uso dos parâmetros em drop_duplicates, parabéns!

Obrigada por compartilhar sua solução aqui no fórum ^^

Bons estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP