Duplicação das entradas

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

por Lucas Ribas Soares Jurado

| 92.6k xp | 8 posts

A duplicação dos alunos em um mesmo curso veio da linha de código desenvolvida, salvo engano, na 2ª parte do curso.

for index, row in nomes.iterrows():

¬¬id = row.id_aluno

¬¬matriculas = row.matriculas

¬¬for i in range(matriculas):

¬¬¬¬mat = [id, np.random.choice(cursos.index, p = prob)]

¬¬¬¬todas_matriculas.append(mat)

Existe alguma forma de configurar o: np.random.choice(cursos.index, p = prob) ; para não duplicar o nome do curso no mesmo id do aluno?

1 resposta

por Instrutor

| 558.7k xp | 844 posts

Instrutor

08/06/2020

Olá Lucas tudo bem com você???

Conforme a documentação técnica do Numpy para essa finalidade não.

O que pode ser feito é o tratamento dessas informações usando o pandas depois do join.

Para isso você pode utilizar:

df = df.drop_duplicates()

Ele irá varrer as linhas e retirar as repetidas.

Tem mais detalhes aqui na Documentação Pandas

O pandas é uma ótima biblioteca para o tratamento de dados.

Espero ter ajudado e caso ainda tenha dúvida pode retornar aqui =)

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP