Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

DÚVIDAS__ Removendo valores repetidos

Prezado(a).

Ao ver a video aula, fiquei com a seguinte dúvida:

Dados os códigos abaixo, qual a diferença entre eles? Questiono isso porque o resultado final me parecer ser o mesmo.

tipo_de_imovel.drop_duplicates()

tipo_de_imovel.drop_duplicates(keep='first', inplace=False)

tipo_de_imovel.drop_duplicates(inplace=True)

Além disso, quando se faz o último código acima, qual a ideia quer se quer passar com o inplace=True??

2 respostas
solução!

Olá Thiago,

Os comandos fazem a mesma coisa sim. A diferença é que em cada um deles você está especificando algo.

No primeiro.

tipo_de_imovel.drop_duplicates()

Você irá remover as linhas duplicadas de um DataFrame

O segundo.

tipo_de_imovel.drop_duplicates(keep='first', inplace=False)

No segundo, existe a especificação de dois parâmetros:

  • keep: Quando você especificar keep = first, serão removidas todas as duplicatas, exceto a primeira encontrada no DataFrame. Para keep = last, todas as duplicatas serão removidas, exceto a última.
  • inplace: Quando você usa o método drop_duplicates() a máquina te retorna o mesmo DataFrame, só que sem as duplicatas. Se for especificado o parâmetro inplace = True, o DataFrame será original será substituído pelo novo que não tem duplicatas.

O terceiro segue a mesma regra do segundo, só que sem o parâmetro keep

Segue a documentação do método, para você conhecer outros parâmetros, além desses dois que conversamos aqui.

pandas.DataFrame.drop_duplicates()

Abs

Fabio Ricardo Ferreira Correa, mutíssimo obrigado!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software