Bom dia.
Ao realizar a atividade de remover duplicados, percebi que existem funcionários que claramente são pessoas diferentes, mas que possuem o mesmo ID. Fiz a constatação ao verificar as demais colunas tais como departamento, cargo, salário, tempo de casa etc. Um exemplo disso é o funcionário cujo ID é o 2607.
Ao utilizar a função para remover duplicados, 31 valores (linhas) são removidos caso seja selecionada apenas a coluna ID, ao passo que, caso todas as colunas estejam selecionadas, apenas 3 valores (linhas) são removidos, sendo esses idênticos em todas as colunas, tratando-se portanto da mesma pessoa.
Minha dúvida é: não seria mais adequado utilizar todas as colunas para realizar a remoção dos duplicados e não apenas a coluna ID? Com isso seriam removidos aqueles que realmente estivessem duplicados em sua totalidade, garantindo que todos os funcionários estivessem sendo contabilizados. Além disso, dveriam ser atribuídos diferentes ID àqueles que se encontram duplicados, mas que definitivamente são pessoas diferentes.