1
resposta

Método unique() vs. set

Oi, tudo bem?

A diferença do set para o unique é que no caso um vai retorna um conjunto e o outro retorna uma lista com valores únicos, certo?

Fiquei na dúvida de porque ele não usou o unique nas listas.

Obrigadoo!

1 resposta

Oi, Matheus. Eu diria o seguinte: depende. Depende da natureza do dado que você está manipulando. Caso tenha dados numéricos, o pd.unique vai te oferecer uma opção melhor no quesito performance (em tempo de execução). Para strings (dados armazenados como objetos python) essa performance já reduz e o método set já se torna uma opção atraente também.

Se quiser uma explicação com dados mais numéricos e experimentos básicos com resultados expostos graficamente, você pode consultar essa explicação aqui:

https://bbengfort.github.io/2017/05/python-unique-benchmark/

(espero que inglês não seja um problema...)