1
resposta

Erro no código

Se você rodar o código com o script citado na aula o número de colunas cai para 31. Entretanto o número correto deveria ser 27. O total de colunas a serem excluídas são 22 duas, pois contemplam a regra de valor único.

for coluna in df.columns:
    print(coluna + ':' + str(**df[coluna].nunique**())) 
    if df[coluna].nunique() == 1:
        coluna_na.append(coluna)

Quando usei o nunique ao invés do unique + len funcionou.

1 resposta

Olá Gilberto, tudo bem? Espero que sim!

Você tem razão Gilberto, ao utilizar o código da atividade, as 4 colunas:

  • bounces
  • newVisits
  • campaignCode
  • isTrueDirect

Possuem apenas um único valor e o valor 'NaN', dessa forma são contados como 2, mas continua sendo irrelevante para análise. A função nunique() não conta esses valores 'NaN', o que faz com que a contagem de elementos únicos seja melhor para esse caso.

Foi alterada a atividade, com o código utilizando nunique().

Bons estudos!