Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Função is.na (dúvida na contagem de dados faltantes)

Entendi que "sum(is.na(dados))" retorna a quantidade de células vazias no data frame, que retornou 39 campos vazios. Mas qd fizemos o filtro com "dados[linhas_invalidas, ]", conforme imagem, temos 39 campos com NA e 7 campos vazios. Print da tabela contendo as linhas inválidas

Para contar os campos vazios teríamos que utilizar outra função?

1 resposta
solução!

Oii, Daniela! Tudo bom?

Quando se aplica o filtro dados[linhas_invalidas, ], é selecionado linhas inteiras que contêm pelo menos um valor NA. Isso significa que uma linha pode ter várias células com NA, mas ainda assim será contada como uma única linha com dados faltantes.

Para contar quantas linhas têm pelo menos um NA, use sum(linhas_invalidas), que lhe dará o número de linhas com dados faltantes:

Captura de tela mostrando o código sum(linhas_invalidas) retorno 10 executado em uma linha do google colab Para contar as strings vazias use sum(dados == "", na.rm = TRUE):

Captura de tela mostrando o código sum(dados == "", na.rm = TRUE) retorno 7 executado em uma linha do google colab

E para contar ambos (zeros e NA), pode combinar as condições, sum(is.na(dados)) + sum(dados == 0, na.rm = TRUE) + sum(dados == "", na.rm = TRUE):

Captura de tela mostrando o código sum(is.na(dados)) + sum(dados == 0, na.rm = TRUE) + sum(dados == "", na.rm = TRUE) retorno 4200 executado em uma linha do google colab

Deixo aqui o notebook usado para teste, está com o título Teste Dani.

Espero ter sanado a sua dúvida, conte sempre com a gente aqui no fórum.

Bons estudos, Daniela!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!