1
resposta

O que fazer quando não observamos alguns dados?

Serie interessante substituir pela média? ou realizar algum tipo de análise e aplicar uma média móvel dependendo do intervalo?

1 resposta

Olá David, tudo bem? Espero que sim!

Quando temos dados faltantes na base de dados, podemos realizar diferentes tipos de tratamento dependendo do caso. Os mais comuns são:

  • Remover os registros que possuem dados faltantes
  • Substituir por algum valor de medida central como mediana, moda ou média
  • Substituir por algum valor fixo, como valor 0
  • Encontrar o valor através de operações entre colunas, por exemplo se há dados faltando em uma coluna idade, mas temos uma coluna com a data de nascimento, e uma coluna com a data da coleta dos dados, podemos fazer a operação de subtração e obter os dados faltantes da coluna idade

No caso de uma série temporal, com valores acumulativos por exemplo, podemos substituir os dados faltantes pelo valor da data anterior ou posterior por exemplo ou pelo valor médio entre a data anterior e posterior. Isso faz com que a série temporal tenha uma continuidade.

Mas não há uma resposta correta para essa pergunta. Tudo irá depender do seu conjunto de dados e do seu objetivo. Lembre que se remover os registros nulos, e a quantidade de registros nulos for muito grande na sua base de dados, você perderá informação de outras colunas. O ideal é remover registros quando eles não forem muito numerosos e não influenciarão muito caso forem retirados.

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!