1
resposta

[Dúvida] Surtando com a planilha

Turma, alguém consegue me trazer uma lanterna nessas trevas?

Trabalho na secretaria de meio ambiente do ES e quero otimizar a análise de dados de qualide do ar do estado. Porém, ela vem nesse formato onde há uma medição a cada trinta minutos em todas as estações. Estas estão na linha 2, mesclada, com as linhas abaixo agrupadas de acordo com a temática (qualidade do ar, controle operacional etc).

O que me interessa são os dados coletados, mas precisava, de alguma forma, criar uma nova tabela, ou mesmo só um dataframe (ou qualquer outra solução) que eu pudesse analisar os parâmetros, diferenciando as estações, mas também considerando a coluna ao lado dos valores de parâmetros (coluna flag), pois ela, a depender da informação, diz se o dado é inválido.

Alguma alma boa, um anjo que possa me salvar?

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Oii, Renan! Tudo bem?

Agradeço por aguardar uma resposta.

Que interessante o seu objetivo, analisar a qualidade do ar! Como sugestão, tente usar a transformação e limpeza de dados para normalizar a tabela, desagrupando as linhas mescladas e reorganizando as colunas para que cada estação esteja em uma coluna separada ou dentro de uma categoria, você pode usar o Pandas, por exemplo. Para combinar os valores dos parâmetros com suas flags e marcar dados inválidos, você pode usar técnicas de limpeza de dados, como merge ou join. E na estruturação no formato tidy para facilitar a análise teste usar funções como melt() no Pandas.

Espero que as sugestões sejam um bom ponto de partida.

Bons estudos e até mais!