3
respostas

como eu poderia calcular a média utilizando o comando "groupby" com mais de uma coluna "mês e ano" por exemplo

import pandas as pd

vz= pd.read_csv('vazoes_go.csv', sep=',', encoding='latin-1') vz

media= vz.groupby("mês").mean()["min"] media.head()

3 respostas

Bom dia Hugo,

Se quer calcular a média dos grupos por mês e ano juntos (01/2018; 01/2019; ...) você pode fazer o groupby com as duas colunas em uma lista:

vz.groupby(["mês", "ano"]).mean()["min"]

agradeço a resposta lucas, mas acho que não soube elaborar muito bem a pergunta. Na verdade o que estou querendo fazer é calcular um valor médio para diferentes "cod" em meses que se repetem

cod, dia, mes, ano, max, min, med

essas são as colunas do dataframe, o que gostaria de fazer é uma média de todos os valores de "cod" do mes i do ano i e gerar a media de min, med, e max. Dessa forma eu teria como resultado um dataframe com as medias de min, med, max dos 12 meses do ano para cada ano i variando de 1931 a 2017, as medias dos 12 meses de 1931, 1932 e assim por diante

Ah, então só para confirmar, você já tem atualmente os valores max, min e med por dia, e o que você quer é um novo DataFrame com esses valores por mês?

Tentando resumir, você tem os valores diários e quer os valores mensais, correto?

Se possível compartilha o arquivo vazoes_go.csv, por um link do Google Drive ou por onde der.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software