na aula, o professor disse que é mais indicado usar a função:
df_vendas_reg['ano'] = df_vendas_reg.data_pedido.dt.year
que isso era para facilitar a agregação posterior e que a função groupby complicaria o código.
Contudo, tenho um df aqui em que preciso agrupar os dados em safras (só tenho datas). Eu tenho usado esse script para criar df separados para cada safra:
s = pd.to_datetime(df['data'])
assert str(s.dtype) == 'datetime64[ns]'
df.index = s
safra_22_23 = (df['2022-04-01':'2023-03-31'])
periodo = safra_22_23.data
print(f'A safra de 2022-23 vai de { periodo.min()} até { periodo.max() }.')
mas isso me atrapalha na hora de montar tabelas agrupadas.
alguma ideia de como posso resolver isso?