Eu fiz uma média de valores para cada UF:
# A renda está concentrada em quais estados?
# Fazendo uma series;
media_renda_por_uf = dados.groupby('UF')['Renda'].mean().sort_values()
media_renda_por_uf
dados
é o DataFrame diretamente do csv da atividade. Devolveu:
UF
MA 1019.432009
PI 1074.550784
SE 1109.111111
AL 1144.552602
CE 1255.403692
PB 1293.370487
RN 1344.721480
PA 1399.076871
BA 1429.645094
AM 1445.130100
AC 1506.091782
PE 1527.079319
TO 1771.094946
RR 1783.588889
RO 1789.761223
AP 1861.353516
GO 1994.580794
ES 2026.383852
MG 2070.515707
MS 2262.604167
RS 2315.158336
SC 2470.854945
PR 2493.870753
RJ 2496.403168
SP 2638.104986
DF 4241.954722
Name: Renda, dtype: float64
Porém, estou com muita dificuldade em usar essa Series para fazer o histograma com seus valores. Como posso fazer? Resultou errado quando:
renda_por_uf = sns.displot(data = media_renda_por_uf,
x = media_renda_por_uf.keys(),
y = media_renda_por_uf,
kind='hist').figure.set_size_inches(10,8)
renda_por_uf
O gráfico ficou todo errado. Quero uma coluna única para cada UF, mas há cinco colunas aglomeradas por algum motivo estranho.
Por enquanto, consegui criar esse gráfico, mas ainda não é o que eu desejo, pois não exibe uma média:
renda_por_uf = sns.displot(data = dados,
x = dados.UF.sort_values(),
y = dados.Renda,
color = 'r',
kind='hist').figure.set_size_inches(10,8)
renda_por_uf