Olá, Ceilton, tudo bem?
No primeiro exemplo, você está criando um gráfico de linha simples com os dados de imigração do Brasil para o Canadá. Onde, você especifica explicitamente tanto os valores do eixo x (dados_brasil['ano']
) quanto os valores do eixo y (dados_brasil['imigrantes']
):
plt.plot(dados_brasil['ano'], dados_brasil['imigrantes'])
No segundo exemplo, a ideia é comparar os dados de imigração de dois países (Brasil e Argentina) em um único gráfico, por isso usamos duas vezes o plt.plot
. A diferença aqui é que o DataFrame df_comparacao
está estruturado de forma diferente, onde os anos são usados como índices. Isso significa que os valores do eixo x (anos) são implicitamente considerados como o índice do DataFrame, e os valores do eixo y são as colunas correspondentes aos países. É como se tivéssemos feito:
plt.plot(df_comparacao.index, df_comparacao['Brasil'], label='Brasil')
plt.plot(df_comparacao.index, df_comparacao['Argentina'], label='Argentina')
Onde, df_comparacao.index
fornece os anos (eixo x) e df_comparacao['Brasil']
e df_comparacao['Argentina']
fornecem os valores de imigração (eixo y) para cada país. A função label
é usada para adicionar uma legenda ao gráfico, que ajuda a identificar qual linha corresponde a qual país.
Ocultar o eixo de forma implícita quando o índice é usado no matplotlib pode ser conveniente e uma das vantagens é que se você sabe que seu índice será sempre o eixo x, isso pode simplificar a visualização de múltiplas séries de dados. Na programação temos várias formas de fazer algum resultado, então, sinta-se à vontade para usar a forma que funcionar melhor para você. Particularmente, uso em meus códigos uma regrinha de que explícito é melhor que implícito, mas, isso depende do gosto da pessoa desenvolvedora.
Quando você faz a transposição do DataFrame com df_comparacao.T
, ele troca linhas por colunas, e o nome do índice acaba sendo País
, que é o nome do índice que foi definido anteriormente. Caso queira mudar, basta fazer:
df_comparacao_coluna_anos = df_comparacao.reset_index() # Move o índice para as colunas
df_comparacao_coluna_anos.columns = ['Anos', 'Brasil', 'Argentina']
df_comparacao_coluna_anos.head()
Espero ter ajudado.
Qualquer dúvida, compartilhe no fórum.
Abraços e bons estudos!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!