1
resposta

Observando relações entre variáveis

import pandas as pd
import matplotlib.pyplot as plt

url = 'https://raw.githubusercontent.com/Gabriellemga/Praticando_Python/refs/heads/main/Praticando_gr%C3%A1ficos_composi%C3%A7%C3%A3o_relacionamentos/dados/atividade_7.csv'
df = pd.read_csv(url)
df.head()

plt.figure(figsize=(10, 6))  
plt.scatter(df['Distância (km)'], df['Tempo de Entrega (h)'], color='#4a90e2') 

plt.title('Relação entre Distância (km) e Tempo de Entrega (h)', fontsize=16, loc='left')  
plt.xlabel('Distância (km)', fontsize=12)  
plt.ylabel('Tempo de Entrega (h)', fontsize=12) 
plt.grid(True, alpha=0.4)  


plt.tight_layout() 
plt.show()

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Olá, Márcia! Como vai?

Muito bem! Continue resolvendo os desafios e compartilhando com a comunidade Alura.

Observei que você explorou o uso do gráfico de dispersão (scatter) para ilustrar a relação entre variáveis contínuas, utilizou muito bem o parâmetro color para personalizar a visualização dos pontos e ainda compreendeu a importância do uso do grid para facilitar a leitura dos valores no gráfico.

Uma dica interessante para o futuro é usar a regressão linear com seaborn para adicionar uma linha de tendência que facilite a interpretação da relação entre os dados. Dessa forma:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

url='https://raw.githubusercontent.com/Gabriellemga/Praticando_Python/refs/heads/main/Praticando_gr%C3%A1ficos_composi%C3%A7%C3%A3o_relacionamentos/dados/atividade_7.csv'
df=pd.read_csv(url)
df.head()

plt.figure(figsize=(10, 6))  
plt.scatter(df['Distância (km)'], df['Tempo de Entrega (h)'], color='#4a90e2') 

# Adicionando linha de tendência
sns.regplot(data=df, x='Distância (km)', y='Tempo de Entrega (h)', scatter_kws={'color': '#4a90e2'}, line_kws={'color': 'red'})

plt.title('Relação entre Distância (km) e Tempo de Entrega (h)', fontsize=16, loc='left')  
plt.ylabel('Tempo de Entrega (h)', fontsize=12) 
plt.xlabel('Distância (km)', fontsize=12)  
plt.grid(True, alpha=0.4)  
plt.tight_layout() 

plt.show()

Resultado:

Gráfico de dispersão ilustrando a relação entre distância (km) e tempo de entrega (h), com uma linha de regressão ajustada e intervalo de confiança.

Isso faz com que seja possível visualizar melhor uma tendência linear nos dados, o que pode ser muito útil para análises preditivas.

Ícone de sugestão Para saber mais:

Sugestão de conteúdo para você mergulhar ainda mais sobre o tema:

Alguns materiais estão em inglês, mas é possível compreendê-los usando o recurso de tradução de páginas do próprio navegador.

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

AluraConte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!