import pandas as pd
dados = pd.read_csv('/content/dataset.csv', sep=';')
dados.head()
dados.shape
dados.describe().round(2)
dados.corr().round(4)
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
import pandas as pd
dados = pd.read_csv('/content/dataset.csv', sep=';')
dados.head()
dados.shape
dados.describe().round(2)
dados.corr().round(4)
Oi, Thamiris! Como vai?
Agradeço por compartilhar seu código com a comunidade Alura.
Gostei de ver que você já está aplicando métodos do pandas para explorar os dados, como head(), shape, describe() e corr(). Esses passos são importantes para ter uma visão geral do dataset antes de avançar para a modelagem da regressão linear.
Uma dica interessante para o futuro é usar o método sample() para visualizar algumas linhas aleatórias do seu dataset, o que pode ajudar a identificar inconsistências ou valores inesperados:
import pandas as pd
dados = pd.read_csv('/content/dataset.csv', sep=';')
print(dados.sample(5))
O código acima mostra 5 linhas aleatórias do dataset, permitindo conferir rapidamente se os dados estão coerentes.
Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!