import pandas as pd
dados = pd.read_csv('/content/dataset.csv', sep=';')
dados.head()
dados.shape
dados.describe().round(2)
dados.corr().round(4)
import pandas as pd
dados = pd.read_csv('/content/dataset.csv', sep=';')
dados.head()
dados.shape
dados.describe().round(2)
dados.corr().round(4)
Oi, Thamiris! Como vai?
Agradeço por compartilhar seu código com a comunidade Alura.
Gostei de ver que você já está aplicando métodos do pandas para explorar os dados, como head()
, shape
, describe()
e corr()
. Esses passos são importantes para ter uma visão geral do dataset antes de avançar para a modelagem da regressão linear.
Uma dica interessante para o futuro é usar o método sample()
para visualizar algumas linhas aleatórias do seu dataset, o que pode ajudar a identificar inconsistências ou valores inesperados:
import pandas as pd
dados = pd.read_csv('/content/dataset.csv', sep=';')
print(dados.sample(5))
O código acima mostra 5 linhas aleatórias do dataset, permitindo conferir rapidamente se os dados estão coerentes.
Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!