1
resposta

Consolidando o seu conhecimento

import pandas as pd
dados = pd.read_csv('/content/dataset.csv', sep=';')
dados.head()
dados.shape
dados.describe().round(2)
dados.corr().round(4)
1 resposta

Oi, Thamiris! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

Gostei de ver que você já está aplicando métodos do pandas para explorar os dados, como head(), shape, describe() e corr(). Esses passos são importantes para ter uma visão geral do dataset antes de avançar para a modelagem da regressão linear.

Uma dica interessante para o futuro é usar o método sample() para visualizar algumas linhas aleatórias do seu dataset, o que pode ajudar a identificar inconsistências ou valores inesperados:


import pandas as pd

dados = pd.read_csv('/content/dataset.csv', sep=';')
print(dados.sample(5))

O código acima mostra 5 linhas aleatórias do dataset, permitindo conferir rapidamente se os dados estão coerentes.

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!