Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)
1
resposta

Resposta

Todas as respostas estão no meu notebook: https://colab.research.google.com/drive/1D3yiKEuwdtA-gzqHQL_wiCpW9j_nPLMq?usp=sharing

No desafio 3:

linhas, colunas = df.shape
print(f"Linhas: {linhas}")
print(f"Colunas: {colunas}")

Desafio extra:

print(df.describe())
1 resposta
solução!

Olá, Maria. Como vai?

Parabéns por concluir o desafio e compartilhar o link do seu notebook no Google Colab! Deixar o código aberto para a comunidade avaliar é uma excelente prática e ajuda muito no networking com outros estudantes de Data Science.

O método que você utilizou para descobrir o tamanho do DataFrame é super direto e eficiente. Vamos dar uma olhada em como os comandos funcionam e trazer algumas dicas de boas práticas que vão valorizar ainda mais o seu código.

Desafio 3: O uso do .shape

O atributo .shape do Pandas é uma das ferramentas mais rápidas e limpas para checar as dimensões de uma base de dados. Como ele retorna uma tupla (uma estrutura do Python que guarda valores ordenados), a sua lógica de desempacotar essa tupla diretamente nas variáveis linhas e colunas ficou excelente!

linhas, colunas = df.shape
print(f"Linhas: {linhas}")
print(f"Colunas: {colunas}")

Desafio Extra: O método .describe()

O .describe() é uma verdadeira "mão na roda" na fase de Análise Exploratória de Dados (EDA). Ele traz de forma instantânea um resumo estatístico das colunas numéricas da base, incluindo:

  • count: Quantidade de valores não nulos.
  • mean: A média dos valores.
  • std: O desvio padrão (o quanto os dados se afastam da média).
  • min e max: Os valores mínimo e máximo.
  • 25%, 50% (Mediana) e 75%: Os quartis dos dados.

Dicas de Boas Práticas para o seu Notebook

Como você está compartilhando seus notebooks, existem duas dicas de visualização no Pandas que deixam a apresentação dos dados muito mais elegante:

  1. Evite usar print() para exibir tabelas no Colab: Quando usamos print(df.describe()), o Pandas exibe o resultado como texto puro (com fonte monoespaçada). Se você escrever apenas df.describe() na última linha da célula (sem o print), o Google Colab vai renderizar uma tabela HTML interativa e muito mais bonita visualmente.
  2. Utilize o método .info() para complementar: Enquanto o .describe() mostra estatísticas dos números, o método df.info() é ótimo para rodar logo em seguida, pois ele exibe o tipo de dado de cada coluna (se é texto, número inteiro, float) e se existem valores nulos que precisam de tratamento.

Seu projeto está no caminho certo! Continue praticando e explorando novas bases de dados.

Espero que possa ter lhe ajudado!