[Dúvida] uso do nrows

Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)

1
resposta

por Ana Carolina Knupp Gonçalves

| 61.1k xp | 38 posts

existe alguma diferença entre salvar uma variável como dados_primeiras_linhas = pd.read_csv(url,nrows=5) e dados_primeiras_linhas = dados_mercado.head()?

1 resposta

solução!

por Valquíria Alencar

| 185.4k xp | 196 posts

Instrutor

20/06/2024

Oi, Ana! tudo bem?

Quando você usa pd.read_csv(url, nrows=5), você está instruindo a biblioteca Pandas a ler apenas as primeiras 5 linhas do arquivo CSV diretamente do arquivo fonte. Isso é muito útil quando você está lidando com arquivos grandes e deseja economizar memória ou tempo de processamento, pois ele não carrega o arquivo inteiro.

Por outro lado, dados_mercado.head() é usado quando o DataFrame dados_mercado já foi carregado completamente na memória. O método head() simplesmente retorna as primeiras 5 linhas deste DataFrame. Isso não economiza memória inicialmente, pois o conjunto de dados inteiro precisa estar na memória para utilizar esse método.

Se o conjunto de dados já estiver carregado e você só precisa visualizar as primeiras linhas, head() é perfeito.

Espero que isso ajude a esclarecer! Qualquer dúvida, estou aqui!

Bons estudos

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP