existe alguma diferença entre salvar uma variável como dados_primeiras_linhas = pd.read_csv(url,nrows=5)
e dados_primeiras_linhas = dados_mercado.head()
?
existe alguma diferença entre salvar uma variável como dados_primeiras_linhas = pd.read_csv(url,nrows=5)
e dados_primeiras_linhas = dados_mercado.head()
?
Oi, Ana! tudo bem?
Quando você usa pd.read_csv(url, nrows=5)
, você está instruindo a biblioteca Pandas a ler apenas as primeiras 5 linhas do arquivo CSV diretamente do arquivo fonte. Isso é muito útil quando você está lidando com arquivos grandes e deseja economizar memória ou tempo de processamento, pois ele não carrega o arquivo inteiro.
Por outro lado, dados_mercado.head()
é usado quando o DataFrame dados_mercado
já foi carregado completamente na memória. O método head()
simplesmente retorna as primeiras 5 linhas deste DataFrame. Isso não economiza memória inicialmente, pois o conjunto de dados inteiro precisa estar na memória para utilizar esse método.
Se o conjunto de dados já estiver carregado e você só precisa visualizar as primeiras linhas, head()
é perfeito.
Espero que isso ajude a esclarecer! Qualquer dúvida, estou aqui!
Bons estudos