[Bug] erro ao salvar arquivo pandas no databricks

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

por ANDRE RICARDO DE MORAES SOUZA

| 66.1k xp | 1 posts

ao tentar salvar o dataframe pandas em formato parquet no databricks, está apresentando erro.

path = "dbfs:/FileStore/dados_tratados/data_year.parquet" df_data_year.to_parquet(path)

OSError: Cannot save file into a non-existent directory: 'dbfs:/FileStore/dados_tratados'

o mais próximo que encontrei foi o processo de conversão para o formato pandas. ao inves de usar o comando conforme sugestão:

# Convertendo o DataFrame do Spark para um DataFrame do Pandas
df_data_year = df_data_year.toPandas()

usei a api: pandas_api()

df_data_year = df_data_year.pandas_api()

desta forma consegui avançar.

Seria esta a solução?

1 resposta

por Rodrigo Fernando Dias

| 125.4k xp | 214 posts

Instrutor

08/09/2023

Oi Andre,

O erro reportado pelo sistema é de que não foi possível salvar o arquivo em um diretório não existente ('dbfs:/FileStore/dados_tratados'). Verifique se o diretório dados_tratados realmente foi criado.

Aguardo seu retorno.

Espero ter ajudado e bons estudos.

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP