2
respostas

[Bug] Erro ao salvar

Ao rodar o código sugerido ao final da aula, apresenta o seguinte erro:

Carregando o arquivo data_by_year.csv utilizando o Spark

df_data_year = spark.read.format('csv') \
.option("inferSchema", 'True') \
.option("header", 'True') \
.option("sep", ',') \
.load("dbfs:/FileStore/dados/data_by_year.csv")

Convertendo o DataFrame do Spark para um DataFrame do Pandas

df_data_year = df_data_year.toPandas()

Convertendo as colunas selecionadas do DataFrame de string para float

df_data_year[['acousticness', 'danceability', 'duration_ms', 'energy', 'instrumentalness', 'liveness', 'loudness', 'speechiness', 'tempo', 'valence', 'popularity']] = df_data_year[['acousticness', 'danceability', 'duration_ms', 'energy', 'instrumentalness', 'liveness', 'loudness', 'speechiness', 'tempo', 'valence', 'popularity']].astype(float)

Salvando o DataFrame em formato Parquet no diretório especificado

path = "dbfs:/FileStore/dados_tratados/data_year.parquet"
df_data_year.to_parquet(path)

Insira aqui a descrição dessa imagem para ajudar na acessibilidadeo diretório existe, pois tenho o arquivo anterior salvo lá:

Insira aqui a descrição dessa imagem para ajudar na acessibilidadePoderiam ajudar?

2 respostas

Olá, Carlos! Tudo bem?

O erro OSError: Cannot save file into a non-existent directory indica que o diretório especificado para salvar o arquivo Parquet não existe ou não está acessível no momento da execução do código.

Uma possível solução para esse problema seria garantir que o diretório onde você deseja salvar o arquivo realmente existe e que você tem as permissões necessárias para escrever nele.

Se o diretório já existir e o erro persistir, verifique se o caminho especificado está correto.

Espero ter ajudado e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.

Olá, conforme a imagem do post anterior, o diretório já existe e o caminho está correto.