Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

2
respostas

por Carlos Alberto Felix Fonseca Junior

| 245.8k xp | 27 posts

Ao rodar o código sugerido ao final da aula, apresenta o seguinte erro:

Carregando o arquivo data_by_year.csv utilizando o Spark

df_data_year = spark.read.format('csv') \
.option("inferSchema", 'True') \
.option("header", 'True') \
.option("sep", ',') \
.load("dbfs:/FileStore/dados/data_by_year.csv")

Convertendo o DataFrame do Spark para um DataFrame do Pandas

df_data_year = df_data_year.toPandas()

Convertendo as colunas selecionadas do DataFrame de string para float

df_data_year[['acousticness', 'danceability', 'duration_ms', 'energy', 'instrumentalness', 'liveness', 'loudness', 'speechiness', 'tempo', 'valence', 'popularity']] = df_data_year[['acousticness', 'danceability', 'duration_ms', 'energy', 'instrumentalness', 'liveness', 'loudness', 'speechiness', 'tempo', 'valence', 'popularity']].astype(float)

Salvando o DataFrame em formato Parquet no diretório especificado

path = "dbfs:/FileStore/dados_tratados/data_year.parquet"
df_data_year.to_parquet(path)

Insira aqui a descrição dessa imagem para ajudar na acessibilidade o diretório existe, pois tenho o arquivo anterior salvo lá:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade Poderiam ajudar?

2 respostas

por Armano Barros Alves Junior

| 5926.1k xp | 12517 posts

Alura Scuba Team Analista de Suporte Educacional II

26/03/2024

Olá, Carlos! Tudo bem?

O erro OSError: Cannot save file into a non-existent directory indica que o diretório especificado para salvar o arquivo Parquet não existe ou não está acessível no momento da execução do código.

Uma possível solução para esse problema seria garantir que o diretório onde você deseja salvar o arquivo realmente existe e que você tem as permissões necessárias para escrever nele.

Se o diretório já existir e o erro persistir, verifique se o caminho especificado está correto.

Espero ter ajudado e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.

por Carlos Alberto Felix Fonseca Junior

| 245.8k xp | 27 posts

26/03/2024

Olá, conforme a imagem do post anterior, o diretório já existe e o caminho está correto.

Importante

[Bug] Erro ao salvar

Carregando o arquivo data_by_year.csv utilizando o Spark

Convertendo o DataFrame do Spark para um DataFrame do Pandas

Convertendo as colunas selecionadas do DataFrame de string para float

Salvando o DataFrame em formato Parquet no diretório especificado

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Carregando o arquivo data_by_year.csv utilizando o Spark

Convertendo o DataFrame do Spark para um DataFrame do Pandas

Convertendo as colunas selecionadas do DataFrame de string para float

Salvando o DataFrame em formato Parquet no diretório especificado

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP