1
resposta

parece que ta bem desatualizado.

os dados parecem que estão bem desatualizado. dificilmente um comando roda sem algum erro...

ta grave.

é uma boa pra procurar soluções mas atrasa o andamento demais desse jeito.

1 resposta

Oi Paulo,

Pelo seu relato você deve estar tentando rodar o projeto localmente e com as atualizações mais recentes dos pacotes pode estar gerando alguns erros.

Dê preferência por rodar o projeto no Colab. A partir das novas versões para rodar o projeto basta apenas instalar o pyspark e seguir o curso. Não precisa configurar variáveis de ambiente, instalar e usar o findspark, baixar Spark etc.

Basta apenas rodar o seguinte código e seguir com o restante do curso:

!pip install pyspark

from pyspark.sql import SparkSession
spark = SparkSession.builder.master('local[*]').getOrCreate()

Lembrando que este procedimento funciona no Colab e eu aconselho que você use o Colab nos seus estudos.

Espero ter ajudado e bons estudos