os dados parecem que estão bem desatualizado. dificilmente um comando roda sem algum erro...
ta grave.
é uma boa pra procurar soluções mas atrasa o andamento demais desse jeito.
os dados parecem que estão bem desatualizado. dificilmente um comando roda sem algum erro...
ta grave.
é uma boa pra procurar soluções mas atrasa o andamento demais desse jeito.
Oi Paulo,
Pelo seu relato você deve estar tentando rodar o projeto localmente e com as atualizações mais recentes dos pacotes pode estar gerando alguns erros.
Dê preferência por rodar o projeto no Colab. A partir das novas versões para rodar o projeto basta apenas instalar o pyspark e seguir o curso. Não precisa configurar variáveis de ambiente, instalar e usar o findspark, baixar Spark etc.
Basta apenas rodar o seguinte código e seguir com o restante do curso:
!pip install pyspark
from pyspark.sql import SparkSession
spark = SparkSession.builder.master('local[*]').getOrCreate()
Lembrando que este procedimento funciona no Colab e eu aconselho que você use o Colab nos seus estudos.
Espero ter ajudado e bons estudos