Oii, Matheus! Tudo bem?
Como sugestão para reparar ambos erros de ModuleNotFoundError
, vamos instalar o pyspark
e findspark
no notebook. Segue os passos:
!pip install findspark
!pip install pyspark
Rode as células e aguarde.
import findspark
findspark.init()
from pyspark.sql import SparkSession
E observe se funciona como esperado.
Espero que dê certo e qualquer dúvida, estaremos por aqui.
Bons estuidos!