Salve, pessoal!
Para quem quiser uma amostra do código da aula 02.5 para executar no Windows via terminal ou PyCharm, segue o commit abaixo:
fas01 - aula 2: DataFrames com Spark
Em relação às variáveis de ambiente, eu as defini direto no sistema como 'SPARK_HOME' e 'HADOOP_HOME' e também no path como '%SPARK_HOME%/bin' e '%HADOOP_HOME%/bin'.
Versões:
Spark 3.5.1 Hadoop 3.0.0
Versões das demais bibliotecas estão no arquivo requirements.txt na raiz do projeto.
Espero que seja útil!