0
respostas

Dúvida - Ativação PySpark

Olá, Senhores.

Assistindo a aula Spark com Python me surgiu uma dúvida referente à essa aula:

O professor ensinou referente a instalação do spark no colab, assim como a ativação do ngrok e o .config.

Minha dúvida está relacionado a necessidade de instalar o ngrok e também o .config inserindo o endereço e porta.

from pyspark.sql import SparkSession

spark = SparkSession.builder\
     .master('local[*]')\
    .appName("Iniciando com Spark")\
*    .config('spark.ui.port', '4050')\*
    .getOrCreate()

Não ficou claro se isso define se com essa configuração é definido mais clusters com nós e se eu deixar a configuração padrão pode afetar o meu aprendizado:

from pyspark.sql import SparkSession

spark = SparkSession.builder\
     .master('local[*]')\
    .appName("Iniciando com Spark")\
    .getOrCreate()