Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Dúvida - Ativação PySpark

Olá, Senhores.

Assistindo a aula Spark com Python me surgiu uma dúvida referente à essa aula:

O professor ensinou referente a instalação do spark no colab, assim como a ativação do ngrok e o .config.

Minha dúvida está relacionado a necessidade de instalar o ngrok e também o .config inserindo o endereço e porta.

from pyspark.sql import SparkSession

spark = SparkSession.builder\
     .master('local[*]')\
    .appName("Iniciando com Spark")\
*    .config('spark.ui.port', '4050')\*
    .getOrCreate()

Não ficou claro se isso define se com essa configuração é definido mais clusters com nós e se eu deixar a configuração padrão pode afetar o meu aprendizado:

from pyspark.sql import SparkSession

spark = SparkSession.builder\
     .master('local[*]')\
    .appName("Iniciando com Spark")\
    .getOrCreate()
1 resposta
solução!

Ei! Tudo bem, Diego?

O .config('spark.ui.port', '4050') não cria novos clusters nem novos nós. Ele apenas define em qual porta a interface web do Spark (Spark UI) vai rodar. Ou seja, é só uma configuração de acesso à interface gráfica de monitoramento.

Quando você usa:

.master('local[*]')

Isso sim define que o Spark vai rodar localmente, usando todos os núcleos disponíveis da máquina (o * significa “todos os cores”). Isso continua igual com ou sem o .config().

Sobre o ngrok, ele não tem relação com cluster ou processamento. Ele só é necessário no Colab porque o Spark UI roda em localhost, e o Colab está em uma máquina na nuvem. O ngrok cria uma URL pública temporária para você conseguir visualizar essa interface no navegador.

Se você usar apenas:

spark = SparkSession.builder\
    .master('local[*]')\
    .appName("Iniciando com Spark")\
    .getOrCreate()

Seu aprendizado não será afetado. Você só não conseguirá acessar a Spark UI externamente no Colab. Para estudar DataFrames, transformações, ações e lógica de processamento, isso não interfere.

Espero ter ajudado. Continue praticando e qualquer dúvida que surgir, não deixe de compartilhar no fórum.

Até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado