1
resposta

Sessão criada localmente em máquina pessoal

Fala pessoal, tudo bem? Espero que sim!

Estou acompanhando o curso e optei por fazer tudo na minha máquina a fim de me colocar em um ambiente mais parecido com o dia a dia dos desenvolvedores da empresa em que trabalho.

Tive um problema com essa abordagem.

Fiz a instalação de todos os pré requisitos, porém estou com uma dúvida na criação da Sessão do Spark.

Estou usando o WSL com o Ubuntu e aparentemente consegui criar uma sessão como mostra abaixo, pelo próprio spark-shell. (como evidenciam todas as imagens abaixo)

Imagem do shell spark com uma sessão inicializada.Insira aqui a descrição dessa imagem para ajudar na acessibilidadeInsira aqui a descrição dessa imagem para ajudar na acessibilidadeMeu problema é o seguinte:

Sempre que tento rodar o meu script no VSCode com a criação do dataframe, parece que o spark está tentando criar uma nova sessão e não utiliza a sessão já criada. Insira aqui a descrição dessa imagem para ajudar na acessibilidadeInsira aqui a descrição dessa imagem para ajudar na acessibilidadeNeste print acima mostra a sessão que está criada na porta 4040 e quando eu rodo o meu script com a criação do dataframe, ele abre mais uma conexão na 4041.

No fim do dia, o código funciona, só que estou incomodado com o fato de que a sessão que está rodando não esta sendo utilizada. Existe alguma forma de conseguir utilizar a sessão ativa lá pelo spark-shell?

Obrigado.

1 resposta

Oii, Anderson! Tudo joia?

Na documentação nos diz que quando o Spark tenta vincular o serviço na portaria 4040, que a probabilidade de ter outro serviço em execução nela, ele tentará vincular em outra porta de forma sequencial. Por exemplo: porta 4041, 4042, 4043. E isso foi retornado como aviso para você.

O que se pode fazer para usar a sessão ativa que deseja, é utilizar o seguinte comando:

spark-shell --conf spark.ui.port=4041

Você pode alterar a port=4041 conforme a portaria que desejar.

Além disso, recomendo também você testar no primeiro momento os passos pelo Google Colab ou pelo Jupyter, para evitar algumas adversidades complexas e, após praticar bastante, replicar os ensinamentos de outras formas para evoluir nos estudos.

Espero ter ajudado. Continue se dedicando estudos e qualquer dúvida, compartilhe no fórum.

Bons estudos, Anderson!