Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

[Dúvida] .limit()

Esse . limit é do Sparck? Digo, se eu for consultar o que eu posso passar nele, procuro nos argumentos do Spark?

2 respostas
solução!

Olá, tudo bom?

O método limit() é um comando do Spark SQL, que te permite fazer consultas de dados utilizando comandos do padrão SQL, de onde também vem o comando LIMIT, que apresenta os primeiros N resultados, para um N inteiro escolhido ao digitar o comando.

Por exemplo, no PySpark, o método limit(50) realiza uma consulta e retorna um novo Dataset contendo as 50 primeiras linhas. E na documentação do Spark só existe apenas esse parâmetro que é referente a essa quantidade de linhas.

Se ainda tiver alguma dúvida, estou por aqui. Ótimos estudos e grande abraço!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Olá! como eu faço para retornar os dados completos? assim como no .show(50, False) tem o False para mostrar a informação completa, no limit eu usaria qual? porque no meio das colunas vem os '...'

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software