Esse . limit é do Sparck? Digo, se eu for consultar o que eu posso passar nele, procuro nos argumentos do Spark?
Esse . limit é do Sparck? Digo, se eu for consultar o que eu posso passar nele, procuro nos argumentos do Spark?
Olá, tudo bom?
O método limit()
é um comando do Spark SQL, que te permite fazer consultas de dados utilizando comandos do padrão SQL, de onde também vem o comando LIMIT
, que apresenta os primeiros N resultados, para um N inteiro escolhido ao digitar o comando.
Por exemplo, no PySpark, o método limit(50)
realiza uma consulta e retorna um novo Dataset contendo as 50 primeiras linhas. E na documentação do Spark só existe apenas esse parâmetro que é referente a essa quantidade de linhas.
Se ainda tiver alguma dúvida, estou por aqui. Ótimos estudos e grande abraço!
Olá! como eu faço para retornar os dados completos? assim como no .show(50, False) tem o False para mostrar a informação completa, no limit eu usaria qual? porque no meio das colunas vem os '...'