Bom dia.
Tenho um código que estou tentando executar no livy.pyspark em um notebook Zeppelin que possui uma query atribuída a uma variável chamada "sql" que é executada no Hive e atribuída a um Dataframe com o comando.
df = hive.sql(sql)
O SQL tem uma sintaxe com alguns joins simples e condições simples que funcionam no Oracle nativo, do tipo: select * from tabela1 b join tabela2 c on b.id_chave = c.id_chave where exists ( ... ) and not exists ( ... where data ) and not exists ( ... )
mas que aparece a seguinte mensagem de erro quando tento executar: " An error ocurred while calling o115.sql . . Caused by: org.apache.hive.service.cli.HiveSQLException: Error while compiling statement: FAILED: SemanticException [Error 10249]: Line 32:16 Unsupported SubQuery Expression 'data': Only 1 SubQuery expression is supported."
Como posso proceder para que seja aceita mais de 1 subquery ou o que posso estar fazendo de indevido para causar um erro como esse ?