Olá Boa tarde. Tenho uma dúvida sobre como carregar os arquivos localmente para quem está realizando o curso com jupyter através de uma IDE (Visual Studio). Baixei e extrai os arquivos para pastas no mesmo local onde o arquivo jupyter esta, mas quando faço o código:
path = './empresas/*'
empresas = spark.read.csv(path, sep= ';', inferSchema=True)
o Spark não consegue realizar a junção dos arquivos, fica executando pra sempre (15min e contando).. mas não consegue finalizar e fazer a junção.
(OBS: fazer a leitura dos arquivos CSV individualmente ele executa numa boa, mas a concatenação é que não está fazendo)
OBS2: ja tentei usar path = '/content/drive/MyDrive/curso-spark/empresas/*.csv'
mas também não funcionou, roda eternamente mas não realiza a leitura de todos os arquivos.
Alguem poderia me ajudar com isso?
Desde já Agradeço.