Eu estou tendo dificuldades em encontrar na documentação da API(spark) as funções e syntax para implentar em meus exercícios.
Eu gostaria de implementar no coluna de data na saida do banco o seguinte formato yyyyMM (2022-06). como faço?
Tentei desta forma:
estabelecimentos\
.select('nome_fantasia', 'nome_da_cidade_no_exterior',\
f.year('data_de_inicio_atividade').alias('ano_mes_do_inicio_das_atividades'), f.month('data_de_inicio_atividade').alias('ano_mes_do_inicio_das_atividades'))\
.show(5, False)
Saida:
+-----------------+--------------------------+--------------------------------+--------------------------------+
|nome_fantasia |nome_da_cidade_no_exterior|ano_mes_do_inicio_das_atividades|ano_mes_do_inicio_das_atividades|
+-----------------+--------------------------+--------------------------------+--------------------------------+
|PIRAMIDE M. C. |null |1994 |5 |
|null |null |1994 |5 |
|null |null |1994 |5 |
|null |null |1994 |5 |
|EMBROIDERY & GIFT|null |1995 |5 |
+-----------------+--------------------------+--------------------------------+--------------------------------+
only showing top 5 rows