2
respostas

'SparkSession' object has no attribute 'creatDataFrame'

Boa noite. Ao executar o comando abaixo data = [('Zeca', '35'), ('Eva', '29')] colNames = ['Nome', 'Idade'] df = spark.creatDataFrame(data, colNames) df.show()

Ocorre o seguinte erro AttributeError: 'SparkSession' object has no attribute 'creatDataFrame'

Eu criei o SparkSession conforme o video

from pyspark.sql import SparkSession spark = SparkSession.builder .master('local[*]') .appName("Iniciando com Spark") .config('spark.ui.port', '4050') .getOrCreate()

2 respostas

Olá, isso já aconteceu comigo, tanto rodando via windows local quanto em hambiente hadoop, nos dois casos a solução estava no path do java, confere as instalações do JDK e JDR, ainda mais se for hambiente windows, o melhor que tem é rodar via wsl, vou deixar um link aqui de um artigo que eu li hoje falando sobre como rodar legal o pyspark local. https://medium.com/@jaquelinecella2017/pyspark-usando-jupyter-no-ubuntu-7edcb0cf932f

Julio, o problema é por conta do método que foi digitado na descrição do vídeo, observe que falta um 'e' no 'creatDataFrame', o correto é:

df = spark.createDataFrame(data, colNames)