Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Criação do Data Frame

Quando copio o código abaixo:

data = [(1, 'Spark é ótimo e NLP com Spark é fácil'), (0, 'Spark MLlib não ajuda muito'), (1, 'O MLlib do Spark ajuda e é fácil')]

colNames =['label', 'texto_limpo'] df = spark.createDataframe(data, colNames)

Recebo a informação de erro : SparkSession' object has no attribute 'createDataframe'

Pesquisei e não consegui resolver. Segui todos os passos do video Podem ajudar por favor? Obrigado

2 respostas
solução!

Olá Luciano, tudo bem?

Deixa eu te fazer algumas perguntas para entender melhor como podemos resolver esse erro.

Você fez a importação da classe SparkSession com o comando:

from pyspark.sql import SparkSession

Além disso, você abriu a sessão e verificou se ela ainda esta aberta?

spark = SparkSession.builder \
    .master('local[*]') \
    .appName("analise_nlp") \
    .getOrCreate()

outra coisa que dá para verificar é a versão do seu spark, rodando print(spark.version).

Aguardo retorno : )

Olá Ana. Tudo bem? Desculpe por não ter respondido. Sim, eu segui os passos acima e o problema era justamente na sessão que não estava aberta. Obrigado pelo retorno.