Eu estou rodando primeiro o listner:
import socket
import tweepy
HOST = 'localhost'
PORT = 9009
s = socket.socket()
s.bind((HOST, PORT))
print(f'aguardando conexão com a porta: {PORT}')
s.listen(5)
connection, address = s.accept()
print(f'recebendo solicitação de {address}')
bearer_token = 'xxx'
keyword = 'Futebol'
class GetTweets(tweepy.StreamingClient):
def on_tweet(self, tweet):
print(tweet.text)
connection.send(tweet.text.encode('utf-8', 'ignore'))
printer = GetTweets(bearer_token)
printer.add_rules(tweepy.StreamRule(keyword))
printer.filter()
connection.close()
E dps de rodar o Listner executo o Client:
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('sparkStreaming').getOrCreate()
lines = spark.readStream\
.format('socket')\
.option('host', 'localhost')\
.option('port', 9009)\
.load()
query = lines.writeStream\
.outputMode('append')\
.format('console')\
.start()
query.awaitTermination()
spark.stop()
Porém quando executo o Client tenho o seguinte erro: O sistema não pode encontrar o caminho especificado.
(Sim eu estou na pasta certa.)
Estou rodando o curso no Windows 10