Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Tabela x DataFrame

Na atividade "Criando Dataframes", foi descrito a importância e a preferência pelo uso do dataframe em relação às tabelas Hive, conforme indicado no texto abaixo:

"[...] são projetados para serem escaláveis e eficientes em termos de memória, o que os torna ideais para trabalhar com grandes conjuntos de dados. Por essas razões, muitas vezes é mais conveniente trabalhar com Dataframes em vez de simplesmente usar SQL."

No último parágrafo, foi solicitado que criássemos um DataFrame chamado"vinhos" com o conteúdo de uma tabela chamada "todos_vinhos" , localizada no banco de dados "base_de_vinhos".

Dessa forma, minha dúvida surge ao final do parágrafo: "Com base no conteúdo apresentado nas aulas anteriores, qual é a forma correta de criar a tabela vinhos?"

O termo correto não seria DataFrame? Visto que estamos criando um DataFrame (com o comando spark.table(‘base_de_vinhos.todos_vinhos’)) a partir de uma tabela Hive?

1 resposta
solução!

Você está correto.