Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Sobre SparseDataFrame

Olá, estou seguindo a aula 2 e no vídeo sobre bag of words onde é gerado um dataframe a partir de uma matriz esparsa estou tendo um aviso de que o pd.SparseDataFrame será abandonado em favor de outra maneira. Segue o código:

matriz = pd.SparseDataFrame(bag_of_words,
                     columns=vetorizar.get_feature_names())
/usr/local/lib/python3.6/dist-packages/ipykernel_launcher.py:2: FutureWarning: SparseDataFrame is deprecated and will be removed in a future version.
Use a regular DataFrame whose columns are SparseArrays instead.

See http://pandas.pydata.org/pandas-docs/stable/user_guide/sparse.html#migrating for more.


/usr/local/lib/python3.6/dist-packages/pandas/core/sparse/frame.py:257: FutureWarning: SparseSeries is deprecated and will be removed in a future version.
Use a Series with sparse values instead.

    >>> series = pd.Series(pd.SparseArray(...))

See http://pandas.pydata.org/pandas-docs/stable/user_guide/sparse.html#migrating for more.

  sparse_index=BlockIndex(N, blocs, blens),

Seguindo o guia indicado no aviso cheguei a esse código que funciona, porém o resultado é diferente do resultado obtido com o pd.SparseDataFrame.

matriznova = pd.DataFrame.sparse.from_spmatrix(bag_of_words, columns=vetorizar.get_feature_names())

    Assisti       filme       ruim          um     ótimo
0          1        1        0        1        1
1          1        1        1        1        0

Gostaria de saber se vou ter problemas no futuro com a matriz assim.

1 resposta
solução!

Olá Anderson, tudo bem?

Temos um para saber mais na mesma aula mostrando o que deve ser usado agora.

Segue o link:

https://cursos.alura.com.br/course/introducao-a-nlp-com-analise-de-sentimento/task/65087