Olá, estou seguindo a aula 2 e no vídeo sobre bag of words onde é gerado um dataframe a partir de uma matriz esparsa estou tendo um aviso de que o pd.SparseDataFrame será abandonado em favor de outra maneira. Segue o código:
matriz = pd.SparseDataFrame(bag_of_words,
columns=vetorizar.get_feature_names())
/usr/local/lib/python3.6/dist-packages/ipykernel_launcher.py:2: FutureWarning: SparseDataFrame is deprecated and will be removed in a future version.
Use a regular DataFrame whose columns are SparseArrays instead.
See http://pandas.pydata.org/pandas-docs/stable/user_guide/sparse.html#migrating for more.
/usr/local/lib/python3.6/dist-packages/pandas/core/sparse/frame.py:257: FutureWarning: SparseSeries is deprecated and will be removed in a future version.
Use a Series with sparse values instead.
>>> series = pd.Series(pd.SparseArray(...))
See http://pandas.pydata.org/pandas-docs/stable/user_guide/sparse.html#migrating for more.
sparse_index=BlockIndex(N, blocs, blens),
Seguindo o guia indicado no aviso cheguei a esse código que funciona, porém o resultado é diferente do resultado obtido com o pd.SparseDataFrame.
matriznova = pd.DataFrame.sparse.from_spmatrix(bag_of_words, columns=vetorizar.get_feature_names())
Assisti filme ruim um ótimo
0 1 1 0 1 1
1 1 1 1 1 0
Gostaria de saber se vou ter problemas no futuro com a matriz assim.