1
resposta

Erro em criar um dataframe usando TfidfVectorizer

Olá, eu estou fazendo as aulas de NLP no visual studio porém quando eu quero converter a matriz num dataframe usando TfidfVectorizer está reportando esse erro:


AttributeError Traceback (most recent call last) Cell In[65], line 6 3 tfidf = TfidfVectorizer(lowercase=False, max_features=50) 4 matriz = tfidf.fit_transform(frases) ----> 6 df = pd.DataFrame(matriz.toDense(), columns=tfidf.get_feature_names_out())

AttributeError: 'csr_matrix' object has no attribute 'toDense'

1 resposta

Olá, Kelvin, tudo bem?

Notei que você inseriu o método como toDense(). O método correto para converter uma matriz esparsa (csr_matrix) para uma matriz densa é todense() (com 'm' minúsculo), não toDense().

Abaixo deixo o código utilizado pela instrutora:

from sklearn.feature_extraction.text import TfidfVectorizer


frases = ['Comprei um ótimo produto', 'Comprei um produto péssimo']

tfidf = TfidfVectorizer(lowercase=False, max_features=50)
matriz = tfidf.fit_transform(frases)
pd.DataFrame(matriz.todense(),
             columns=tfidf.get_feature_names_out())

Espero ter ajudado.

Qualquer dúvida, não hesite em compartilhar no fórum.

Abraços!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado