Saudações a todos!
Minha dúvida é relativamente simples, mas tem dado a maior dor de cabeça para mim.
tenho um dataset com os seguinte campos:
| Descicao_do_Filme | Diretor | Analise_de_sentimento | Tipo | Com os respectivos valores:
|blá blá blá....................| Fulano | 0.596 | Ação |
imaginando que eu já apliquei técnicas de analise de sentimentos na coluna Analise_de_sentimento
Quero predizer o tipo do filme partindo dos outros campos.
Se eu usar somente o campo descrição é bem fácil:
df_treino = pd.read_csv('treino.csv')
countV = CountVectorizer()
countV.fit_transform(df_treino['statement'].values)
nb_cv = Pipeline([
('NBCV', countV),
('nb_clf', MultinomialNB())])
nb_cv.fit(df_treino['Descicao_do_Filme'],df_treino['Tipo'])
tipo = nb_cv.predict('text')
Ok, agora, como faço para trabalhar com os outros campos do meu dataset? exemplo, fazer uma predição e treinar o meu pipeline recebendo não só a descrição, mas também o resultado da analise de sentimentos e o nome do diretor?
Obrigado!