1
resposta

Coluna de texto

E se no meu csv, eu tivesse uma coluna que ela é um modelo, mas em vez de números como é na aula, ele fosse texto, como eu poderia trabalhar com esses dados em forma de texto? Em outro curso, ele usou o get_dummies do panda, porém, o get_dummies, ele transforma apenas em 0 e 1 e ele cria varias colunas dependendo dos valores daquele texto, e pelo menos nessa aula foi mostrado que era 1 coluna só, mas com valores numericos Existe alguma forma de eu fazer o mesmo? Ou alguma ferramenta especifica ou algum classificador que posso estudar?

1 resposta

Eduardo,

Se compreendi bem seu questionamento para gerar dados aleatórios é números é realmente mais fácil (um simples random como foi demonstrado na aula). Já para texto você teria que trabalhar com alguma coisa um pouco mais robusta como Cadeias de Markov ou Word Embeddings. Pesquise por exemplo sobre article spinner na internet. Ressalvas a parte, seria uma forma inicial bem interessante para gerar variações dos textos originais.

Abs!