1
resposta

Dados categóricos com mais de 2 opções

Olá Guilherme, Fiquei na dúvida para os casos em temos dados categóricos com mais de 2 opções. Por exemplo, imagine que a resposta possa retornar sim, não, talvez; ou nos casos de escalas do tipo Likert com 5 opções. O procedimento é atribuir uma valor para cada opção, ou seja, sim = 1, não=2 e talvez=3? Obrigado.

1 resposta

Olá Felipe, tudo bem?

Vamos supor que você tenha os dados uma tabela com os dados que você falou.

Sim, Não e talvez.

Você pode utilizar o get_dummies, veja o exemplo abaixo:

import pandas as pd

uri = "https://gist.githubusercontent.com/guilhermesilveira/4d1d4a16ccbf6ea4e0a64a38a24ec884/raw/afd05cb0c796d18f3f5a6537053ded308ba94bf7/car-prices.csv"
data = pd.read_csv(uri)
data.head()

pd.get_dummies(data)

Ele cria novas colunas com os valores em 0 ou 1