Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

pd.get_dummies

Nesse caso em que a variável "comprou' foi categórica com "sim" ou "não", percebemos que não foi utilizado a transformação em binário para ela (eixo y) com "get_dummies" isso ocorreu pelo fato de "comprou" ser a variável dependente?

Xdummies_df = pd.get_dummies(X_df)

Ydummies_df = Y_df

1 resposta
solução!

Olá Brenda.

Como podemos ver na documentação, o que a função get_dummies faz é transformar uma variável categórica em uma representação dela dada por valores.

Por exemplo se fizermos isso no Y_df, que é composto por:

comprou
sim
nao
sim
sim
sim
nao

Aplicando pd.get_dummies(Y_df) teremos:

simnao
10
01
10
10
10
01

Pela coluna comprou não ser de valores categóricos, acabamos tornando um campo que consegue ser representado de maneira simples, uma coluna, em algo mais "complexo", duas colunas.

Recomendo assista a aula 3, onde o instrutor explica e exemplifica a variável categórica.

Mas basicamente o que você tem que se perguntar é, você consegue responder a pergunta da coluna de maneira binaria, 1 e 0.

Por exemplo a coluna comprou, você consegue responder sim ou não, já a coluna curso, você tem as respostas java, C++ e Python, sendo essa ultima uma variável categórica.

Então não faz sentido aplicar o get_dummies no Y_df, se ficou com mais alguma duvida não hesite em perguntar.

Bons Estudos.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software