Olá Brenda.
Como podemos ver na documentação, o que a função get_dummies faz é transformar uma variável categórica em uma representação dela dada por valores.
Por exemplo se fizermos isso no Y_df, que é composto por:
comprou |
---|
sim |
nao |
sim |
sim |
sim |
nao |
Aplicando pd.get_dummies(Y_df) teremos:
Pela coluna comprou não ser de valores categóricos, acabamos tornando um campo que consegue ser representado de maneira simples, uma coluna, em algo mais "complexo", duas colunas.
Recomendo assista a aula 3, onde o instrutor explica e exemplifica a variável categórica.
Mas basicamente o que você tem que se perguntar é, você consegue responder a pergunta da coluna de maneira binaria, 1 e 0.
Por exemplo a coluna comprou, você consegue responder sim ou não, já a coluna curso, você tem as respostas java, C++ e Python, sendo essa ultima uma variável categórica.
Então não faz sentido aplicar o get_dummies no Y_df, se ficou com mais alguma duvida não hesite em perguntar.
Bons Estudos.