1
resposta

Dado X binário

Olá! tenho uma dúvida quanto ao uso do StandardScaler.

Suponhamos que meu X (features) possua os seguintes dados: "quilometragem_do_veiculo", "ano_do_veiculo" e "situação_do_documento" e o Y seja "vendido". Sei que "quilometragem_do_veiculo" e "ano_do_veiculo" são valores com range diferentes e devemos aplicar o StandardScaler, mas "situação_do_documento" é uma informação binária ('em dia':1 e 'pendente':0), nesse caso devo aplicar também o StandardScaler na coluna "situação_do_documento" que contém a sequência [1,0,1,1,1,0,0...]?

1 resposta

Olá Letícia tudo certinho??

""situação_do_documento" é uma informação binária ('em dia':1 e 'pendente':0), nesse caso devo aplicar também o StandardScaler na coluna "situação_do_documento" que contém a sequência [1,0,1,1,1,0,0...]?"

Neste caso não é indicado a utilização do StandardScaler, pois, além de ser uma informação binária, ou seja, sim ou não. Não existe a necessidade de padronização dos dados, que é o real motivo de se utilizar o StarndardScaler.

Deixarei aqui um post que contém a explicação mais aprofundada:

https://cursos.alura.com.br/forum/topico-como-que-o-standardscale-e-capaz-de-definir-o-genero-do-filme-mais-predominante-106612

Espero ter te ajudado e caso sua dúvida persista, só retornar aqui =)