Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Valores acima da padronização?

Para reiterar, seria possível usarmos outras funções prontas de escalonamento de dados como a MinMaxScaler(). Mas ao usá-la, os valores acima de padronização constam como infinitos quando fazemos a transformação citada.

Então, quando fazemos a conversão diretamente, os valores permanecem floats, o que simplifica a identificação do que realmente é um outlier e o que não é.

Não sei se entendi bem a que exatamente se refere esses valores acima da padronização. Na minha versão, quando transformo valores fora da faixa de alcance dos meus dados o MinMaxScaler apenas devolve um valor fora do range que escolhi para fazer a transformação. Por exemplo, se reescalei meus dados que tinham um range entre 0 e 50 para ficarem entre 0 e 1, quando transformo um 55 ele vai resultar num valor um pouco maior do que 1, do tipo float do numpy no caso.

1 resposta
solução!

Oii Gean, tudo certinho por aí? Espero que sim!

Desculpa a demora em te dar um retorno por aqui.

Você está correto no apontamento sobre a função MinMaxScaler(), porém este curso foi feito utilizando uma outra versão das bibliotecas Scikit, Pandas e Numpy, o que gera muitas divergências de resultados, assim como ocorreu com você e a instrutora do curso, onde atualmente temos valores fora do range e para ela gerava valores infinitos. Caso tenha curiosidade de acessar as versões anteriores do Scikit, você pode acessar o campo “Other Sessions”, no campo superior esquerdo da documentação.

Você também pode testar com o MinMxScaler(), já que atualmente ele retorna valores apenas fora do range, e toma menos tempo e não é tão trabalhoso de aplicar! Se quiser compartilhar conosco por aqui como ficou, ficamos felizes!

Qualquer outra dúvida, estou por aqui para te auxiliar, ok?

Bons estudos ^^

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!