Boa noite!
Nas primeiras aulas do curso de modelos de classificação foi falado que, após a aplicação do modelo de regressão logística e execução das previsões, o próprio algoritmo retornaria duas colunas chamadas "rawPrediction" e "probability". De acordo com o que eu consegui absorver das explicações, a coluna rawPrediction representaria a previsão numérica obtida diretamente do ajuste dos dados (regressão linear), enquanto a coluna probability seria uma representação desses mesmos valores após terem passado por uma função de ativação sigmoide (que, por fim, determinaria o resultado da previsão: 0 ou 1).
Até aqui tudo certo! A minha dúvida é a seguinte: porque essas duas colunas contém uma lista de tamanho 2 com 2 valores distintos? Em minha concepção, deveríamos ter um único número para cada linha dessas colunas... Alguém sabe me dizer o que esses dois números significam?