Tem um tópico marcado como resolvido, contudo a resposta me gerou mais duvida do que esclarecimentos...
Segue abaixo trecho da documentação:
"This data is used to produce recommendations, and the rest of the data is compared against estimated preference values ..."
Aqui fala que o resto do que foi usado para trainingData para produzir recomendações sera usado para comparar, ou seja aqueles 0,1 %...