Olá, Gabriel! Tudo bem com você?
O que estamos tentando obter ao realizar a redução de dimensionalidade é obter uma melhor representação nos dados, que facilite o aprendizado de máquina, que não demore muito para fazer o treinamento com o dataset escolhido e que perca o mínimo de informações possível.
Quando plotamos os gráficos dessas reduções de dimensionalidade, como por exemplo TSNE ou PCA (existem outros algoritmos para reduzir dimensionalidade), estamos querendo observar como estão a separação dos nossos dados após as transformações, pois quanto mais separados eles estiverem melhor para nosso algoritmo de aprendizagem.
Então quando o instrutor fala que podemos traçar essa reta, o que ele está dizendo é que com essa redução as características ficaram tão bem espaçadas que podemos traçar uma fronteira de decisão entre uma e outra através de uma linha. Essa mesma análise se aplica aos outros gráficos, quanto mais separado é o resultado, mais adequado é o algoritmo que gerou tal resultado.
Como curiosidade deixo como recomendação de leitura esse artigo (em inglês) que explica um pouco mais sobre Decision Boundary (fronteira de decisão). Nesse outro artigo (em inglês) você encontrará outros exemplos de algoritmos para realizar a redução de dimensionalidade.
Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.
:)
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!