Fala Alexandre, tudo bom??
O processamento de voz do Alexa é feito pelo AVS (Alexa Voice Service), o AVS converte o que foi gravado para comandos que ele interpreta, é mais do que um simples serviço voz-texto, é um serviço totalmente programável que consegue trabalhar com outros serviços online e realizar um range enorme de coisas.
Na verdade, o IFTTT é uma plataforma online que permite que você controle dispositivos "smart" e aplicativos de maneira mais inteligente. Então, o IFTTT essencialmente funciona criando uma plataforma online que, efetivamente traduz mensagens entre dispositivos fazendo com que uma ação, gere outra ação (IFTTT - If this then that), sem a necessidade de se preocupar com todo o código que faz com que isso seja possível.
Espero ter ajudado Alexandre!
Abraços!!