Oi, Laura!
Tudo bem?
Pode utilizar o SLO sim, estas siglas estão relacionadas a valores de acordo de nível de serviço.
SLA é um acordo de nível de serviço que consta na ISO 27001, que basicamente consiste em uma definição de nível de serviço com um cliente que deve ser cumprida, caso não seja penalidades devem ocorrer ao seu não cumprimento, normalmente financeiras, por exemplo, meu SLA de disponibilidade consiste em manter a latência de resposta da minha aplicação abaixo de 100ms para 99% das requisições. SLA envolve muito a área de negócios e o cliente final.
SLO é um acordo de nível de serviço executado internamente, entre a equipe que desenvolve o sistema, engenheiros de confiabilidade e operações de infraestrutura, ele visa manter o serviço em um nível de serviço que mesmo que não seja cumprido, não agrida ao SLA deifnido entre a área de negócios e o cliente final, desta maneira nosso SLO costuma ser mais agressivo que o SLA, como por exemplo, latência de resposta abaixo de 100ms para 99.9% das requisições, essa definião de serviço é mensurada por indicadores (métricas) como as que você esta configurando com o "management.metrics.distribution.slo.http".
SLI são os indicadores de níveis de serviço que serão avaliados em tempo de execução e alimentarão os buckets da sua métrica "management.metrics.distribution.slo.http". eles são nossos dados para medição de que estamos ou não dentro do cumrpimento do nosso SLO e consequentemente mantendo nosso SLA.
Um ponto importante é definir o Error Budget, que é o que sobra da subtração de 100% - valor do SLO, e basicamente ele serve como porcentagem de falhas sem gerar impactos para o cliente final, por não deteriorar SLO e SLA, mas essa é uma conversa para deixarmos em um tópico especifico sobre SRE, se quiser saber mais, aconselho que leia este conteúdo:
Service Level Objectives - Google SRE Book
Espero que esse conteúdo possa agregar a sua jornada, abraços e bons estudos!