1
resposta

Agrupar Categorias automaticamente

Bom dia. Muito legal a aula sobre tratamento de texto.

Uma curiosidade, no caso do exercicio com os dados da Ilus, percebi que o motivo de saida gera 15 linhas, fazendo um pareto percebi que alguns dos motivos poderiam ser agrupados.

Existiria forma de, utilizando a função case, agrupar automaticamente aquelas categorias que representam digamos, 5% das ocorrencias, sob a categoria "Outros" ou "Miscelanea"?

Sei como fazer no grafico, mas pensei em fazer dinamicamente, caso novos dados sejam adicionados e mude o cenario.

Obrigado

1 resposta

Oii, Pablo! Como você está?

É interessante a ideia é usar a função CASE. Para isso, você precisaria de uma nova coluna que conte a frequência de cada motivo de saída. Essa coluna poderia ser criada com a função COUNT e agrupada por MotivoSaida. Depois, você poderia usar a função CASE para verificar a frequência de cada motivo de saída e, se a frequência for menor que 5%, agrupá-la em "Outros". E como sugestão, você pode usar a função PERCENTILE_CONT para calcular o percentil 95% da frequência de cada motivo de saída. Isso te dará um ponto de corte para definir quais motivos de saída serão agrupados em "Outros".

O seu raciocínio está no caminho certo. Para te ajudar a estruturar a sua ideia, deixo alguns links que podem ser úteis para estudar:

Pablo, como são sugestões iniciais, não esqueça de estudar bastante e realizar testes na sua aplicação para ver o que melhor se encaixará. E continue assim, explorando as funcionalidades para se desenvolver.

Bons estudos, Pablo!