1
resposta

Distribuição a ser utilizada

Em um estudo sobre eventos adversos em um hospital, temos a possibilidade de classificar o atendimento de acordo com dois resultados: houve evento no atendimento e não houve nenhum evento. A quantidade de pacientes é fixa (delimitada pela capacidade do hospital). Daí surgem algumas dúvidas, qual tipo de distribuição escolher para estudar os dados? A média da quantidade de eventos ocorridos nos meses anteriores poderia ser considerada como a probabilidade de um novo evento? Como identificar o tipo de distribuição que os dados seguem utilizando o Python? Até o momento no curso só vi essa classificação ser feita com base nas características do problema, sem considerar o p-value ou outros métodos. Caso seja apresentado num módulo mais a frente a dúvida poderá ser sanada lá.

1 resposta

Olá Cassio,

A distribuição a ser utilizada pelo que eu entendi seria a hipergeométrica (visto que o N seria constante), mas poderia ser também uma binomial. Os meses anteriores poderiam dar uma expectativa do próximo mês, porém dá forma que você relata deveria ser feito uma serie temporal para analisar melhor a estimativa para o próximo mês. Caso seja um modelo de média móvel você poderia utilizar a média dos últimos meses como uma estimativa para o próximo mês. Para saber o tipo de distribuição uma descritiva daria uma ideia, mas a formulação do experimento seria mais importante para definir.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software