Mas e se a maioria das pessoas que compraram na verdade são de São Paulo?
Isso não tornaria esse cálculo que resultou em ~5% não só inútil como prejudicial?
Existe algum caso no qual calcular as coisas dessa maneira é útil?
Mas e se a maioria das pessoas que compraram na verdade são de São Paulo?
Isso não tornaria esse cálculo que resultou em ~5% não só inútil como prejudicial?
Existe algum caso no qual calcular as coisas dessa maneira é útil?
Olá Samir, tudo bem ?
Desculpa pela demora no retorno.
Um ponto de atenção é que já que estamos calculando probabilidades se tivermos dados bem distribuídos balanceados para todas características não vamos conseguir concluir nada.
Mas sua observação é bem válida e em outros contextos onde tivermos mais características do problema e estivermos usando outros tipos de classificadores, será importante ter dados bem balanceados.
Espero ter ajudado, mas qualquer dúvida não hesite em perguntar.